快捷版通过锁定原文档中的标题来确定文档中论文的大致结构,并依据结构提取内容。进一步的对提取的内容进行排版。
- 原文档不能是空白文档
空白文档中不能提取任何内容,没有排版的意义。
2. 原文档中需要包含各章节标题
一般来说,一篇论文包含 “摘要”,“引言”,“参考文献”,“正文章节”等内容,如果原文档中没有任何论文组件标题或章节标题(或章节标题没有序号),则无法确定论文结构,也无法进一步的依据结构对论文进行排版。
建议您核对以下几点:
1. 机器通过各级标题锁定论文结构
你需要为你所写的内容指定对应的标题,才能被正确识别到。(标题需要独占一行)
锁定论文结构是第一步。你的论文中通常会包含 “摘要”,"关键词",“引言/绪论”,"参考文献",“正文章节” 等内容。例如,机器需要知道哪些内容是你写的摘要,就会去你的文档中找到 “摘要” 两个字,然后锁定摘要内容的位置。
2. 正文内容的标题层次要清晰
你仅需要保证正文章节是层次分明的,意味着你写的章节标题需要提供章节序号。否则机器无法猜透你的心思。实验证明,机器识别效率最高的标题层次 是 “1 一级标题”,“1.1 二级标题”,“1.1.1 三级标题” 这种模式。按照以下的标题层次是能够被机器正确识别的。
标题模式 | 第一层级标题 | 第二层级标题 | 第三层级标题 | 第四层级标题 |
---|---|---|---|---|
模式A | 1 XXX | 1.1 XXX | 1.1.1 XXX | 1.1.1.1 XXX |
模式B | 一、XXXXX | (一) XXX | 1. XXX | (1) XXX |
模式C | 第1章 XXXXXX | 1.1 XXX | 1.1.1 XXX | 1.1.1.1 XXX |
模式D | 第1章 XXX | 第1节 XXX | 1.1.1 XXX | 1.1.1.1 XXX |
模式E | 第一章 XXX | 1.1 XXX | 1.1.1 XXX | 1.1.1.1 XXX |
模式F | 第一章 XXX | 第一节 XXX | 1.1.1 XXX | 1.1.1.1 XXX |
- 请保持章节的标题总是独占一个段落,不要和该章节的内容合并到一个段落内。
- 标题序号与标题内容要分隔开,无论用空格还是用标点符号空格。想想如果机器犯傻,把 “6个核桃” 排版成 “第六章 个核桃”,所以在标题序号与内容未分隔的情况下,这段文字将不会被看作标题。
3. 去除原文档中手写的目录
排版后会根据文中的各级标题自动生成目录。原文档中的目录对排版是没有意义的,并且会干扰机器识别。由于机器是基于标题识别论文结构的,假设源文档中包含目录条目 “致谢….1”,则此条目可能被误识别为致谢的标题。