文学电子文献制作与使用 操作笔记
目录
- 姓名编码
- 论文排版
- 书签制作
- PDF/A 双图层文档制作
- 第三次大作业 —— 《全清词·雍乾卷》目录提取
笔记说明:!!!本笔记完全供自己和同学使用!!!请勿过分转载!!!
建议全看完一遍之后,再开始动手做
姓名编码
以下步骤以 2021春期末考试题第一题 为例讲解
对于操作基础好的普通同学,全过程大概在30-40min左右
对于不能熟练掌握技巧的同学,全过程大概在1h以上
所以在实际考试中,基础不好的同学如果掌握的题量不多,且这道题掌握比较熟练,可以考虑优先做
对于基础好的同学,可以跟掌握的熟练程度和题目设置的分数高低考虑做题顺序
- 先将Excel表格中的姓名那一列,粘贴到事先准备好的空记事本中
- 将记事本中的姓名再粘贴到事先准备好的空word文档中 (不建议省略这步)
- 准备制作在每个字之间插入空格的宏:
光标放在文档所有字的最前方,鼠标选择 [视图] - 宏 - 录制宏
将宏指定到 - 键盘 - 点击“请按新快捷键”下方的栏,准备设置你想要的快捷键
(快捷键 推荐使用 Ctrl + Shift + Alt + 任意字母) 然后点击左下角 “指定”,再点击关闭
!!!注意这时候已经开始录制宏了,不要随便动你的鼠标和键盘 - 开始录制宏1(插入1次空格):
此时光标放在文档所有字的最前方,按一下键盘的右箭头,按一下空格
鼠标点击 宏 - 停止录制,结束宏1的录制 - 开始录制宏2(插入10次):
准备阶段与3相同,需要设置与之前不同的快捷键
开始录制:按10次宏1的快捷键 (按的过程中记得有耐心,等操作停止了再按下一次)
结束录制 - 接下来依次录制宏3(插入100次),宏4(插入1000次),宏5(插入10000次)直到所有的字之间都插入了空格(时间比较漫长,请耐心等待,下方列有在等待时做的事)
- 光标放在文档所有字的最前方,Ctrl + H 打开 “查找与替换”,查找内容框输入一个空格,替换为
^t
(英文状态下按 Shift+主键盘数字6),点击全部替换,替换完成后把整个文档复制到空记事本中。
(在记事本文档最前方的字前面按一个Tab键,确保所有姓名的格式一样,方便一会儿进一步处理)
- 在等待自动化宏运行完成的阶段可以做的事:
简单处理Excel表格:
(1)在姓名列左边插入一列空列(右键姓名那列,点击 “插入”),如图:
(2)在前两个名字前编号1,2,鼠标选中两个编号格,如图:
(3)鼠标点击选中区绿色框线的右下角的实心小正方形,向下拖动,Excel会自动补齐下方的编号,一直拖到最后一个名字处即可。
(4)在最后一个名字下方填入编号10001,10002,再次拖动相同数量个编号出来,再重复上述操作一次,生成20001,20002系列。交界处如图:
- 将记事本中的整个文档复制到Excel表格的姓名列的右一列(第C列),有多余的空列删除即可,结果如图:
依据题意,三字以上姓名用前3字汉语拼音的首字母为其编码,所以删除上图中第F列
- 对于某些超长的名字,需要提前留足空列,并做分列处理 (数据 - 分列 - 固定宽度 - 进行手动分字) (第N列的函数为
=len(B2)
,求B2处的字符串长度)
- 将名字的最后一个字,覆盖在第三个字上,结果如下(也可以使用Excel自带的字符串处理函数,详见 此链接 或者 自行搜索)
- 剪贴第D列的字 粘贴到第C列,10001编号处,剪贴第E列的字 粘贴到第C列,20001编号处,结果如图:(第1行(姓名,编码)已被我删除)
- 对第C列进行扩展选定区域的升序排序,得到下图结果:
- 手动将 首拼音为A的汉字 全部改为 字母A,以此类推,重复步骤20次左右,即可得到下图:
- 对第A列的编号进行扩展选定区域的升序排序,回归初始位置;将原先被剪切到编号10001-编号20002的字符剪切回第D列,编号20002至结尾的剪切回第E列,得到如下图结果:
- 对第E列进行排序,找到姓名中没有第三个字的位置,如下图,由题意全部覆盖成字符 V
- 在对 第A列 排序回归原位,将 第C、D、E列 复制到空记事本中,再将记事本中的文档复制到空word文档中,利用查找替换删去所有制表符
^t
。 - 再利用记事本为中介,将文档复制到Excel表格中,删去第一列编号,得到最终结果,如下图:
论文排版
- 用word打开记事本txt文件,使用默认字符形式打开,另存为docx文件
- 纸张大小用“信纸”(Letter);上、下、左、右页边距各 2cm;页眉页脚距边界均为 1.25cm
- 所有文字统一用 Times New Roman 字体;论文正文一律用五号字,对齐网格;图、表、页眉、页脚、目录、脚注、尾注、致谢的文字(不含目录、致谢部分的标题)一律用小五号字,不对齐网格
一些排版要求
- 论文总题目居中
- 本论文共有二级标题,除 Contents 之外,两级标题应全部做成 Word 标题,能在 Word 导航窗格中显示并可用于定位。将 Word 版的论文存为 PDF 版本时,要设置成将 Word 标题制成 PDF 文档的书签,使之也能用于定位。
(注意不要将一个标题前后的空行也做成标题,即导航窗格中不能存在空行)
书签制作
- 进行合理的页码编排(要求:页码“代序”部分用大写罗马数字,“代序”之前的全部页面归为一部,用大写拉丁字母;目录用小写罗马数字;正文及以后用阿拉伯数字),编完后将文档改名为“Book.pdf”
- 从“Book.pdf”中提取目录部分的页面,存为“目录.pdf”文档
- 在 ABBYY 中画出识别 “目录.pdf” 中的标题文字和对应页码的识别区域,更改区域类型为“文本”
- 在 工具 - 选项 - 文档 - 文档语言 处,将语言修改为 简体中文;英文;
- 读取区域的文本,在右侧显示
- 进行校对,而后将文档另存为Finereader格式的“目录”文档(实际上为一个文件夹)
- 将 “目录” 中校对好的文字拷到Word中,将其编辑为制作书签需要的格式,然后将文档存为“目录.docx”
- 用FreePic2Pdf提取“Book.pdf”的书签
- 【未完成的笔记 —— 待续】
PDF/A 双图层文档制作
在Acrobat pro中打开pdf文档,选择“文档 - 提取页面 - 填写待提取页码范围 ”,得到待提取页面,保存。
用ABBYY软件打开提取后的页面(不要用ABBYY打开整本pdf文档,加载时间会过长),选取图像的标题、正文区域(包含正文下方的注释,不包含页眉、页码,区域边界紧靠边界)
在 工具 - 选项 - 文档 - 文档语言 - 编辑语言 处,将语言修改为 简体中文;英文;
鼠标右键点击绿色选定区域(文字区域),选择读取页面,稍等片刻,在右侧显示读取后的文字修改右侧文字区的 错别字、中英标点符号、字体(字号、斜体)、角标注解序号等 (逐个字符修改,不要在意右侧文字区的排版问题,其中包含ABBYY软件设置的定位换行符,和空格符相差无几),修改后将此单页另存为PDF/A文件,在 Acrobat pro 中打开文件,Ctrl+A 检查文字层和图像层的贴合情况。
正文下方注解的排版一般偏差较大,可以通过插入若干空格符调整。将全部页面修改完成,将整个文档另存为PDF文件、PDF/A文件、FineReader文件,检查无误后,即完成任务
第三次大作业 —— 《全清词·雍乾卷》目录提取
- 在 工具 - 选项 - 文档 - 文档语言 - 编辑语言 处,将语言修改为 繁体中文
- 利用 Acrobat pro 从书籍中提取出待处理的页,另存为pdf文件(需要提交)
用 ABBYY 打开该pdf文件,选取图像的词牌名部分(包含词牌名的页码,不包含边目录及其页码);
鼠标右键点击绿色选定区域(文字区域),选择读取页面,右侧显示读取后的文字,保存为FineReader文件(需要提交)。
- 根据老师提供的词牌名Excel文件修改右侧文字区的错别字(要求繁体字与图像一致),保存为另一个FineReader文件(需要提交的“###-###姓名A”)
可以进行适当的排版,利于提取成比较成型的文本文档 - 用Word打开文本文档,排好版,制作成要求的表格即可。
文学电子文献制作与使用 操作笔记相关推荐
- 文献管理与信息分析笔记——科研入门及十大信息源
目录 1. 信息源简介 2. 十大信息源 2.1 图书 2.2 期刊 2.3 会议文献 2.4 学位论文 2.5 标准 2.6 专利 2.7 科技报告 2.8 政府出版物 2.9 产品资料 2.10 ...
- 基于相关系数的影像匹配_论文推送 | 基于最优匹配算法的像控点电子点之记制作研究...
基于最优匹配算法的像控点电子点之记制作研究 张 武 吕军超 何高波 王安妮 王亮亮 (中煤航测遥感集团有限公司 陕西西安 710199) 摘 要:随着计算机技术和测量技术的发展,传统 ...
- 电子书籍制作工具软件大全
电子书籍制作工具软件大全 随著网路的出现和电子出版物的飞速发展,制作各类电子读物的工具软件也层出不穷.如今,每个人都可以非常简单.迅速且廉价地将自己的作品.资料制作成电子书籍在网上进行传播.古人云:工 ...
- 炫彩LED电子时钟制作记录
炫彩LED电子时钟制作笔记 以前也做过2.3寸数码管的电子时钟,但是显示颜色是固定的红色或蓝色.最近因为PCB厂家打样大放血,10*10以内5片只要5元还包邮,网上流出雪花灯,灯珠用的是那种单总线内置 ...
- 如何利用XGen制作头发,发片-笔记
如何利用XGen制作头发,发片-笔记 思维导图式笔记: 1.简单认识Xgen的几个命令.和属性 >> 快捷命令: >> 刷新当前导向生成的预览发 ...
- 【Zotero高效知识管理】(4)Zotero的文献管理、阅读及笔记知识管理
[Zotero高效知识管理]专栏其他文章 Zotero文献管理软件的系统性教程,包括安装.全面的配置.基于众多插件的文献导入.管理.引用.笔记方法 [Zotero高效知识管理](1)Zotero介绍 ...
- 用计算机处理信息小报,文本信息处理-电子小报制作.doc
文本信息处理-电子小报制作 全国中小学"教学中的互联网搜索"优秀教学案例评选 教案设计 信息<文本信息加工--电子小报制作> 教案背景 1,面向学生: □中学 2,学科 ...
- 关于计算机应用的板报,“计算机应用基础”电子板报制作教学设计
"计算机应用基础"电子板报制作教学设计 蔡岚岚 [期刊名称]<微计算机信息> [年(卷),期]2018(000)024 [摘要]电子板报教学设计依据"计算机应 ...
- UE4蓝图制作三维弹球学习笔记(二)
UE4蓝图制作三维弹球学习笔记(二) 1.BP_Fliper Viewport 使用Static Mesh导入Fliper. Construction 使用同一个蓝图表示左右不同的Fliper.在蓝图 ...
最新文章
- 【深度学习】深入浅出神经网络框架的模型元件(常用层和卷积层)
- ORACLE中的包和包体
- 【正一专栏】从“欣欣像蓉”谈网络暴力
- ds证据理论python实现_ALI模型理论以及Python实现
- C++之namespace和::使用总结
- 学习了解online hard example mining在线难例挖掘
- java rsa enc 源码_RSA加解密源码 | 学步园
- redis数据类型-列表(List)
- html 复制文本 点击复制按钮
- ubuntu硬盘装机_配置系统总结
- matlab中几种取整函数的用法(fix, floor, ceil, round)
- (最完美)MIUI12系统的Usb调试模式在哪里开启的步骤
- golang连接FTP服务器并下载
- org.jboss.netty.util.internal.jzlib.ZStream scanned from multiple locations: jar:
- SQLite3在IOS中的用法
- OpenCV——Python:像素调整、图片裁剪、形状与文字设置3
- C# 索引器(Indexer) this关键字的作用
- 鼠标移动事件(鼠标移动到主菜单上显示子菜单)
- matlab polyfit c语言,算法——纯C语言最小二乘法曲线拟合
- Python you-get 库的使用方法
热门文章
- vb.net 教程 5-12 绘图实例之统计图 2 折线图
- VVC中CIIP、OBMC和LMCS工具的协同
- 人生苦短,我如何变懒,怎么用Python给宝宝起个好名字
- linux写一个最简单的操作系统,自己动手编写一个简单的操作系统
- 史上最详细的网站优化系列(一)mysql优化1
- 基于SSM的在线考试系统
- jsp实现在线考试系统
- 拒绝访问/ 客户端没有所需的特权at java.io.WinNTFileSystem.createFileExclusively(Native Method) ,createTempFile
- Eclipse debug 断点调试教程
- 小米手机动态修改网络类型信息