asciidoc转换html,Word文档到Asciidoc转换
原文
Word文档的内容,需要背转换为Asciidoc。以下是我发现最有效的步骤:
1. 将Word文档保存为HTML
2. 编码为UTF-8
3. 使用pandoc将HTML转换为AsciiDoc
4. 使用Sublime Text 2搜索和替换(使用一些正则表达式)去除疯狂的东西
5. 使用Sublime Text 2执行任何剩余的格式
将Word文档保存为HTML
在Word中打开文档,然后另存为网页。保存时选择“仅保存显示信息到HTML”选项。从Word退出。
编码为UTF-8
在Sublime Text 2中打开html文件。重新打开UTF-8编码并保存文件:
Sublime Text 2重新打开编码
如果不重新编码为UTF-8,则下一步将失败并显示错误:
pandoc:无法解码字节’\ x6f’:Data.Text.Encoding.decodeUtf8:无效的UTF-8流
使用Pandoc将HTML转换为AsciiDoc
运行Pandoc。例如,以下命令将AsciiDoc文件file.asc转换为ConventionSheet.htm:
pandoc -f html -t asciidoc -o file.asc ConventionSheet.htm
使用Sublime Text 2搜索和替换(使用一些正则表达式)去除疯狂的东西
奇怪的单引号需要去:
Sublime Text 2用单引号替换反引号,如果在Word中进行了审核,则审阅者的评论和更改可能会出现在HTML中。使用搜索删除这些,并在搜索字段中替换以下正则表达式:
\[line-through\]\*(.+)\*
当匹配行交叉线断裂时,可以使用?s正则表达式中的单行选项()进行搜索和替换:
(?s)\[line-through\]\*.(.*?)\*
使用Sublime Text 2执行任何剩余的AsciiDoc格式
在文档中等间隔任何正则表达式或其他特殊字符(这些将导致AsciiDoc解析器的问题)。
根据需要编辑AsciiDoc文档!请注意,GitHub现在本地显示AsciiDoc文件(在幕后使用AsciiDoctor),就像Markdown一样。
asciidoc转换html,Word文档到Asciidoc转换相关推荐
- html格式图片可以转换成word文档,html网页转换成word文档,转换成功,并且可以保存图片,但是总是为web版式的格式,怎么改成“页面”格式,多谢...
当前位置:我的异常网» C# » html网页转换成word文档,转换成功,并且可以保存图 html网页转换成word文档,转换成功,并且可以保存图片,但是总是为"web版式"的格 ...
- 格式怎样把ppt转换成word文档
无论是ppt文档还是word文档,都是我们办公中要经常用到的,虽然作为传送文件的格式ppt不如word方便,但作为演讲格式ppt绝对数第一,所以我们有时需要将word与ppt进行相互转换,今天先说说如 ...
- 扫描PDF转换成word文档如何操作
扫描PDF文件转换成word文档如何进行操作呢?作为一般的PDF文件介于它的文件大小都不够大,普通的转换功能都能进行操作,文件过大的话就需要用到扫描PDF转word这种操作,那么关于它的操作是怎样的呢 ...
- 用 Python 将微信热文转换成Word文档 | 神级操作
不得不说微信公众号已经成为了一个开放平台,每天数以万计的微信公众号文章在这产生,我们关注一个微信公众号每天便可以看到新的文章,我们同时也不知不觉的将好的文章分享到给朋友. 那么如何保存一个好的文章呢? ...
- html怎么在图片上加文字_怎么把图片文字转换成word文档
我们在和别人交流的时候,有时候为了方便对方查看和理解,我们会使用文字图片进行交流,这是一种非常方便交流的形式.那如果我们想要将图片里的文字转换成Word文档应该怎么操作? 如果我们想要将图片识别为Wo ...
- 如何使用ABBYY FineReader 12将JPEG文件转换成Word文档
日常工作中处理JPEG格式的图像文件时,有时需要转换成Word文档进行编辑,市场上应用而生了很多转换工具,相信不少人听说过OCR(光学字符识别)软件,可以用来转换图像文件,而在OCR软件中, ABBY ...
- bin文件怎么转换成文本文档_怎么把pdf文件转换成word文档?这样转很简单
在日常的学习.工作生活中,小伙伴们总少不了要对文件格式进行转换操作,例如把pdf文件转换成word文档.对于职场老手来说,这当然不算一个难度操作,甚至还很简单.但对于职场新人而言,找不对方法,可能操作 ...
- html 转word c#,c#操作word类,进行html和word文档的互相转换
#region 把Word文档装化为Html文件 /** ///把Word文档装化为Html文件/// /// 要转换的Word文档 public static void WordToHtml( st ...
- caj格式的文件如何转换成Word文档?
很多人可能都会很少用得到caj文件,当拿到这样一个caj文件的时候我们可能需要将caj文件转换成Word文档的形式,下面就让小编给大家简单介绍一下. 步骤一:我们可以通过在浏览器上搜索迅捷PDF在线转 ...
最新文章
- 程序员吐槽职场戏精:凌晨三点半发周报,太装了!
- Web 安全开发规范手册 V1.0
- [转载]创建数据库与完成数据添删改查--第一种写法
- IBM 2nm芯片弯道超车了?他连车都没有
- Day8_误差反向传播
- Python花式编程案例锦集(3)
- 操作系统-高响应比优先调度算法
- HUSTOJ教程(1)——安装部署
- MATLAB2022a/Simulink + STM32F407 Discovery Kit教程1
- Sdut PTA练习 2021级-JAVA01 Java入门
- 如何用ChemDraw实现3D建模
- 《NVMe-over-Fabrics-1_0a-2018.07.23-Ratified》阅读笔记(3)-- 命令
- 一种经典的客户关系管理系统(CRM)订单模型的设计与实现
- Auto.js加密解密|快照Snapshot解密|Dex转js|Auto.js庖丁下载|解除APP限制
- 用手机对电脑进行远程关机
- FCKEDITOR编辑器的使用
- 记2019北航计算机夏令营体验~
- Java阿凯_Java-7 面向对象(上)
- 传智播客武汉校区校长焦宁波:我和传智播客的那些事儿
- Human Body 身体部位名称
热门文章
- 罗丹明PEG活性酯 RB-PEG-NHS,罗丹明聚乙二醇活性酯,Rhodamine-PEG-NHS
- linux禁止普通用户切换,扣丁学堂Linux培训简述Linux禁止普通用户切换至root用户的实例...
- 电离层穿刺点坐标计算
- 浅析Java开发中的Model1和Model2
- html 换行字体,div字体换行
- 读书笔记-增量学习-LwF_Learning without Forgetting
- SolidWorks2020报错:solidworks无法获得下列许可standard,solidworks flexnet无法启动,启动失败
- 知乎日报客户端--知乎日报板块的实现
- C语言求输入字符的字母和数字个数
- 基于4G LTE模块的树莓派远程SSH连接方案(内网穿透)