原文

Word文档的内容,需要背转换为Asciidoc。以下是我发现最有效的步骤:

1. 将Word文档保存为HTML

2. 编码为UTF-8

3. 使用pandoc将HTML转换为AsciiDoc

4. 使用Sublime Text 2搜索和替换(使用一些正则表达式)去除疯狂的东西

5. 使用Sublime Text 2执行任何剩余的格式

将Word文档保存为HTML

在Word中打开文档,然后另存为网页。保存时选择“仅保存显示信息到HTML”选项。从Word退出。

编码为UTF-8

在Sublime Text 2中打开html文件。重新打开UTF-8编码并保存文件:

Sublime Text 2重新打开编码

如果不重新编码为UTF-8,则下一步将失败并显示错误:

pandoc:无法解码字节’\ x6f’:Data.Text.Encoding.decodeUtf8:无效的UTF-8流

使用Pandoc将HTML转换为AsciiDoc

运行Pandoc。例如,以下命令将AsciiDoc文件file.asc转换为ConventionSheet.htm:

pandoc -f html -t asciidoc -o file.asc ConventionSheet.htm

使用Sublime Text 2搜索和替换(使用一些正则表达式)去除疯狂的东西

奇怪的单引号需要去:

Sublime Text 2用单引号替换反引号,如果在Word中进行了审核,则审阅者的评论和更改可能会出现在HTML中。使用搜索删除这些,并在搜索字段中替换以下正则表达式:

\[line-through\]\*(.+)\*

当匹配行交叉线断裂时,可以使用?s正则表达式中的单行选项()进行搜索和替换:

(?s)\[line-through\]\*.(.*?)\*

使用Sublime Text 2执行任何剩余的AsciiDoc格式

在文档中等间隔任何正则表达式或其他特殊字符(这些将导致AsciiDoc解析器的问题)。

根据需要编辑AsciiDoc文档!请注意,GitHub现在本地显示AsciiDoc文件(在幕后使用AsciiDoctor),就像Markdown一样。

asciidoc转换html,Word文档到Asciidoc转换相关推荐

  1. html格式图片可以转换成word文档,html网页转换成word文档,转换成功,并且可以保存图片,但是总是为web版式的格式,怎么改成“页面”格式,多谢...

    当前位置:我的异常网» C# » html网页转换成word文档,转换成功,并且可以保存图 html网页转换成word文档,转换成功,并且可以保存图片,但是总是为"web版式"的格 ...

  2. 格式怎样把ppt转换成word文档

    无论是ppt文档还是word文档,都是我们办公中要经常用到的,虽然作为传送文件的格式ppt不如word方便,但作为演讲格式ppt绝对数第一,所以我们有时需要将word与ppt进行相互转换,今天先说说如 ...

  3. 扫描PDF转换成word文档如何操作

    扫描PDF文件转换成word文档如何进行操作呢?作为一般的PDF文件介于它的文件大小都不够大,普通的转换功能都能进行操作,文件过大的话就需要用到扫描PDF转word这种操作,那么关于它的操作是怎样的呢 ...

  4. 用 Python 将微信热文转换成Word文档 | 神级操作

    不得不说微信公众号已经成为了一个开放平台,每天数以万计的微信公众号文章在这产生,我们关注一个微信公众号每天便可以看到新的文章,我们同时也不知不觉的将好的文章分享到给朋友. 那么如何保存一个好的文章呢? ...

  5. html怎么在图片上加文字_怎么把图片文字转换成word文档

    我们在和别人交流的时候,有时候为了方便对方查看和理解,我们会使用文字图片进行交流,这是一种非常方便交流的形式.那如果我们想要将图片里的文字转换成Word文档应该怎么操作? 如果我们想要将图片识别为Wo ...

  6. 如何使用ABBYY FineReader 12将JPEG文件转换成Word文档

    日常工作中处理JPEG格式的图像文件时,有时需要转换成Word文档进行编辑,市场上应用而生了很多转换工具,相信不少人听说过OCR(光学字符识别)软件,可以用来转换图像文件,而在OCR软件中, ABBY ...

  7. bin文件怎么转换成文本文档_怎么把pdf文件转换成word文档?这样转很简单

    在日常的学习.工作生活中,小伙伴们总少不了要对文件格式进行转换操作,例如把pdf文件转换成word文档.对于职场老手来说,这当然不算一个难度操作,甚至还很简单.但对于职场新人而言,找不对方法,可能操作 ...

  8. html 转word c#,c#操作word类,进行html和word文档的互相转换

    #region 把Word文档装化为Html文件 /** ///把Word文档装化为Html文件/// /// 要转换的Word文档 public static void WordToHtml( st ...

  9. caj格式的文件如何转换成Word文档?

    很多人可能都会很少用得到caj文件,当拿到这样一个caj文件的时候我们可能需要将caj文件转换成Word文档的形式,下面就让小编给大家简单介绍一下. 步骤一:我们可以通过在浏览器上搜索迅捷PDF在线转 ...

最新文章

  1. 程序员吐槽职场戏精:凌晨三点半发周报,太装了!
  2. Web 安全开发规范手册 V1.0
  3. [转载]创建数据库与完成数据添删改查--第一种写法
  4. IBM 2nm芯片弯道超车了?他连车都没有
  5. Day8_误差反向传播
  6. Python花式编程案例锦集(3)
  7. 操作系统-高响应比优先调度算法
  8. HUSTOJ教程(1)——安装部署
  9. MATLAB2022a/Simulink + STM32F407 Discovery Kit教程1
  10. Sdut PTA练习 2021级-JAVA01 Java入门
  11. 如何用ChemDraw实现3D建模
  12. 《NVMe-over-Fabrics-1_0a-2018.07.23-Ratified》阅读笔记(3)-- 命令
  13. 一种经典的客户关系管理系统(CRM)订单模型的设计与实现
  14. Auto.js加密解密|快照Snapshot解密|Dex转js|Auto.js庖丁下载|解除APP限制
  15. 用手机对电脑进行远程关机
  16. FCKEDITOR编辑器的使用
  17. 记2019北航计算机夏令营体验~
  18. Java阿凯_Java-7 面向对象(上)
  19. 传智播客武汉校区校长焦宁波:我和传智播客的那些事儿
  20. Human Body 身体部位名称

热门文章

  1. 罗丹明PEG活性酯 RB-PEG-NHS,罗丹明聚乙二醇活性酯,Rhodamine-PEG-NHS
  2. linux禁止普通用户切换,扣丁学堂Linux培训简述Linux禁止普通用户切换至root用户的实例...
  3. 电离层穿刺点坐标计算
  4. 浅析Java开发中的Model1和Model2
  5. html 换行字体,div字体换行
  6. 读书笔记-增量学习-LwF_Learning without Forgetting
  7. SolidWorks2020报错:solidworks无法获得下列许可standard,solidworks flexnet无法启动,启动失败
  8. 知乎日报客户端--知乎日报板块的实现
  9. C语言求输入字符的字母和数字个数
  10. 基于4G LTE模块的树莓派远程SSH连接方案(内网穿透)