Openxml的使用配合mupdf的识别生成word(一)
在开发之前做了很多的处理和筛选,之前我做了许多的mupdf相关的操作,至此我的目标是实现mupdf提取的文字和图片信息放入word中。
着重标注一下openxml的说明。虽然工具和资料都很多,也很久远,但是好用,就是硬道理。
1.工具:OpenXMLSDKToolV25.msi (点击直接下载)
https://download.microsoft.com/download/5/5/3/553C731E-9333-40FB-ADE3-E02DC9643B31/OpenXMLSDKToolV25.msi
2.安装后打开主文件,操作打开一个word文件,可以查看详细的内容属性。当然,我不怎么需要这个功能,我主要需要的是查看命名空间和接口(open XML SDK Document),查询子接口和父借口。如图二(我查询 wp:anchor )右下角child 和Parent 都可看的很清楚。
3.至于 wp:anchor 这种数据从何处查看到的,我就不一一用图说明了。上流程 。
1.新建word文档----2.加入一串文字或者图片-----3.保存后,将文件后缀名改成 .rar ,然后解压文件-----4.解压后的文件有几个文件夹,进入word文件夹,找到 document.xml 文件,打开查看。我试用的工具是 VS code查看的
结构清晰可见。
4.后面我们将逐步做开发的功能介绍;主要文字和图片方向
Openxml的使用配合mupdf的识别生成word(一)相关推荐
- 世界上最好用的音频识别生成字幕软件?
魔镜魔镜告诉我,世界上最好用的音频识别生成字幕软件是哪个? [教程]这个世界上最好用的字幕自动识别软件!!!
- OpenXml操作Word的一些操作总结.无word组件生成word.
OpenXml相对于用MS提供的COM组件来生成WORD,有如下优势: 1.相对于MS 的COM组件,因为版本带来的不兼容问题,及各种会生成WORD半途会崩溃的问题. 2.对比填满一张30多页的WOR ...
- python百度paddle表格文字识别生成excel
表格识别技术主要使用基于注意力机制的图片描述模型 RARE,整体流程如下图所示,对于其中的表格区域进行表格识别处理. 表格识别的难点主要在于表格结构的提取,以及将表格信息与 OCR 信息融合.整体流程 ...
- FreeMarker生成word的代码
用于生成word用的freemarker工具类 package com.ucap.netcheck.utils; import java.io.File; import java.io.File ...
- 【Power Automate】如何自动生成Word与PDF文件[上]
上半年已经悄悄溜走,因为疫情,大家似乎也很习惯于在家办公.作为业务人员,如何汇报自己的工作,让自己更多地学习和掌握数字化办公技巧至关重要.那么今天我们就来看一下在不使用代码的情况下,如何通过Power ...
- 根据标准word模板生成word文档类库(开源)
前言 最近因项目需要要自定义标准word模板,并以编码方式操作word模板.填充数据和生成word文档,于是自己写了条小"内裤"来实现这个功能.该"内裤"只 ...
- Java Web项目中使用Freemarker生成Word文档
Web项目中生成Word文档的操作屡见不鲜,基于Java的解决方案也是很多的,包括使用Jacob.Apache POI.Java2Word.iText等各种方式,其实在从Office 2003开始,就 ...
- Java freemarker 生成word文档
工具类 package cn.gh.util;import freemarker.template.Configuration; import freemarker.template.Template ...
- Java项目中使用Freemarker生成Word文档
Web项目中生成Word文档的操作屡见不鲜,基于Java的解决方案也是很多的,包括使用Jacob.Apache POI.Java2Word.iText等各种方式,其实在从Office 2003开始,就 ...
最新文章
- h5在线浏览word_怎样将PDF在线转换成Word?教你成为一个高手的方法
- oracle 查二进制字符串,检测二进制文件 - 
Oracle® Developer Studio 12.5:Discover 和 Uncover 用户指南...
- JVM:类加载机制之类加载过程
- c++计算eigen随笔(1)
- c语言变量radius数据类型,c语言数据类型
- 3.4.1 变量初始化
- Spring beans配置方案(二) 学习笔记
- Flink1.6系列之—数据流编程模型
- 计算Pearson 相关系数的三种方式
- dnf无限卡连接服务器,不用进DNF游戏也能修改所在频道方法 卡频福音
- 用AJAX方式上传图片文件
- 0606关于mysql优化原理
- 天地融2014校园招聘笔试题
- 回收宝只要6499买华为Mate40 Pro还送iPhone 12手机:结果被秒杀!
- 地平线4显示与服务器通讯发生错误,地平线4加载失败发生不明错误的解决方法 - 系统家园...
- CodeSys Rand Numer 随机数生成
- 蚂蚁金服-支付宝内推面试总结(已拿到offer)
- python适合做网页吗_python是否适合网页编程详解
- 开发一个android app需要的技术
- 利用 ajax 上传图片 删除图片 (Spring Boot)