poi 读取word标题_如何使用POI读取Word中的标题编号
我担心您必须自己计算,以下是您可以在XWPFParagraph对象上使用的方法来提取所需的数据:
您可以这样使用它们:
for (XWPFParagraph paragraph : paragraphList) {
System.out.println("text: "+paragraph.getNumLevelText());
System.out.println("depth: "+paragraph.getNumIlvl());
System.out.println("format: "+paragraph.getNumFmt());
}
我试过这个文件:
并输出:
text: %1.
depth: 0
format: decimal
text: %1.%2.
depth: 1
format: decimal
text: %1.%2.
depth: 1
format: decimal
text: %1.%2.%3.
depth: 2
format: decimal
text: %1.%2.
depth: 1
format: decimal
所以从那里你会知道每个标题的格式是什么。你需要自己评估一下。
修改强>
这可能对您有用。因为你只有小数,所以这是一个简单的例子。
int[] levelCurrentValues = new int[] {0,0,0};
for (XWPFParagraph paragraph : paragraphList) {
String levelText = paragraph.getNumLevelText();
BigInteger levelDepth = paragraph.getNumIlvl();
String levelFormat = paragraph.getNumFmt();
System.out.println("text: "+levelText);
System.out.println("depth: "+levelDepth);
System.out.println("format: "+levelFormat);
if(levelText!=null) {
levelCurrentValues[levelDepth.intValue()] += 1;
levelText = levelText.replace("%1", "" + levelCurrentValues[0]);
levelText = levelText.replace("%2", "" + levelCurrentValues[1]);
levelText = levelText.replace("%3", "" + levelCurrentValues[2]);
System.out.println(levelText);
System.out.println("");
}
}
当针对与上面相同的文件运行时,它会输出
text: %1.
depth: 0
format: decimal
1.
text: %1.%2.
depth: 1
format: decimal
1.1.
text: %1.%2.
depth: 1
format: decimal
1.2.
text: %1.%2.%3.
depth: 2
format: decimal
1.2.1.
text: %1.%2.
depth: 1
format: decimal
1.3.
poi 读取word标题_如何使用POI读取Word中的标题编号相关推荐
- java poi word宏_全面了解POI操作Microsoft Office(Word、Excel、PowerPoint)
POI 与 Microsoft Office 1. POI 简介 POI 是 Apache 下的 Jakata 项目的一个子项目,主要用于提供 java 操作 Microsoft Office 办公套 ...
- python读取只读word只读_人生苦短我学Python——Word处理之快速Word转PDF
上回书说到Python对于Excel的操作,本回书咱们来说一说Python对于Word的操作.这次的需求是这样的:把若干个Word文档转换为PDF格式.起因呢,是因为公司经常会披露公告.法律文件等,这 ...
- python生成word目录_使用Python更新MS Word .docx文档的目录(目录)
我使用python包" python-docx"来修改MS Word .docx文档的结构和内容.该软件包无法更新TOC(目录)[Python: Create a "Ta ...
- python word处理_妙用Python将word文件转换成html 方法超简单
什么方法可以将word文件转换成html,找了一圈,没有发现合适的应用可以把word或indd转化成干净的html.机缘巧合,无意间听说python很擅长文本处理,用Python将word文件转换成h ...
- python按列读取txt文件_如何使用pandas读取txt文件中指定的列(有无标题)
最近在倒腾一个txt文件,因为文件太大,所以给切割成了好几个小的文件,只有第一个文件有标题,从第二个开始就没有标题了. 我的需求是取出指定的列的数据,踩了些坑给研究出来了. import pandas ...
- java poi 图片 内存溢出_解决java poi海量数据导出内存溢出问题
找了很多天的解决方法,一直被分页查询绕进去了,其实数据都能查出来的,真正卡的地方是ExcelExportUtil类下调错了方法. 最开始调用的方法是(标记的地方): workbook = new H ...
- c++ 怎么读取rtf文件_最全集合!Word、PPT、Excel、PDF文件转换方法大全!建议收藏...
我们在工作中经常都需要转换各种格式的文件,像Word.Excel.PPT.PDF文件等,很多小伙伴都还不知道怎么转换,今天小编特地为大家整理了一份超全的转换清单,小伙伴们可以收藏起来,以备不时之需. ...
- itext7读取pdf 中文_如何把PDF转为Word?转换软件哪个好?
样把pdf转换成word? PDF是一种文件格式,全称是Portable Document Format,这种文件格式的最大优点是与操作系统平台无关,可以完美再现原稿的设计风貌.也就是说一个pdf文档 ...
- 扫描二维码读取文档_使用深度学习读取和分类扫描的文档
扫描二维码读取文档 To many people's dismay, there is still a giant wealth of paper documents floating out the ...
最新文章
- 两种语言实现设计模式(C++和Java)(三:策略模式)
- 自学python要下载什么软件-Python学习需要安装的工具
- Solo 博客系统 1.7.0 发布 - 新版 MD 编辑器
- CxImage图像处理类库说明3(转载)
- 使用 Boost.MPI 的 reduce() 连接字符串的示例
- InnoDB锁机制之Gap Lock、Next-Key Lock、Record Lock解析
- PHP - 如何解决中文乱码
- ANTLR和Jetbrains MPS:解析文件并以树符号显示AST
- 【文末赠书】牛顿:伸向未知量的利爪
- Win7系统设置ip地址的方法
- 好时光·宝髻偏宜宫样 [唐] 李隆基
- java桥牌发牌算法
- Android -- 闹钟服务的使用(单次闹钟)
- oracle负数,oracle取交集_oracle取负数_oracle case when
- 服务器盘符修改不了怎么办,win10更换盘符报参数错误怎么办_win10系统盘符改不了参数错误解决方法...
- 【UE4】使用Composure插件在场景或UI中实时显示CineCamera画面
- 根据GPS定位得到的经纬度调用百度地图API在地图上标注
- 北京各大医院专长(转)
- 人工智能期末复习(一)
- 食堂总是拥挤不堪?解决用餐拥挤,教你一招
热门文章
- 金属学复习【4】 --- 铁碳合金相图
- Android高仿京东、天猫下拉刷新
- FANUC协作机器人CRX系列_程序的创建与运行
- 仆人式、服务型领导力
- OpenCV训练样本遇到的问题
- python源文件改写、编写一个程序,Python源文件改写.编写一个程序,读取一个Python源程序,将文件中所有除保留字外的小写字母换成大写字母...
- zepto ajax php实例,Zepto Ajax 事件
- 跨平台应用开发进阶(四十一)使用Xcode打包 iOS 应用 archive 时四种证书的区别详解
- 运维思索:运维管理与运维自动化
- sql2000之不足数自动补位、补零,左侧、右侧、中间 谢子圣 |2016-04-18 |3.8分(高于91.8%的文档)|414|11 |简介 |举报 手机打开...