java读取word内容
暂时只写读取word内容的方法。
依赖的jar:
poi-3.9-20121203.jar
poi-ooxml-3.9-20121203.jar
xmlbeans-2.3.0.jar
package com.word;import java.io.File; import java.io.FileInputStream; import java.io.InputStream;import org.apache.poi.POIXMLDocument; import org.apache.poi.POIXMLTextExtractor; import org.apache.poi.hwpf.extractor.WordExtractor; import org.apache.poi.openxml4j.opc.OPCPackage; import org.apache.poi.xwpf.extractor.XWPFWordExtractor;/** * @author QiaoJiafei * @version 创建时间:2016年2月22日 上午11:30:04 * 类说明 */ public class OptionWord {public static void main(String[] args) {// TODO Auto-generated method stub }public static StringBuffer readWord(String path) {String s = "";try {if(path.endsWith(".doc")) {InputStream is = new FileInputStream(new File(path));WordExtractor ex = new WordExtractor(is);s = ex.getText();}else if (path.endsWith("docx")) {OPCPackage opcPackage = POIXMLDocument.openPackage(path);POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);s = extractor.getText();}else {System.out.println("传入的word文件不正确:"+path);}} catch (Exception e) {e.printStackTrace();}StringBuffer bf = new StringBuffer(s);return bf;}}
java读取word内容相关推荐
- txt doc rtf html,JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例.docx
JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例 JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例??2012-06-2 ...
- java poi无法读取word_poi,word_POI读取word内容的疑问,poi,word,java - phpStudy
POI读取word内容的疑问 两片内容相同的word,poi分割成XWPFRun集合的时候,发现相同的段落内容有空行. word1打印的段落内容 word2打印的段落内容 代码如下 /** 替换段落中 ...
- java操作office和pdf文件java读取word,excel和pdf文档内容
在平常应用程序中,对office和pdf文档进行读取数据是比较常见的功能,尤其在很多web应用程序中.所以今天我们就简单来看一下Java对word.excel.pdf文件的读取.本篇博客只是讲解简单应 ...
- java读取word文档里面的内容(包括doc和docx格式)
java读取word文档里面的内容(包括doc和docx格式) java读取word文档里面的内容(包括doc和docx格式),使用POI架包 使用的POI架包如下 poi-3.16.jar poi- ...
- java读取word的插件,java word 插件
java怎么判断word文档版本 PDF也是有分的. 有些是文字的内容,有些是图片里有文字. 前者转换还可以接受,后者转换就不堪入目了. 网上很多java PDF的插件的,读出内容,再用插件将内容保存 ...
- java 操作 word 表格和样式,java读取word表格中的表格 java如何读取word中的excel表格数据...
Java 利用poi 可以直接读取word中的表格保持样式生1.读取word 2003及word 2007需要的jar包 读取 2003 版本(.doc)的word文件相对来说比较简单,只需要 poi ...
- Java 读取 Word文档的字体、字号、文字颜色、文字背景、文字是否加粗或倾斜、文字下划线、段落等属性
Work库:free spire.doc.jar 3.9.0 由于这个包比较大,maven依赖容易下载失败,故此提供百度云下载地址,下载地址在最下面 可支持读取字体.字号.文字颜色.文 ...
- Java读取word中表格
因为要新建一个站,公司要把word表格的部分行列存到数据库中.之前用java操作过excel,本来打算用java从word表格中读取数据,再存到数据库中,结果因为权限不够,无法访问公司要写的那个数据库 ...
- Java读取word模板,并动态生成word
Java读取word模板,并动态生成word 最近有个需求是将数据库里存入的用户个人信息生成一个word然后供用户下载,第一时间就就想到了poi来做,所以记录一下免得自己忘了,忘了也可以回来看看
- java读取Excel内容添加到list集合里面去
java读取Excel内容添加到list集合里面去 package com.changan.contract.newsign.utils;import com.changan.contract.xqh ...
最新文章
- 入门 Python GUI 开发的第一个坑
- 标题要在3~5字之间-三年总结
- ECCV 2018 | Pixel2Mesh:从单帧RGB图像生成三维网格模型
- wxWidgets:工具栏概述
- 【Qt】Qt数据库简介
- LeetCode 1255. 得分最高的单词集合(回溯)
- 华为和谷歌在全球开发者眼里二选一,谁会获得胜利?
- WebResource.axd引起的问题
- 计算机并口地址定义,电脑并口(LPT)引脚定义
- python绘图在图中添加标记
- SW小技巧2:将属性链接到 SOLIDWORKS 工程图的简便方法
- 软件测评师的一些重点①
- uni-app 压缩图片
- 解决windows10下总是很快进入睡眠问题
- 32.filter表案例 nat表应用 (iptables)
- cs1.5最新服务器地址,服务器地址
- echarts水球图-动态波纹百分比数据显示
- java 快速开发平台
- html5 dpi,关于meta viewport中target-densitydpi属性详解(推荐)_哒哒_前端开发者
- rancher 代理安装