暂时只写读取word内容的方法。

依赖的jar:

poi-3.9-20121203.jar
poi-ooxml-3.9-20121203.jar
xmlbeans-2.3.0.jar

package com.word;import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;import org.apache.poi.POIXMLDocument;
import org.apache.poi.POIXMLTextExtractor;
import org.apache.poi.hwpf.extractor.WordExtractor;
import org.apache.poi.openxml4j.opc.OPCPackage;
import org.apache.poi.xwpf.extractor.XWPFWordExtractor;/** * @author QiaoJiafei * @version 创建时间:2016年2月22日 上午11:30:04 * 类说明 */
public class OptionWord {public static void main(String[] args) {// TODO Auto-generated method stub
        }public static StringBuffer readWord(String path) {String s = "";try {if(path.endsWith(".doc")) {InputStream is = new FileInputStream(new File(path));WordExtractor ex = new WordExtractor(is);s = ex.getText();}else if (path.endsWith("docx")) {OPCPackage opcPackage = POIXMLDocument.openPackage(path);POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);s = extractor.getText();}else {System.out.println("传入的word文件不正确:"+path);}} catch (Exception e) {e.printStackTrace();}StringBuffer bf = new StringBuffer(s);return bf;}}

java读取word内容相关推荐

  1. txt doc rtf html,JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例.docx

    JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例 JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例??2012-06-2 ...

  2. java poi无法读取word_poi,word_POI读取word内容的疑问,poi,word,java - phpStudy

    POI读取word内容的疑问 两片内容相同的word,poi分割成XWPFRun集合的时候,发现相同的段落内容有空行. word1打印的段落内容 word2打印的段落内容 代码如下 /** 替换段落中 ...

  3. java操作office和pdf文件java读取word,excel和pdf文档内容

    在平常应用程序中,对office和pdf文档进行读取数据是比较常见的功能,尤其在很多web应用程序中.所以今天我们就简单来看一下Java对word.excel.pdf文件的读取.本篇博客只是讲解简单应 ...

  4. java读取word文档里面的内容(包括doc和docx格式)

    java读取word文档里面的内容(包括doc和docx格式) java读取word文档里面的内容(包括doc和docx格式),使用POI架包 使用的POI架包如下 poi-3.16.jar poi- ...

  5. java读取word的插件,java word 插件

    java怎么判断word文档版本 PDF也是有分的. 有些是文字的内容,有些是图片里有文字. 前者转换还可以接受,后者转换就不堪入目了. 网上很多java PDF的插件的,读出内容,再用插件将内容保存 ...

  6. java 操作 word 表格和样式,java读取word表格中的表格 java如何读取word中的excel表格数据...

    Java 利用poi 可以直接读取word中的表格保持样式生1.读取word 2003及word 2007需要的jar包 读取 2003 版本(.doc)的word文件相对来说比较简单,只需要 poi ...

  7. Java 读取 Word文档的字体、字号、文字颜色、文字背景、文字是否加粗或倾斜、文字下划线、段落等属性

    Work库:free spire.doc.jar 3.9.0 由于这个包比较大,maven依赖容易下载失败,故此提供百度云下载地址,下载地址在最下面         可支持读取字体.字号.文字颜色.文 ...

  8. Java读取word中表格

    因为要新建一个站,公司要把word表格的部分行列存到数据库中.之前用java操作过excel,本来打算用java从word表格中读取数据,再存到数据库中,结果因为权限不够,无法访问公司要写的那个数据库 ...

  9. Java读取word模板,并动态生成word

    Java读取word模板,并动态生成word ​ 最近有个需求是将数据库里存入的用户个人信息生成一个word然后供用户下载,第一时间就就想到了poi来做,所以记录一下免得自己忘了,忘了也可以回来看看

  10. java读取Excel内容添加到list集合里面去

    java读取Excel内容添加到list集合里面去 package com.changan.contract.newsign.utils;import com.changan.contract.xqh ...

最新文章

  1. 入门 Python GUI 开发的第一个坑
  2. 标题要在3~5字之间-三年总结
  3. ECCV 2018 | Pixel2Mesh:从单帧RGB图像生成三维网格模型
  4. wxWidgets:工具栏概述
  5. 【Qt】Qt数据库简介
  6. LeetCode 1255. 得分最高的单词集合(回溯)
  7. 华为和谷歌在全球开发者眼里二选一,谁会获得胜利?
  8. WebResource.axd引起的问题
  9. 计算机并口地址定义,电脑并口(LPT)引脚定义
  10. python绘图在图中添加标记
  11. SW小技巧2:将属性链接到 SOLIDWORKS 工程图的简便方法
  12. 软件测评师的一些重点①
  13. uni-app 压缩图片
  14. 解决windows10下总是很快进入睡眠问题
  15. 32.filter表案例 nat表应用 (iptables)
  16. cs1.5最新服务器地址,服务器地址
  17. echarts水球图-动态波纹百分比数据显示
  18. java 快速开发平台
  19. html5 dpi,关于meta viewport中target-densitydpi属性详解(推荐)_哒哒_前端开发者
  20. rancher 代理安装

热门文章

  1. 不可或缺的PrepareImageRegions函数
  2. iOS Your account already has a valid ios Distribution certificate
  3. Django项目实战之用户头像上传与访问
  4. nginx 反向代理到目录
  5. Corporate Action Guidelines Terms
  6. 01-Quartz2D
  7. WCF REST(9篇)
  8. R连接Cassandra数据库的方法总结
  9. 如何有逻辑的,简单清晰的回应问题
  10. R语言可视化学习笔记之gganimate包