java实现pdf转word(文字)
1:添加依赖
<?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0"xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"><modelVersion>4.0.0</modelVersion><groupId>pdfToWord</groupId><artifactId>pdfToWord</artifactId><version>1.0-SNAPSHOT</version><dependencies><dependency><groupId>commons-logging</groupId><artifactId>commons-logging</artifactId><version>1.2</version></dependency><dependency><groupId>org.apache.pdfbox</groupId><artifactId>fontbox</artifactId><version>2.0.11</version></dependency><dependency><groupId>com.levigo.jbig2</groupId><artifactId>levigo-jbig2-imageio</artifactId><version>2.0</version></dependency><dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox-tools</artifactId><version>2.0.11</version></dependency><dependency><groupId>commons-io</groupId><artifactId>commons-io</artifactId><version>2.6</version></dependency></dependencies></project>
2:编写转换的方法
import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.text.PDFTextStripper;import java.io.*;/*** 把pdf转换为word格式** @author Angin* @date 2019/3/18 0018.*/ public class PdfToWord {/*** 转换*/public void convertText(String pdfPath) {PDDocument doc = null;OutputStream fos = null;Writer writer = null;PDFTextStripper stripper = null;try {doc = PDDocument.load(new File(pdfPath));fos = new FileOutputStream(pdfPath.substring(0, pdfPath.indexOf(".")) + ".doc");writer = new OutputStreamWriter(fos, "UTF-8");stripper = new PDFTextStripper();int pageNumber = doc.getNumberOfPages();stripper.setSortByPosition(true);stripper.setStartPage(1);stripper.setEndPage(pageNumber);stripper.writeText(doc, writer);writer.close();doc.close();} catch (IOException e) {e.printStackTrace();}System.out.println("end..");} }
3:main方法中进行测试
/*** main方法测试* @author Angin* @date 2019/3/18 0018.*/ public class MainClass {public static void main(String[] args) {PdfToWord convert=new PdfToWord();convert.convertText("E:\\pdfToWord.pdf");} }
此方法只适合文档型的pdf转换,如果图片的话,转换后无法读取。
转载于:https://www.cnblogs.com/angin-iit/p/10551829.html
java实现pdf转word(文字)相关推荐
- Java为 pdf、word和excel添加水印
1. 引入依赖 <!--easyexcel--><dependency><groupId>com.alibaba</groupId><artifa ...
- Java:pdf转word
转换思路 使用第三方库Spire的免费版本,转换页数要求11页 输入一个pdf时候,小于11页直接转换,大于11页就先切分成子pdf 对每一个小的pdf进行转换,最后再合并. 总体上就是一个大的pdf ...
- java实现pdf转为word
Installing Spire.Pdf.jar 如果您创建了⼀个 Maven 项⽬,您可以使⽤以下配置轻松地在您的应⽤程序中导⼊ jar.对于⾮ Maven 项⽬,请从此下载 jar ⽂件并⼿动 将 ...
- java实现PDF转Word(无水印无页数限制)完全开放
jar包破解 1.pom文件 分别复制进pom文件,记得配置maven的中央仓库在settings.xml中配置单独的仓库地址<repositories><repository> ...
- 使用java进行pdf转word实战
package com.ljl; /*** @author * @Package_name PACKAGE_NAME* @Date 2019/4/1 0001 上午 8:30* @Descriptio ...
- java 实现pdf 转word去除水印和去除页数限制
背景 每次下载的pdf文档想转成word文档,都从网上找各种找网址,网上的网址要么存在必须要充值,要么转化效果不好等等问题.作为一个技术人员,所以想能否实现pdf转化为word文档 代码实现 1.1 ...
- java实现PDF 转WORD
CSDN话题挑战赛第2期 参赛话题:Java技术分享 引言 由于市场上目前的各种格式文件的转换基本上都需要会员,怎么办呢? 不走寻常路,我们是程序员 我们当然要不走寻常路了,我们要动用一些特殊手段,展 ...
- PDF转Word文字可编辑的软件有哪些?
在工作中,我们经常使用一些PDF文档来办公,但是这些PDF文档的特点就是不容易编辑,有时我们为了方便使用,就会将PDF文件转换成 Word的格式.那你们知道怎么把PDF图片转Word文字吗?今天我们就 ...
- java实现pdf转word,解决个别排版错乱问题
项目中要实现客户上传完pdf,上传成功后直接就转成word格式的,之前网上一些免费的转出来的word大致还行,但是有些排版就错乱了,如下图: 下面这个是用java改造后的,效果如下,排版整齐,和pdf ...
最新文章
- 【重磅】助力企业复工,飞书宣布为中小企业提供三年免费服务
- vue插槽样式_vue 插槽简介及使用示例
- 开户oracle监听,R12:银行账户开户人?
- 数据类型,隐式类型转换
- Web如何应对流量劫持?
- 不同的写法 其中 1 2 (试了下 没有效果 ,先记载这里把)
- 数组算法 往数组尾部添加一条数据1202
- TchApp 为dotnet core配个UI,项目已托管github
- 使用particles.js实现网页背景粒子特效
- 设定MyEclipse编辑代码区域文字的大小及非关键字的字体、字形和颜色
- 麦淘亲子完成近千万美元B+轮融资,预计2019年前将开设约300个线下科学活动点...
- Blocking Queue三种加入队列方法对比
- 1、贪心NLP——课程介绍及NLP概论
- 细粒度分类:Hierarchical Bilinear Pooling(HBP),分级双线性池化(二)
- 一个简单的java代码,输入当前星期,输出今天是星期几
- 快门速度,光圈,感光度
- CodeForces - 1413C Perform Easily(双指针)
- 全家都是博士是一种什么样的体验?
- MATLAB仿真m序列,Gold序列,Kasami序列扩频码性能仿真分析
- 【深度学习神经网络】--BatchNorm详解