1:添加依赖

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"><modelVersion>4.0.0</modelVersion><groupId>pdfToWord</groupId><artifactId>pdfToWord</artifactId><version>1.0-SNAPSHOT</version><dependencies><dependency><groupId>commons-logging</groupId><artifactId>commons-logging</artifactId><version>1.2</version></dependency><dependency><groupId>org.apache.pdfbox</groupId><artifactId>fontbox</artifactId><version>2.0.11</version></dependency><dependency><groupId>com.levigo.jbig2</groupId><artifactId>levigo-jbig2-imageio</artifactId><version>2.0</version></dependency><dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox-tools</artifactId><version>2.0.11</version></dependency><dependency><groupId>commons-io</groupId><artifactId>commons-io</artifactId><version>2.6</version></dependency></dependencies></project>

2:编写转换的方法

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;import java.io.*;/*** 把pdf转换为word格式** @author Angin* @date 2019/3/18 0018.*/
public class PdfToWord {/*** 转换*/public void convertText(String pdfPath) {PDDocument doc = null;OutputStream fos = null;Writer writer = null;PDFTextStripper stripper = null;try {doc = PDDocument.load(new File(pdfPath));fos = new FileOutputStream(pdfPath.substring(0, pdfPath.indexOf(".")) + ".doc");writer = new OutputStreamWriter(fos, "UTF-8");stripper = new PDFTextStripper();int pageNumber = doc.getNumberOfPages();stripper.setSortByPosition(true);stripper.setStartPage(1);stripper.setEndPage(pageNumber);stripper.writeText(doc, writer);writer.close();doc.close();} catch (IOException e) {e.printStackTrace();}System.out.println("end..");}
}

3:main方法中进行测试

/*** main方法测试* @author Angin* @date 2019/3/18 0018.*/
public class MainClass {public static void main(String[] args) {PdfToWord convert=new PdfToWord();convert.convertText("E:\\pdfToWord.pdf");}
}

此方法只适合文档型的pdf转换,如果图片的话,转换后无法读取。

转载于:https://www.cnblogs.com/angin-iit/p/10551829.html

java实现pdf转word(文字)相关推荐

  1. Java为 pdf、word和excel添加水印

    1. 引入依赖 <!--easyexcel--><dependency><groupId>com.alibaba</groupId><artifa ...

  2. Java:pdf转word

    转换思路 使用第三方库Spire的免费版本,转换页数要求11页 输入一个pdf时候,小于11页直接转换,大于11页就先切分成子pdf 对每一个小的pdf进行转换,最后再合并. 总体上就是一个大的pdf ...

  3. java实现pdf转为word

    Installing Spire.Pdf.jar 如果您创建了⼀个 Maven 项⽬,您可以使⽤以下配置轻松地在您的应⽤程序中导⼊ jar.对于⾮ Maven 项⽬,请从此下载 jar ⽂件并⼿动 将 ...

  4. java实现PDF转Word(无水印无页数限制)完全开放

    jar包破解 1.pom文件 分别复制进pom文件,记得配置maven的中央仓库在settings.xml中配置单独的仓库地址<repositories><repository> ...

  5. 使用java进行pdf转word实战

    package com.ljl; /*** @author * @Package_name PACKAGE_NAME* @Date 2019/4/1 0001 上午 8:30* @Descriptio ...

  6. java 实现pdf 转word去除水印和去除页数限制

    背景 每次下载的pdf文档想转成word文档,都从网上找各种找网址,网上的网址要么存在必须要充值,要么转化效果不好等等问题.作为一个技术人员,所以想能否实现pdf转化为word文档 代码实现 1.1 ...

  7. java实现PDF 转WORD

    CSDN话题挑战赛第2期 参赛话题:Java技术分享 引言 由于市场上目前的各种格式文件的转换基本上都需要会员,怎么办呢? 不走寻常路,我们是程序员 我们当然要不走寻常路了,我们要动用一些特殊手段,展 ...

  8. PDF转Word文字可编辑的软件有哪些?

    在工作中,我们经常使用一些PDF文档来办公,但是这些PDF文档的特点就是不容易编辑,有时我们为了方便使用,就会将PDF文件转换成 Word的格式.那你们知道怎么把PDF图片转Word文字吗?今天我们就 ...

  9. java实现pdf转word,解决个别排版错乱问题

    项目中要实现客户上传完pdf,上传成功后直接就转成word格式的,之前网上一些免费的转出来的word大致还行,但是有些排版就错乱了,如下图: 下面这个是用java改造后的,效果如下,排版整齐,和pdf ...

最新文章

  1. 【重磅】助力企业复工,飞书宣布为中小企业提供三年免费服务
  2. vue插槽样式_vue 插槽简介及使用示例
  3. 开户oracle监听,R12:银行账户开户人?
  4. 数据类型,隐式类型转换
  5. Web如何应对流量劫持?
  6. 不同的写法 其中 1 2 (试了下 没有效果 ,先记载这里把)
  7. 数组算法 往数组尾部添加一条数据1202
  8. TchApp 为dotnet core配个UI,项目已托管github
  9. 使用particles.js实现网页背景粒子特效
  10. 设定MyEclipse编辑代码区域文字的大小及非关键字的字体、字形和颜色
  11. 麦淘亲子完成近千万美元B+轮融资,预计2019年前将开设约300个线下科学活动点...
  12. Blocking Queue三种加入队列方法对比
  13. 1、贪心NLP——课程介绍及NLP概论
  14. 细粒度分类:Hierarchical Bilinear Pooling(HBP),分级双线性池化(二)
  15. 一个简单的java代码,输入当前星期,输出今天是星期几
  16. 快门速度,光圈,感光度
  17. CodeForces - 1413C Perform Easily(双指针)
  18. 全家都是博士是一种什么样的体验?
  19. MATLAB仿真m序列,Gold序列,Kasami序列扩频码性能仿真分析
  20. 【深度学习神经网络】--BatchNorm详解

热门文章

  1. 如何在html中加入音效,为你的html5网页添加音效示例
  2. 中国大数据与实体经济融合发展白皮书2019整理
  3. 西北工业大学NOJ-Python程序设计作业1-10
  4. 华为手机到底用了多少美国芯?
  5. 海量存储的关键技术是什么?
  6. EVPN配置实例(二)——EVPN分布式网关
  7. 腾讯游戏unity客户端面试题
  8. ab(Apache Bench)命令详解以及压力测试模拟
  9. 港科喜讯 | 刘浩教授获评30 Under 30-福布斯中国2021
  10. [独有源码]java-jsp城市智慧停车场管理系统pd2hk规划与实现适合自己的毕业设计的策略