Spting boot 项目

1.添加依赖

org.apache.pdfbox

pdfbox

2.0.16

2.PDFTest.java

package com.nenu.pdf;

import org.apache.pdfbox.io.RandomAccessFile;

import org.apache.pdfbox.pdfparser.PDFParser;

import org.apache.pdfbox.pdmodel.PDDocument;

import org.apache.pdfbox.text.PDFTextStripper;

import java.io.File;

import java.io.FileNotFoundException;

import java.io.IOException;

public class PDFTest {

public static String getTextFromPDF(String pdfFilePath)

{

String result = null;

PDDocument document = null;

File file = new File(pdfFilePath);

try {

PDFParser parser = new PDFParser(new RandomAccessFile(file,"rw"));

parser.parse();

document = parser.getPDDocument();

PDFTextStripper stripper = new PDFTextStripper();

result = stripper.getText(document);

} catch (FileNotFoundException e) {

// TODO Auto-generated catch block

e.printStackTrace();

} catch (IOException e) {

// TODO Auto-generated catch block

e.printStackTrace();

} finally {

if (document != null) {

try {

document.close();

} catch (IOException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

}

}

return result;

}

public static void main(String[] args)

{

String str=PDFTest.getTextFromPDF("D:\\pdf.pdf");

System.out.println(str);

}

}

java pdfbox 解析报错_pdfBox 解析 pdf文件相关推荐

  1. java pdfbox 解析报错_pdfbox 读取文件报错 java.io.IOException: Page tree root must be a dictionary...

    pdfbox java.io.IOException: Page tree root must be a dictionary 示例代码 public static void main(String[ ...

  2. java pdfbox 解析报错_PDFBOX 读取数据报错

    java.io.IOException"类型的未经处理的异常在 PDFBox-0.7.3.dll 中发生 其他信息: Error: Could not find predefined CMA ...

  3. 【Bug总结】java.lang.IllegalThreadStateException报错bug的解析

    背景 在执行单元测试的时候,发现同一线程运行多次后,就会报一个线程的错误: Exception in thread "Main Thread" java.lang.IllegalT ...

  4. 解析报错   No such provider: BC

    解析报错   No such provider: BC 我在网上找了,有几种方法.修改配置文件和添加代码(代码我也不太明白,希望懂的老铁可以解释一下) 修改配置文件我也试过,是可行的,不过不推荐 找到 ...

  5. Unity3D使用LitJson.dll解析报错问题

    报错内容: JsonException: Invalid character ' LitJson.Lexer.NextToken () (at <e591cc6acad24a94a39b4890 ...

  6. 【Android开发】app升级报错,解析包时出现错误(华为手机8.0系统)

    问题描述: 今天发布app版本升级,碰到华为手机8.0系统,安装升级的时候提示,解析包时出现问题.而其他手机都是正常的.而且当我的包没有经过360加固的时候,也是可以去升级新版本,加固过后就不行了. ...

  7. win7系统无法解析服务器的dns地址,Win7网页报错“无法解析服务器的DNS地址”怎么办...

    有些用户在使用Win7系统时,打开网页提示错误:"无法解析服务器的DNS地址",导致网页无法打开.针对这种情况,下面学习啦小编就为大家介绍一下Win7系统网页报错"无法解 ...

  8. win7系统无法解析服务器的dns地址,怎么办Win7系统网页报错“无法解析服务器的DNS地址”...

    最近一些重装系统的用户在运用Win7系统时,翻开网页提示错误:"无法解析效劳器的DNS地址",招致网页无法翻开.遇到这种状况应该怎样办呢?下面小编教大家Win7系统网页报错&quo ...

  9. java exec执行tar_用java调用rpmbuild 报错,同一条命令直接复制到终端却能运行

    用java调用rpmbuild 报错,同一条命令直接复制到终端却能运行. 命令如下: rpmbuild --define "_topdir /var/lib/jenkins/workspac ...

最新文章

  1. OPENFILENAME文件类型过滤 lpstrFilter
  2. 【评论】为什么我的工资最低!
  3. SAP Spartacus organization unit list抬头显示所有unit的标题实现
  4. 逻辑回归(logistic regression)的本质——极大似然估计
  5. 计算机主机机箱面板辐射,电脑机箱如何防辐射----给大家科普一下
  6. 插画类引导页设计灵感|友好结合,总能带给人惊喜~
  7. 组件cdn引入_高性能 React UI组件库SHINEOUT
  8. python实现列表去重改变顺序_python实现文本去重且不打乱原本顺序
  9. AndroidSwipeLayout:最强大的 Swipe Layout
  10. 真的!?在阅读体验感上赢过微信读书?
  11. 【算法】五大常用算法最全面总结
  12. CSS动画 图片或者文字上下来回循环上下移动
  13. 读书笔记-MongoDb-简介
  14. ZABBIX修改端口流量监控阀值
  15. epic无法安装怎么办?
  16. [课程][原创]yolox检测封装成类调用几句代码完成目标检测任务
  17. 没有javaeye积分了,谁了解浙大网新恒天公司啊?
  18. 天翼物联推出行业应用开发套件,七大能力降低产品开发门槛
  19. 借用词的计算机英语词汇,计算机英语专业词汇的构成.doc
  20. centos7设置共享文件夹访问--samba

热门文章

  1. 算法训练 Sticks
  2. 在vue中如何使用百度地图
  3. ipv6设置 -----eth0: duplicate address detected! 检测到重复地址问题
  4. 用gsl计算非方阵矩阵除法--解线性方程
  5. ubuntu16 更新nvidia驱动版本及cuda
  6. 2018.10.16【校内模拟】膜法(组合数学)
  7. C语言中数的二进制、八进制、十进制以及十六进制表示及输出
  8. 第三周作业3——Bug Report
  9. 缺项目经验?线上实训机会来咯!!后端企业项目盖章实习,可写进简历
  10. 单片机彩灯c语言程序设计,(定稿)毕业论文基于AT89C51单片机的LED彩灯控制器设计(完整版)...