技术名称 技术特点 使用语言 使用场景 可处理的文件格式
Tesseract OCR 光学字符识别引擎,可将扫描的财务报表图片转换为可编辑的文本格式 Java, Python 财务报表自动识别录入 pdf, doc, docx, txt, img
Apache PDFBox PDF文档处理库,可从PDF文件中提取文本、图像和其他信息 Java 财务报表信息提取 pdf
OpenCV 计算机视觉库,可进行图像处理、目标检测和识别等任务 C++, Python, MATLAB 财务报表特征提取、自动识别录入 img
Tabula 从PDF文件中提取表格数据,并将其转换为CSV、JSON或其他格式,支持多页PDF表格的识别和提取 Java 财务报表数据提取、转换 pdf
KrakenD 基于机器学习的开源OCR引擎,可将扫描的文档转换为可编辑文本,支持多种文件格式和语言,包括PDF、DOCX、JPG、PNG等,同时提供了Python和Java API Python, Java 财务报表自动识别录入 pdf, docx, jpg, png, img, ps
EasyOCR 使用Python编写的高级OCR引擎,支持70多种语言和多种文件格式,包括PDF、DOCX、JPG、PNG等,基于深度学习,具有高精度和速度快的优点 Python 财务报表自动识别录入、大规模文本图像数据处理 pdf, docx, jpg, png, bmp, doc, txt, svg, eps, psd, gif等颜色模式等。还支持psd等压缩方式。支持色彩管理。支持Windows与Mac OS系统字体与系统色彩。支持创建ICC色彩曲线与色彩空间转换。支持OpenGL绘图模式。支持带Alpha通道的位图图形。支持多通道与多色阶颜色图像。支持多种图像格式输入输出与存储。支持多种图像格式输入输出与存储。支持多种图像格式输入输出与存储.
OCRopus4 基于Python的OCR引擎,可进行文本检测、文本识别和文本校对,支持多种文件格式和语言,可以用于处理大规模的文本图像数据 Python, C++ 财务报表自动识别录入、大规模文本图像数据处理 pdf, docx, txt, jpg, png等图片格式的文件也支持 ppt 等其他格式的文件
Tesseract OCR Nano Tesseract OCR引擎的轻量级封装库,支持多平台和多种文件格式,包括PDF、DOCX、JPG、PNG等 C++, Python 财务报表自动识别录入 pdf, docx等图片格式的文件
Abbyy OCR 功能强大的OCR引擎,可以将扫描的财务报表转换为可编辑的文本,支持多种文件格式和语言,包括PDF、DOCX、JPG、PNG等 REST API,.NET, Java, Python, PHP等 财务报表自动识别录入 pdf等图片格式的文件及DocuWorks文件等其他格式的文件
ExcelReaderJ 一个用于读取Excel文件的Java库,能够将Excel文件转换为Java对象。 Java Excel表格数据的读取与转换 Excel 97-2016 (.xlsx and .xls)
FlexTable 一个用于处理Excel文件中表格数据的Java库,能够将Excel表格数据转换为可编辑的Java对象并进行反序列化。 Java Excel表格数据的处理与反序列化 Excel 97-2016 (.xlsx and .xls)
OCR.space 基于机器学习的开源OCR引擎,可将图片中的文字转换为可编辑的文本,支持批量处理和多种文件格式 Python 大规模文本图像数据处理、文字识别 img 等图片格式的文件
Apache POI (补充) 一套用于操作Microsoft Office格式文件的Java API,可以读写Excel、Word等文件 Java Excel、Word等文件的读写操作 Excel (.xls and .xlsx), Word (.doc and .docx), PowerPoint (.ppt and .pptx) and others
OpenXLSX (补充) 一个用于读写Microsoft Excel文件的Java库,支持xlsx和xls格式 Java Excel文件的读写操作 Excel (.xlsx and .xls)
jxl (补充) 一个Java库,用于读写Microsoft Excel .xls文件的 Java Excel文件的读写操作(不支持.xlsx) Excel (.xls)

财务报表导入的相关技术整理相关推荐

  1. Python GUI编程-了解相关技术[整理]

    Python GUI编程-了解相关技术[整理] 我们可以看到,其实python进行GUI开发并没有自身的相关库,而是借用第三方库进行开发.tkinter是tcl/tk相关,pyGTK是Gtk相关,wx ...

  2. 初识-Android之智能短信项目相关技术整理

    标签页切换采用传统的TabHost: 采用TabActivty实现TabHost. 效果图-后补: 相关技术详解推荐: http://blog.csdn.net/zhouli_05/article/d ...

  3. 转:基于iOS上MDM技术相关资料整理及汇总

    转自:http://www.mbaike.net/mdm/6.html 一.MDM相关知识: MDM (Mobile Device Management ),即移动设备管理.在21世纪的今天,数据是企 ...

  4. BI 及其相关技术概览

    什么是BI? 商业智能也称作BI,是英文单词Business Intelligence的缩写.商业智能的概念最早在1996年提出.当时将商业智能定义为一类由数据仓库(或数据集市).查询报表.数据分析. ...

  5. epoll相关资料整理

    http://www.cppblog.com/converse/archive/2008/10/13/63928.html epoll相关资料整理 学习epoll有一段时间了,最近终于有一个服务器采用 ...

  6. [转]国内各大互联网公司相关技术站点2.0版 (集合腾讯、阿里、百度、搜狐、新浪、360等共49个)...

    利用闲暇时间整理了一份国内各大互联网公司的相关技术站点,希望能够对大家有所帮助,也欢迎各位帮忙补充. 腾讯系列(13)  阿里系列(18)  百度系列(3)  搜狐系列(3)  新浪系列(2)  36 ...

  7. Python后端相关技术/工具栈

    Python后端相关技术/工具栈 转载http://python.jobbole.com/83486/ 整理下目前涉及到的python的技术栈和工具栈(用过或了解的, 其他的后续用到再补充) 编辑器 ...

  8. 《Science》杂志:机器学习究竟将如何影响人类未来的工作? 2018-01-11 Smiletalker AI科技评论 AI 科技评论按:人工智能、机器学习相关技术已经多次刷新了人们对于「计算机能

    <Science>杂志:机器学习究竟将如何影响人类未来的工作? 2018-01-11SmiletalkerAI科技评论 AI 科技评论按:人工智能.机器学习相关技术已经多次刷新了人们对于「 ...

  9. ai包装插件_关于DIP异型插件机导入与相关来料标准研究

    原标题:关于DIP异型插件机导入与相关来料标准研究 DIP插件后焊加工是SMT贴片加工之后的一道工序. DIP插件(Dual In-line Package),中文又称DIP封装,也叫双列直插式封装技 ...

  10. 【转】BI 入门: 体系架构及相关技术

    (1) 老板,你要这么多数据做什么?         假如你是一个商品零售公司的老板.     你的公司很先进,已经实现了业务信息化,每一笔销售单据都保存在数据库中,日积月累,已经保存了十余年的销售数 ...

最新文章

  1. 将项目通过git上传到bitbucket仓库 (附图)
  2. C语言长度为0的数组
  3. 笔记-高项案例题-2016年上-范围管理+沟通管理+进度管理+风险管理
  4. mxGraph实现按住ctrl键盘拖动图形实现复制图形功能
  5. 小cookie,大智慧
  6. Linux文件查找之find秘笈
  7. django post and get?
  8. pwm控制舵机转动角度程序_舵机的内部结构及工作原理
  9. dwr框架java解析excel_dwr poi java 将excel 导出到客户端
  10. 【渝粤教育】国家开放大学2018年春季 8601-22T燃气工程概论 参考试题
  11. C语言复习---输出魔方阵
  12. 服务器租用别让黑客钻了这些空子
  13. ios 自制framework遇到 _OBJC_CLASS_$_XXX, referenced from:
  14. visio对齐连接线
  15. Mac电脑怎么使用ping命令
  16. Python3爬取新浪微博头条
  17. JWT expired at 2022-04-07T12:06:46Z. Current time: 2022-04-10T19:47:24Z, a difference of 286838865..
  18. linux kde 黑屏,在manjaro-kde上nvidia开机黑屏解决办法
  19. python网络爬虫从入门到实践 第5章 (二)
  20. 一文理解什么是公民开发

热门文章

  1. 蓝桥杯 试题 算法训练 kAc给糖果你吃 C++详解
  2. 自Kindle以来,微软的New Foldable可能是最好的阅读工具
  3. java转义字符要用什么标号_关于java:所有的转义字符是什么?
  4. 用示波器测量无刷电机的转速
  5. 期权和期货的差别有哪些?
  6. AI智能文案软件:写作能力+创造力,让你的创意翱翔
  7. 北京大学ACM---poj3750---小孩报数问题(循环链表求解法)
  8. 3句话,让你学会Python条件与分支,那是不可能的……
  9. 海外服务器:为什么越来越多的人选择跨境托管?
  10. Redis青铜修炼手册(一) --- NoSQLRedis介绍