如何把图片、PDF文件中的文字进行识别提取,这个问题仿佛困扰了我们很多年,直到现在,当急需OCR功能时也没有一个快速、高效且免费的在线工具或软件能马上拿来用。

前阵子的工作中正好有这个需求,我要把一篇PDF格式论文中的表格内容提取出来,供数据可视化使用。这些表格包含少量文字和大量数字,说多不多,说少也不少,人工提取数字出错率比较高。这时候!我又想找个“在线OCR工具”了!

一些号称在线快速OCR的网页,广告横飞且速度慢,上传文件后无反应,大都是标题党骗点击赚广告费的…… 个别看起来比较正经的OCR软件,全都收费,由于我的需求不多,而且就用这么一两次,还是不愿意花这个钱的。这时候我突然想起来一直飘在广告位的「百度文字识别OCR」,万一有试用可以白嫖一下呢。果然有免费额度赠送!

除通用场景文字识别外,还提供卡证文字识别、财务票据文字识别、医疗票据文字识别、汽车场景文字识别、教育场景文字识别、iOCR自定义模板文字识别等OCR服务场景,每个类别下还有细分的服务API,但除通用场景以外的大都不提供免费额度。

于是我试用了一下四种通用文字识别的API,按照官方的文档一步步来就可以了,这里我简化一下使用流程,仅需三步,十分钟满足你的OCR需求!

第一步,注册一个百度账号(https://passport.baidu.com/v2/?reg),如果已有请直接登陆。登录后点击页面中的「创建应用」:

“应用名称”随便取一个就好,接口选择用默认就可以(通用文字识别服务已作默认勾选),应用归属选“个人”,最后简单写一下“应用描述”即可。

填写完毕后,点击“立即创建”就可以了。

点击“返回应用列表”,点击“显示”查看所创建应用的 Secret Key:

至此,API 就申请好了。这里申请到的 API Key 和 Secret Key 复杂存好,等下要在脚本中调用。

第二步,准备好你的数据,图片形式即可,以这张图举例(随手拍一张书页内容):

最后一步,修改脚本中的 API_KEY 和 SECRET_KEY(第一步在应用列表里复制来的),然后修改你需要进行识别的图片路径 file_content,改完这三个参数,就可以运行脚本啦!

识别输出的文字结果如下:

完整的代码脚本可以参考官方指南(https://cloud.baidu.com/doc/OCR/s/dk3iqnq51),也可以参考我分解的 Jupyter 版,关注公众号「数据池塘」,回复「百度OCR」即可获取完整代码。

希望可以帮助到大家,祝顺利!

百度OCR接口使用详细教程相关推荐

  1. 调用百度OCR接口识别身份证 微信小程序

    申请百度AI账号获取百度OCR接口API Key和Secret Key 申请地址: http://ai.baidu.com/?track=cp:aipinzhuan|pf:pc|pp:AIpingta ...

  2. 火山PC使用百度OCR接口识别文字

    本源码转载自利快云https://www.lkuaiy.com/ 火山PC使用百度OCR接口识别文字 一.需要调用的模块 视窗基本类 MFC界面基本类 火山模块 二.百度OCR使用前准备 百度OCR是 ...

  3. cms是什么意思啊_织梦CMS网站如何自动提交百度快速收录(详细教程)

    前不久,站长们发现百度搜索资源平台把链接提交"的功能改为"普通收录",同时新增了"快速收录"的功能.普通收录,我相信很多站长们都知道怎么去提交,但是快 ...

  4. 百度文字识别 百度OCR接口申请

    1.百度文字识别 百度OCR 的接口申请 https://blog.csdn.net/biao197/article/details/102907492

  5. python使用百度OCR接口识别图片文字

    调用百度的OCR接口进行识别 一.百度AI开放平台地址,进入创建 通用文字识别 应用(前提要先注册百度智能云账号) https://ai.baidu.com/tech/ocr?track=cp:ain ...

  6. 织梦主动提交_织梦CMS网站如何自动提交百度快速收录(详细教程)

    前不久,站长们发现百度搜索资源平台把链接提交"的功能改为"普通收录",同时新增了"快速收录"的功能.普通收录,我相信很多站长们都知道怎么去提交,但是快 ...

  7. Python使用百度OCR接口进行验证码图像识别

    上次从pytesseract软件及其python库入门了OCR的图像识别, 包括图像的读取.格式转换和图像处理,也进行了验证码的识别实验,包括验证码获取.登录验证以及不同图像处理的识别效果测试,具体内 ...

  8. 最新百度翻译接口JS逆向教程

    目标网址:百度翻译-200种语言互译.沟通全世界! 重要说明:文章教程仅供参考学习,请勿用于非法用途,否则后果自负. 目录 1.接口参数分析 2.全局搜索sign 3.加密逻辑分析

  9. Java调用百度OCR接口实现文字识别

    博主在项目开发中需要完成一个文字识别功能,由于之前有过使用百度云平台接口进行身份证识别的经历,因此这次也是自然而然的再次选择了百度AI平台,首先需要开通百度通用文字识别功能. 然后我们需要创建一个应用 ...

最新文章

  1. java中标签怎么用_Java中标签的使用
  2. 委托、多播委托(MulticastDelegate)
  3. Web应用里的HTTP参数污染(HPP漏洞)
  4. 哪家中国公司为Java 16贡献最多?Java第一大厂居然不是第一的...
  5. 动态规划走楼梯_动态规划问题为什么要画表格?
  6. 中小型局域网构建实践 PDF高清版
  7. PocketSphinx语音识别系统语言模型的训练和声学模型的改进
  8. (21)Spring Boot过滤器、监听器【从零开始学Spring Boot】
  9. ZXing生成多种不同样式的二维码
  10. Python画等高线以及标注
  11. NYOJ 个人刷题题解
  12. Java 常用工具类 - 校验银行卡号 BankCardUtils
  13. 黑马程序员视频加源码
  14. pr如何跳到关键帧_pr怎么跟踪?pr怎么做运动跟踪怎么用?
  15. jnhs中国的省市县区邮编坐标mysql数据表
  16. linux 添加系统启动,怎样把这个linux系统添加到启动选项?
  17. android系统版本卸掉,使用内置软件卸载最新版本的Android
  18. html 播放本地视频(获取磁盘文件url)
  19. c语言程序设计医院就医,C语言程序设计(医院信息管理系统)附源代码[精品].doc...
  20. 智汀智能家居普及篇——智能家居必备的功能控制系统

热门文章

  1. 数据结构知识点总结-树、二叉树、二叉树遍历、满二叉树、完全二叉树、查找二叉树、平衡二叉树、红黑树、B树、B+树
  2. 2020年,网红KOL营销到底要怎么做才算成功?我来谈谈
  3. 香港中文大学(深圳)吴保元教授招收人工智能全奖博士/博后/RA
  4. 企业微信接口开启收费模式,意在第三方生态健康发展
  5. mysql 二进制转字符串_将数据库的二进制转换为字符串
  6. KMS激活windows 2008序列号
  7. URL地址拼接中文乱码
  8. 使用 C# 开发智能手机软件:推箱子(十一)
  9. 理解cv2.waitKey
  10. c++请输入任意键继续