百度OCR接口使用详细教程
如何把图片、PDF文件中的文字进行识别提取,这个问题仿佛困扰了我们很多年,直到现在,当急需OCR功能时也没有一个快速、高效且免费的在线工具或软件能马上拿来用。
前阵子的工作中正好有这个需求,我要把一篇PDF格式论文中的表格内容提取出来,供数据可视化使用。这些表格包含少量文字和大量数字,说多不多,说少也不少,人工提取数字出错率比较高。这时候!我又想找个“在线OCR工具”了!
一些号称在线快速OCR的网页,广告横飞且速度慢,上传文件后无反应,大都是标题党骗点击赚广告费的…… 个别看起来比较正经的OCR软件,全都收费,由于我的需求不多,而且就用这么一两次,还是不愿意花这个钱的。这时候我突然想起来一直飘在广告位的「百度文字识别OCR」,万一有试用可以白嫖一下呢。果然有免费额度赠送!
除通用场景文字识别外,还提供卡证文字识别、财务票据文字识别、医疗票据文字识别、汽车场景文字识别、教育场景文字识别、iOCR自定义模板文字识别等OCR服务场景,每个类别下还有细分的服务API,但除通用场景以外的大都不提供免费额度。
于是我试用了一下四种通用文字识别的API,按照官方的文档一步步来就可以了,这里我简化一下使用流程,仅需三步,十分钟满足你的OCR需求!
第一步,注册一个百度账号(https://passport.baidu.com/v2/?reg),如果已有请直接登陆。登录后点击页面中的「创建应用」:
“应用名称”随便取一个就好,接口选择用默认就可以(通用文字识别服务已作默认勾选),应用归属选“个人”,最后简单写一下“应用描述”即可。
填写完毕后,点击“立即创建”就可以了。
点击“返回应用列表”,点击“显示”查看所创建应用的 Secret Key:
至此,API 就申请好了。这里申请到的 API Key 和 Secret Key 复杂存好,等下要在脚本中调用。
第二步,准备好你的数据,图片形式即可,以这张图举例(随手拍一张书页内容):
最后一步,修改脚本中的 API_KEY 和 SECRET_KEY(第一步在应用列表里复制来的),然后修改你需要进行识别的图片路径 file_content,改完这三个参数,就可以运行脚本啦!
识别输出的文字结果如下:
完整的代码脚本可以参考官方指南(https://cloud.baidu.com/doc/OCR/s/dk3iqnq51),也可以参考我分解的 Jupyter 版,关注公众号「数据池塘」,回复「百度OCR」即可获取完整代码。
希望可以帮助到大家,祝顺利!
百度OCR接口使用详细教程相关推荐
- 调用百度OCR接口识别身份证 微信小程序
申请百度AI账号获取百度OCR接口API Key和Secret Key 申请地址: http://ai.baidu.com/?track=cp:aipinzhuan|pf:pc|pp:AIpingta ...
- 火山PC使用百度OCR接口识别文字
本源码转载自利快云https://www.lkuaiy.com/ 火山PC使用百度OCR接口识别文字 一.需要调用的模块 视窗基本类 MFC界面基本类 火山模块 二.百度OCR使用前准备 百度OCR是 ...
- cms是什么意思啊_织梦CMS网站如何自动提交百度快速收录(详细教程)
前不久,站长们发现百度搜索资源平台把链接提交"的功能改为"普通收录",同时新增了"快速收录"的功能.普通收录,我相信很多站长们都知道怎么去提交,但是快 ...
- 百度文字识别 百度OCR接口申请
1.百度文字识别 百度OCR 的接口申请 https://blog.csdn.net/biao197/article/details/102907492
- python使用百度OCR接口识别图片文字
调用百度的OCR接口进行识别 一.百度AI开放平台地址,进入创建 通用文字识别 应用(前提要先注册百度智能云账号) https://ai.baidu.com/tech/ocr?track=cp:ain ...
- 织梦主动提交_织梦CMS网站如何自动提交百度快速收录(详细教程)
前不久,站长们发现百度搜索资源平台把链接提交"的功能改为"普通收录",同时新增了"快速收录"的功能.普通收录,我相信很多站长们都知道怎么去提交,但是快 ...
- Python使用百度OCR接口进行验证码图像识别
上次从pytesseract软件及其python库入门了OCR的图像识别, 包括图像的读取.格式转换和图像处理,也进行了验证码的识别实验,包括验证码获取.登录验证以及不同图像处理的识别效果测试,具体内 ...
- 最新百度翻译接口JS逆向教程
目标网址:百度翻译-200种语言互译.沟通全世界! 重要说明:文章教程仅供参考学习,请勿用于非法用途,否则后果自负. 目录 1.接口参数分析 2.全局搜索sign 3.加密逻辑分析
- Java调用百度OCR接口实现文字识别
博主在项目开发中需要完成一个文字识别功能,由于之前有过使用百度云平台接口进行身份证识别的经历,因此这次也是自然而然的再次选择了百度AI平台,首先需要开通百度通用文字识别功能. 然后我们需要创建一个应用 ...
最新文章
- java中标签怎么用_Java中标签的使用
- 委托、多播委托(MulticastDelegate)
- Web应用里的HTTP参数污染(HPP漏洞)
- 哪家中国公司为Java 16贡献最多?Java第一大厂居然不是第一的...
- 动态规划走楼梯_动态规划问题为什么要画表格?
- 中小型局域网构建实践 PDF高清版
- PocketSphinx语音识别系统语言模型的训练和声学模型的改进
- (21)Spring Boot过滤器、监听器【从零开始学Spring Boot】
- ZXing生成多种不同样式的二维码
- Python画等高线以及标注
- NYOJ 个人刷题题解
- Java 常用工具类 - 校验银行卡号 BankCardUtils
- 黑马程序员视频加源码
- pr如何跳到关键帧_pr怎么跟踪?pr怎么做运动跟踪怎么用?
- jnhs中国的省市县区邮编坐标mysql数据表
- linux 添加系统启动,怎样把这个linux系统添加到启动选项?
- android系统版本卸掉,使用内置软件卸载最新版本的Android
- html 播放本地视频(获取磁盘文件url)
- c语言程序设计医院就医,C语言程序设计(医院信息管理系统)附源代码[精品].doc...
- 智汀智能家居普及篇——智能家居必备的功能控制系统