ocr图片文字识 php,php实现ocr文字识别
OCR的百度定义 (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
作为一个工程师,在实际编程中,可能需要把图片中的文字显示出来,这就需要用到ocr技术。因为php开发,所以优先选择php,找了php的ocr扩展测试了下,结果发现不可用(地址:http://sourceforge.net/projects/phpocr.berlios)?网上也看了很多朋友的demo,基本上原理都是对图片分解成0,1矩阵,然后根据特征,转化成相应的字符串。测试几个都是不可行的。然后看到别人说PHP搞OCR的很少,也不适合,语言效率太低,这种算法需要很高的效率。可以尝试C,MATLAB 等的OCR算法。搞matlab的玩OCR这类偏算法的很多。
写了个玩下:
header("Content-type: text/html; charset=utf-8");
function curl($img) {
$ch = curl_init();
$url = 'http://apis.baidu.com/apistore/idlocr/ocr'; //百度ocr api
$header = array(
'Content-Type:application/x-www-form-urlencoded',
'apikey:69c2ace1ef297ce88869f0751cb1b618',
);
$data_temp = file_get_contents($img);
$data_temp = urlencode(base64_encode($data_temp));
//封装必要参数
$data = "fromdevice=pc&clientip=127.0.0.1&detecttype=LocateRecognize&languagetype=CHN_ENG&imagetype=1&image=".$data_temp;
curl_setopt($ch, CURLOPT_HTTPHEADER , $header); // 添加apikey到header
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, $data); // 添加参数
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch , CURLOPT_URL , $url); // 执行HTTP请求
$res = curl_exec($ch);
if ($res === FALSE) {
echo "cURL Error: " . curl_error($ch);
}
curl_close($ch);
$temp_var = json_decode($res,true);
return $temp_var;
}
$wordArr = curl('4.jpg');
if($wordArr['errNum'] == 0) {
var_dump($wordArr);
} else {
echo "识别出错:".$wordArr["errMsg"];
}
测试了几张图片,准确度还是蛮高的。百分百的话,是不现实的~
ocr图片文字识 php,php实现ocr文字识别相关推荐
- OCR图片文字识别工具,识别率高且免费(电脑手机版)
首先,展示两个文字编辑的场景,这样的场景每天都在我们身边发生. 场景一.在图书馆.书店.机场.火车上.公交地铁上.旅行的路上.听音乐--发现一段不错的文字或歌词想要做书摘笔记,或者编辑成短文发到微博. ...
- 一篇文章搞定百度OCR图片文字识别API
一篇文章搞定百度OCR图片文字识别API https://www.jianshu.com/p/7905d3b12104 转载于:https://www.cnblogs.com/chongdongxia ...
- java 获取文件大小_利用百度AI OCR图片识别,Java实现PDF中的图片转换成文字
序言:我们在读一些PDF版书籍的时候,如果PDF中不是图片,做起读书笔记的还好:如果PDF中的是图片的话,根本无法编辑,做起笔记来,还是很痛苦的.我是遇到过了.我们搞技术的,当然得自己学着解决现在的痛 ...
- 比Everything更强的文件搜索工具,支持文件名、文件内容和文件图片上的文字搜索,文件内容搜索工具,文件图片内容搜索工具,OCR图片文本识别搜索,文件快速搜索工具,文字识别文件搜索工具
Windows自带的文件搜索功能想必不需要过多吐槽,搜索速度简直是在龟爬,所以小编很早之前就在用Everything进行文件搜索了,不过,今天的主角不是它,而是比它更更更更更强的一款软件! 这款软件适 ...
- 阿里云 OCR 图片文字识别接口使用案例(java)
阿里云 OCR 图片文字识别接口使用案例(java) 阿里云官方接口文档 前期需要完成 购买阿里云服务 购买服务 可以购买测试服务.每个阿里云用户可以购买1次免费的500次接口请求进行测试 购买完成之 ...
- 图片上的文字转换成word-捷速OCR文字识别
图片上的文字转换成word-捷速OCR文字识别 这几天公司需要我将一片旅游书籍上的几篇关于旅游的文章进行编辑,做一个相关方面的专题,这可就烦到我了,专题方面的设计对我来说并不难,难的就是我必须把那几篇 ...
- OCR图片文字识别,人工手动图片标注软件安装过程
OCR图片文字识别,人工手动图片标注软件安装过程,本章关注标注软件的安装,启动过程 1. 下载 anaconda anaconda 下载慢的问题: 使用国内镜像地址下载: https://mirro ...
- 【免费-开源-简洁】天若OCR文字识工具使用介绍
[免费-开源-简洁]天若OCR文字识工具使用介绍 本地版,(无需网络):https://gitee.com/wanglifree/tianruoocr-cl/releases 天若OCR文字识别5.0 ...
- TOOLFK工具-在线OCR图片文字识别工具
本文要推荐的[TOOLFK]在线OCR图片文字识别工具 ,提供图像文字识别,提取图片文字,OCR图片文字识别,图片转文字,把图片拖拽到上传框中自动上传识别,图片文件最大3M 網站名稱:ToolFk 網 ...
最新文章
- android 自定义event,Android运用onTouchEvent自定义滑动布局
- MySQL探索(一):B-Tree索引
- 关于CAN总线的位时间/同步段/传播时间段/相位缓冲段/采样点
- 界址点号_界址点及四至优化
- 【VBA编程】10.自定义集合
- java 类加载 双亲委派_Java类加载器和双亲委派机制
- dom兼容性问题3 元素操作
- Spring data JPA图文教程(一)
- 魅族 刷机android 6.0,魅族MX6如何刷机升级 魅族MX6升级方法【详解】
- 电机选型计算电机转动惯量、启动转矩和额定转速
- 2020年中国不支持苹果_苹果2020年9月事件提示
- 徐思201771010132 《面向对象程序设计(java)》课程学习总结
- Unity 利用射线实现弹孔效果
- 位运算相关题目-一些小trick 1bit代表独立数字 求只出现一次的数字 无进位n进制数 n(-n) Boyer-Moore 投票算法 n(n-1)
- [Rotation Transform] 旋转变换
- php禁用gopher协议,SSRF攻击-运用gopher协议构造POST包--emmmm(http://10.112.68.215:10004/index.php?action=login)...
- 2.Oracle数据库SQL开发之 SQL DEVELOPER使用
- javaweb——>个人博客项目
- GV7704中文资料 hd-vlc
- Java 支付宝手机网站支付下单 支付回调 及订单查询实现