写在前面,最近两天在做ocr识别相关内容,趁有时间来记录一下.本文的代码是基于Pytorch框架mobilenetv3基础网络的CRNN+CTC网络实现 文字检测与识别介绍 文字识别也是图像领域一个常见问题.然而,对于自然场景图像,首先要定位图像中的文字位置,然后才能进行识别. 所以一般来说,从自然场景图片中进行文字识别,需要包括2个步骤: 文字检测:解决的问题是哪里有文字,文字的范围有多少 文字识别:对定位好的文字区域进行识别,主要解决的问题是每个文字是什么,将图像中的文字区域进转化为字符信息