最后一章内容,主要是OCR的实例,很多都是和经验或者实际应用有关;看完了,总之,善始善终,继续加油!!

一、图像识别(店名识别)的步骤:

  图像文字识别应用所作的事是,从一张给定的图片中识别文字。这比从一份扫描文档中
识别文字要复杂的多。

  为了完成这样的工作,需要采取如下步骤:
  1.文字侦测(Text detection)——将图片上的文字与其他环境对象分离开来
  2.字符切分(Character segmentation)——将文字分割成一个个单一的字符
  3.字符分类(Character classification)——确定每一个字符是什么

可以用任务流程图来表达这个问题,每一项任务可以由一个单独的小队来负责解决:

二、滑动窗口

  滑动窗口是一项用来从图像中抽取对象的技术。假使我们需要在一张图片中识别行人,
首先要做的是用许多固定尺寸的图片来训练一个能够准确识别行人的模型。然后我们用之前
训练识别行人的模型时所采用的图片尺寸在我们要进行行人识别的图片上进行剪裁,然后将
剪裁得到的切片交给模型,让模型判断是否为行人,然后在图片上滑动剪裁区域重新进行剪
裁,将新剪裁的切片也交给模型进行判断,如此循环直至将图片全部检测完。

  一旦完成后,我们按比例放大剪裁的区域,再以新的尺寸对图片进行剪裁,将新剪裁的
切片按比例缩小至模型所采纳的尺寸,交给模型进行判断,如此循环。

  滑动窗口技术也被用于文字识别,首先训练模型能够区分字符与非字符,然后,运用滑
动窗口技术识别字符,一旦完成了字符的识别,我们将识别得出的区域进行一些扩展,然后
将重叠的区域进行合并。接着我们以宽高比作为过滤条件,过滤掉高度比宽度更大的区域
(认为单词的长度通常比高度要大)。下图中绿色的区域是经过这些步骤后被认为是文字的区域,而红色的区域是被忽略的。

  以上便是文字侦测阶段。 下一步是训练一个模型来完成将文字分割成一个个字符的任
务,需要的训练集由单个字符的图片和两个相连字符之间的图片来训练模型。

  模型训练完后,我们仍然是使用滑动窗口技术来进行字符识别。
  以上便是字符切分阶段。 最后一个阶段是字符分类阶段,利用神经网络、支持向量机
或者逻辑回归算法训练一个分类器即可。

三、获取大量数据和人工合成数据集(这里主要指字母识别中的数据集)的两种方法:

  1、没有已有样本:通常有很多字体库,我们可以采集同一个字符的不同种类字体,然后将这些字符加上不同的随机背景。

  2、少量已有样本:使用已有的样本,选取一个真实的样本,然后添加将此样本扭曲、旋转(人工变形)的数据,以此来扩大数据集。

  注:在决定扩大数据集之前需要考虑的问题:

    ① 需要先有一个低偏差的分类器,如果没有,可以通过增大特征数或者在神经网络中增大隐藏层单元数来解决

    ② 首先估计增加样本需要的工作量

  有关获得更多数据的几种方法:
    1.人工数据合成
    2.手动收集、标记数据
    3.众包

四、上限分析

  回到我们的文字识别应用中,我们的流程图如下:

  流程图中每一部分的输出都是下一部分的输入,上限分析中,我们选取一部分,手工提
供100%正确的输出结果,然后看应用的整体效果提升了多少。

  总结一下上面的意思,即通过人工干预,使某一个component的准确率人工达到100%,再使用这些数据训练,如果这一component的变化导致整体系统的系统变得很好,那么说明这个component值得花时间优化。

  反之,我们将某一component达到100%,系统性能仍没有提升很多,则说明这一component不值得我们花费精力改进。

转载于:https://www.cnblogs.com/sl0309/p/10629757.html

吴恩达机器学习笔记61-应用实例:图片文字识别(Application Example: Photo OCR)【完结】...相关推荐

  1. 吴恩达机器学习笔记整理(Week6-Week11)

    1. Week 6 1.1 应用机器学习的建议(Advice for Applying Machine Learning) 1.1.1 决定下一步做什么 到目前为止,我们已经介绍了许多不同的学习算法, ...

  2. 吴恩达机器学习笔记第一周

    第一周 吴恩达机器学习笔记第一周 一. 引言(Introduction) 1.1 欢迎 1.2 机器学习是什么? 1.3 监督学习 1.4 无监督学习 二.单变量线性回归(Linear Regress ...

  3. 【Nan‘s 吴恩达机器学习笔记】第八、九章 神经网络

    [Nan's 吴恩达机器学习笔记]第八.九章 神经网络 神经网络(Neural Networks) 8.1 非线性假设 8.2 模型表示 前向传播算法(Forward Propagation) 8.3 ...

  4. 吴恩达机器学习笔记整理(Week1-Week5)

    吴恩达机器学习笔记整理 1. Week1 1.1 什么是机器学习(What is Machine Learning) 1.2机器学习算法分类 1.3 单变量线性回归(Linear Regression ...

  5. 吴恩达机器学习笔记55-异常检测算法的特征选择(Choosing What Features to Use of Anomaly Detection)

    吴恩达机器学习笔记55-异常检测算法的特征选择(Choosing What Features to Use of Anomaly Detection) 对于异常检测算法,使用特征是至关重要的,下面谈谈 ...

  6. 吴恩达机器学习笔记:(四)矩阵、多元梯度下降

    吴恩达机器学习笔记 矩阵基础知识 矩阵逆运算 矩阵的转置 实践乘法 多元梯度下降 特征缩放 学习率α 矩阵基础知识 矩阵逆运算 矩阵的转置 实践乘法 多元梯度下降 特征缩放 学习率α 学习率的选择:

  7. 吴恩达机器学习笔记:(一)机器学习方法简介

    吴恩达机器学习笔记 Supervised Learning(监督学习) Unsupervised Learning(无监督学习) clustering 聚类算法 market segments 市场细 ...

  8. 吴恩达机器学习笔记week8——神经网络 Neutral network

    吴恩达机器学习笔记week8--神经网络 Neutral network 8-1.非线性假设 Non-linear hypotheses 8-2.神经元与大脑 Neurons and the brai ...

  9. 【经典】吴恩达——机器学习笔记001

    [经典]吴恩达--机器学习笔记001 机器学习(Machine Learning)笔记001 学习地址:[中英字幕]吴恩达机器学习系列课程 文字版参考及PPT来源:Coursera-ML-Andrew ...

最新文章

  1. 【硬核】秒杀活动技术方案,Redis申请32个G,被技术总监挑战了...
  2. CUDA out of memory. Tried to allocate 392.00 MiB (GPU 0; 10.76 GiB total capacity; 652.77 MiB alread
  3. BD云20MB/s不限速,随时下架!
  4. docker安装elasticsearch_Docker 安装 ElasticSearch
  5. SQL Server 查询数据库里所有表的行数
  6. 理解zookeeper的一致性及缺点
  7. atmega8 例程:T1定时器 CTC模式 方波输出
  8. 库克笑嘻嘻!苹果明年或将迎来继iPhone 6后第二次换机大潮
  9. docker 容器数据卷
  10. 【pandas】column变index,dataframe转置
  11. 【多目标优化求解】基于matlab金鹰算法求解多目标优化问题【含Matlab源码 188期】
  12. html5好看的注册页面设计,美观大气注册登录页面模板html源码
  13. Css属性:border边框,设置圆角,border-radius
  14. EUI组件之HScrollBar VScrollBar (动态设置滑块图片)
  15. python在家创业项目_8种可以让你在家创业的项目
  16. 靶场发展态势③美国防部赛博安全靶场(IAR/CSR)
  17. table表头和首列的表格固定-CSS实现的Table表头固定
  18. Adobe LiveCycle Designer
  19. 如何用在自己的网页中嵌入腾讯视频网页播放器播放一些文件
  20. amd锐龙笔记本cpu怎么样_AMD发布两款锐龙笔记本CPU

热门文章

  1. pythondjango图书_Django基础教程
  2. requestmapping默认是get还是post_编写Spring MVC控制器的14个技巧,你今天get到了吗?...
  3. android仿qq聊天项目点评,android 实现qq聊天对话界面效果
  4. 基于头皮脑电的癫痫分类
  5. 统计学习方法笔记(五)-线性可分支持向量机原理及python实现
  6. oculus rift 开发入门
  7. 别忽视新冠轻症,它会损害你的记忆力
  8. 华为自研搜索引擎曝光:「花瓣」虽小,但要替代谷歌
  9. 孙正义太难了:去年亏125亿美元,15家投资公司要破产,二期愿景基金不得不暂停...
  10. 神仙打架激辩深度学习:LeCun出大招,马库斯放狠话,机器学习先驱隔空“互怼”...