文章目录

  • 赛题介绍
  • 解题思路
    • 1. 定长字符识别
    • 2.不定长字符识别
    • 3. 检测再识别

赛题介绍

赛题以街道字符为为赛题数据(比赛地址),该数据来自收集的SVHN街道字符,训练集数据包括3W张照片,验证集数据包括1W张照片,每张照片包括颜色图像和对应的编码类别和具体位置。

标签数据介绍:

在比赛数据(训练集和验证集)中,同一张图片中可能包括一个或者多个字符,因此在比赛数据的JSON标注中,会有两个字符的边框信息

解题思路

一共三种解题思路:

1. 定长字符识别

可以将赛题抽象为一个定长字符识别问题,在赛题数据集中大部分图像中字符个数为2-4个,最多的字符 个数为6个。因此可以对于所有的图像都抽象为6个字符的识别问题,字符23填充为23XXXX,字符231填充为231XXX。经过填充之后,原始的赛题可以简化了6个字符的分类问题。在每个字符的分类中会进行11个类别的分类,假如分类为填充字符,则表明该字符为空。

本次学习采用的是这种办法。

2.不定长字符识别

在字符识别研究中,有特定的方法来解决此种不定长的字符识别问题,比较典型的有CRNN字符识别模型。之后会对这种方法进行尝试。

3. 检测再识别

在赛题数据中已经给出了训练集、验证集中所有图片中字符的位置,因此可以首先将字符的位置进行识别,利用物体检测的思路完成。此种思路需要构建字符检测模型SSD或者YOLO,对测试集中的字符进行识别。

本文章来源Datewhale组队学习。

零基础入门CV赛事-Task1 赛题理解相关推荐

  1. 零基础入门语义分割——Task1 赛题理解

    文章目录 一.赛题数据 二.数据标签 三.评价指标 四.读取数据 比赛地址:零基础入门语义分割-地表建筑物识别 一.赛题数据 遥感技术已成为获取地表覆盖信息最为行之有效的手段,遥感技术已经成功应用于地 ...

  2. 零基础入门CV赛事,理论结合实践

    Datawhale干货 作者:阿水,Datawhale成员 本次分享的背景是,Datawhle联合天池发布的学习赛:零基础入门CV赛事之街景字符识别.本文以该比赛为例,对计算机视觉赛事中,赛事理解和B ...

  3. 零基础入门CV赛事- 街景字符编码识别

    零基础入门CV赛事- 街景字符编码识别 Task01 学习目标 数据介绍 Task01任务内容 数据读取 解题思路 学习目标 熟悉计算机视觉赛事 完成典型的字符识别问题 掌握CV领域赛事的编程和解题思 ...

  4. Datawhale 零基础入门CV赛事-Task4 模型训练与验证

    文章目录 1.构造验证集 2.模型训练与验证 1.构造验证集 在机器学习模型(特别是深度学习模型)的训练过程中,模型是非常容易过拟合的.深度学习模型在不断的训练过程中训练误差会逐渐降低,但测试误差的走 ...

  5. 阿里云天池竞赛-零基础入门CV赛事-Task4 模型训练与验证

    在上一章节我们构建了一个简单的CNN进行训练,并可视化了训练过程中的误差损失和第一个字符预测准确率,但这些还远远不够.一个成熟合格的深度学习训练流程至少具备以下功能: 在训练集上进行训练,并在验证集上 ...

  6. 零基础入门CV赛事—街景字符编码识别—task2数据读取与扩增

    数据读取与扩增 上节学习了街景字符编码识别的解题思路,让我们对本赛题有了基本的idea,这节在定长字符编码的思路基础上学习读取数据和数据扩增. 图像数据读取 由于赛题数据是图像数据,赛题的任务是识别图 ...

  7. Datawhale 零基础入门CV赛事-Task3 字符识别模型

    文章目录 1.CNN实现 2.Pytorch实现CNN 3.使用ImangeNet预训练模型 1.CNN实现 CNN基础 2.Pytorch实现CNN 构建一个简单的CNN模型和训练过程 import ...

  8. Datawhale 零基础入门CV赛事-Task5 模型集成

    这里写目录标题 1.集成学习方法 2.深度学习中的集成学习 Dropout TTA Snapshot 1.集成学习方法 在机器学习中的集成学习可以在一定程度上提高预测精度,常见的集成学习方法有Stac ...

  9. Datawhale 零基础入门CV赛事-Task2 数据读取与数据扩增

    文章目录 数据读取 图像读取 1.pillow 2.opencv 数据读取 数据扩增 数据读取 导入需要的包以及文件路径 import json, glob import numpy as np fr ...

最新文章

  1. 关于阻塞I/O 非阻塞I/O 同步I/O 异步I/O epoll select的学习
  2. elasticsearch源码分析之search模块(server端)
  3. 监督学习应用与梯度下降
  4. shell条件测试操作 if分支 for循环 while 循环
  5. 云炬金融每日一题20210906
  6. Linux下精准踢掉登录用户-pkill命令
  7. 死磕JDK源码之String
  8. 基于JAVA+SpringMVC+Mybatis+MYSQL的在线超市管理系统
  9. 百度缺的不是狼性,而是鲁滨逊
  10. 负载均衡—实现配置篇(Nginx)
  11. springboot elementui vue商城微信小程序源码(毕设)开发讲解
  12. 电阻式湿度传感器原理
  13. 客户成功服务市场现状研究分析报告 -
  14. 天翼云监控客户pc端及手机端下载安装教程
  15. 摩托车高级驾驶员辅助系统(ADAS)的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告
  16. layUI基本使用2(js)
  17. 物联网SIM卡和SIM卡真的不是一回事
  18. 网管好助手--PSTOOLS
  19. Qt使用QAudioInput、QAudioOutput实现局域网的音频通话
  20. 计算机辅助翻译stm,计算机辅助翻译报告.docx

热门文章

  1. 文件名的查找——find
  2. 《配置管理最佳实践》——2.12 构建工程的前景
  3. 050医疗项目-模块五:权限设置-第三方系统的接入
  4. Centos7安装RocketMQ及配置测试
  5. 《Java并发编程实践》读书笔记
  6. Oracle数据库的四种启动方式
  7. mysql分组统计查询 张三_MySQL 怎样分组查询
  8. linux 去掉登陆密码吗,Linux 清除 Windows用户登录密码
  9. 掩膜裁剪tif步骤_使用Arcgis掩膜剪裁工具剪裁全球气候数据为我国范围,并转换为ASC格式...
  10. oracle 导出写入文件失败怎么办,编辑dmp文件解决导入导出问题(oracle 922错误 ,缺少或无效选项)...