TextDragon_An End-to-End Framework for Arbitary Shaped Text Spotting
简介
第一个做对于弯曲文本端到端的检测识别的网络。检测的灵感来自于Text snake,识别是CNN加CTC。在检测和识别的中间使用了自己提出的一个特征转换器RoISlide。然后这个模型可以仅仅使用单词和单词的中心线的标注进行弱监督的训练。
检测
TextSnake使用的是园来表示文本,而这个方法使用长方形来表示。然后提取出的特征也是多尺度的叠加。检测分为起来那个模块,一个是中心线检测模块,一个是文本框回归模块。中心线检测模块训练的时候,还加入了了OHEM的方法。Local Box Regression模块回归文本的高度和角度。
特征转换RoISlide
RoISlide将全部的文字特征按照序列的一个接一个地转换为轴对称的特征。这个操作由两部分组成:首先对于按照规则将长方形的文本框排列在文本中心线上,然后使用LTN(Local Transformer Network)转换特征。LTN和STM不同,是局部特征的转换。
文本识别模块
就是类crnn的方法。
TextDragon_An End-to-End Framework for Arbitary Shaped Text Spotting相关推荐
- TextDragon: An End-to-End Framework for Arbitrary Shaped Text Spotting阅读笔记
摘要 本文提出一种用来制造文本检测与识别关系的可微运算RoISlide,使模型成为端到端模型.本文在两个弯曲文本数据集CTW1500和Total-Text上的表现达到最佳,在常规文本数据集ICDAR2 ...
- An Efficient Joint Training Framework for Robust Small-Footprint Keyword Spotting(2020)
一种用于鲁棒性小足迹关键词识别的高效联合训练框架 摘要 对噪声的鲁棒性对于现实环境中的关键字识别(KWS)至关重要.为了提高鲁棒性,一种合理的方法是首先采用语音增强模型对噪声语音进行增强.然而,目前的 ...
- [水文]论文极简记录
分割 Pyramid vision transformer: A versatile backbone for dense prediction without convolutions condit ...
- hadoop+海量数据面试题汇总(一)
hadoop面试题 Q1. Name the most common InputFormats defined in Hadoop? Which one is default ? Following ...
- 文本检测最近文章检索(1)
期刊 1)Evaluating and improving lexical resources for detecting signs of depression in text 评价和改进词汇资源, ...
- 【ACM 2020 - Text Recognition in the Wild:A Survey】OCR识别综述
Introduction 1. 推动基于深度学习的STR发展三要素: (1)先进的硬件系统:高性能计算支持训练大规模识别网络 (2)基于深度学习的STR算法能自动进行特征学习 (3)STR应用需求旺盛 ...
- ASP.NET 中的正则表达式
引言 Microsoft®.NET Framework 对正则表达式的支持是一流的,甚至在 Microsoft® ASP.NET 中也有依赖正则表达式语言的控件.本文介绍了深入学习正则表达式的基础知识 ...
- CVPR 2020 论文开源项目一页看尽,附代码论文
十三 发自 凹非寺 量子位 报道 | 公众号 QbitAI CVPR 2020中选论文放榜后,最新开源项目合集也来了. 本届CPVR共接收6656篇论文,中选1470篇,"中标率" ...
- 大合集!80 篇 CVPR2020 论文分方向整理: 目标检测/图像分割/姿态估计等(附链接&下载)...
来源:极市平台 本文约2500字,建议阅读5分钟 本文整理和分类80篇CVPR2020论文. 标签:深度学习 CVPR2020在2月24日公布了所有接受论文ID,从论文ID公布以来,我们一直在对CVP ...
最新文章
- php中使用mysql的视图_MYSQL中视图的用法介绍(代码示例)
- C语言再学习 -- Xargs用法详解
- BOOST_TEST_GT和BOOST_TEST_GE的用法
- ASP.NET Core WebAPI中使用JWT Bearer认证和授权
- 【Dreamweaver】前端初学者开发利器Dreamweaver快捷键大全
- 数学竖式排版中不为人知的技巧
- 【VRP】基于matlab改进的模拟退火和遗传算法求解车辆路径规划问题【含Matlab源码 343期】
- 文本自动生成研究进展与趋势之文本到文本的生成
- win中使用labelImg标注图片
- tcp too many orphaned sockets 问题引发的思考
- wpf 三种 loading 样式
- tp5微信公众号发送模板消息
- 直播系统app源码,简洁好看的登录页面
- android音频系统(5):AudioService之音频焦点
- UGC、PGC、OGC的概念
- 关于 DWave dimod 使用详解
- 你说的H5到底是什么,跟Html有什么关系,能吃吗
- MATLAB中的set函数
- 三相桥式全控整流电路matlab仿真实验,三相全控桥式整流电路仿真实验
- python黑科技自动p图_自动P图神器来了,这些逆天小程序!
热门文章
- ubuntu下使用OBS开斗鱼直播
- 斗地主排序以及音乐管理系统
- 增加了小微企业的成本W--q马戏团fc游戏
- 程序猿的困惑之为什么学了很多都记不住?
- 【论文写作】Word中公式快捷输入方式
- harmonyos公测版v2.0安装,HarmonyOS2.0Beta版本-HarmonyOS2.0Beta官方版本安装预约 v1.0.0-优盘手机站...
- 2021年安全员-C证(陕西省)及安全员-C证(陕西省)复审模拟考试
- Android studio app项目红叉无法编译
- Xilinx Zynq移植过程备忘录
- codeforces-1395D Boboniu Chats with Du【前缀和】【枚举】