搜狗的验证码挺有趣的,干扰给满分,今天不做方案,只做分享

【核心】重中之重

样本下载地址:[https://bbs.nightteam.cn/thread-149.htm](https://bbs.nightteam.cn/thread-149.htm)

一共17W样本,性能再差的网络也能识别的很好了

训练并没有什么注意事项,但是印象中这个验证码发生过一次改动,尺寸修改,那么如何应对这种变化而不用二次训练呢?这才是今天的主题

【提升模型的泛化能力——适应尺寸变化】

我们的样本尺寸是单一的,通过观察,我们得知,如果通过裁剪修改图片比例容易丢失重要内容的像素,那么我们可以反其道通过填充模拟:
下面列举几个方案:

方案一:

可以通过复制【红色区域】向上延展图片内容。——四个方向同理

方案二:
图片拼接:怎么说呢,我们可以手动筛选出部分字符,做一个图像生成器,旋转放大扭曲等等之后拼接于首位或末尾

方案三:
生成一部分尺寸不一,字体相近的验证码按一定的权重和样本混合训练

训练流程

可以参见:
https://blog.csdn.net/kerlomz/article/details/86706542

【含17w样本】搜狗验证码识别相关推荐

  1. 2021年11月最新搜狗验证码识别,6位全对正确率高达96%

    训练数据准备 标记数据是最花费时间的事情.最开始手工标记验证码1万条,训练后正确率在50%左右.然后写写代码使用这种低正确率的去自动标记.使用搜狗自动验证,来实现自动标记.逐渐积累数据量,后期只需要人 ...

  2. 【Matlab验证码识别】遗传算法和最大熵优化+大津法(OTSU)+自定义阈值数字验证码识别【含GUI源码 1694期】

    一.代码运行视频(哔哩哔哩) [Matlab验证码识别]遗传算法和最大熵优化+大津法(OTSU)+自定义阈值数字验证码识别[含GUI源码 1694期] 二.matlab版本及参考文献 1 matlab ...

  3. 易语言python识别图片验证码_TensorFlow实战:验证码识别 (少样本高精度)

    项目地址:https://github.com/kerlomz/captcha_trainer 1. 前言本项目适用于Python3.6,GPU>=NVIDIA GTX1050Ti,原maste ...

  4. 基于CRNN的文本字符交易验证码识别--Paddle实战

    基于CRNN的文本字符验证码识别 本项目链接,欢迎大家Fork:https://aistudio.baidu.com/aistudio/projectdetail/3501451 Paddle学习资料 ...

  5. 国税局发票查验中英文验证码识别,识别率95.2%

    关于国税局发票验证码识别,应该是大多数从事发票查验的人员比较头疼的问题,但实际上发票验证码识别问题严格而言较为简单. 一.背景 首先,需要了解清楚国税局的发票验证码构成,如下图,正常而言都是中文.数字 ...

  6. 国税局发票查验中英文验证码识别最新版,识别率99.9%

    采用深度学习进行发票查验验证码模型的训练,在我电脑上模型训练的环境如下: 显卡:RTX 2080TI tensorflow-gpu:2.5.3 1 训练集和测试集的准备 发票查验的验证码分为4种类型, ...

  7. 【DCIC2022】科技金融子赛道验证码识别0.65+ baseline

    刚开始做OCR比赛,周末补了下相关知识,主要参考内容来自[官方]十分钟掌握PaddleOCR使用,不过目前分数不是很高,0.65+,主要存在过拟合问题,大家可以再修改配置或者模型再微调下,这里主要给大 ...

  8. deep learning 淘宝验证码识别

    2014年底验证码识别称为一个热门的话题,各种12306抢票软件层出不穷,百度,搜狗,360等公司推出了火车票抢票软件.在给人们带来便利的同时,当然给黄牛有了可乘之机.下面介绍几种我们常见的验证码. ...

  9. python 验证码识别示例(二) 复杂验证码识别

     在这篇博文中手把手教你如何去分割验证,然后进行识别. 一:下载验证码 验证码分析,图片上有折线,验证码有数字,有英文字母大小写,分类的时候需要更多的样本,验证码的字母是彩色的,图片上有雪花等噪点,因 ...

最新文章

  1. python numpy加速 cupy
  2. (九)JS-WEB-API(DOM、BOM、事件、Ajax、存储)【每个工程师必须熟练掌握的技能】
  3. 系统鸿蒙生态链,任正非透露鸿蒙系统细节,比安卓速度快60%,两三年建好生态链...
  4. .NET MVC Scripts.Render 上下文不存在问题解决方法
  5. python显示乱码_python2显示乱码问题实战详解
  6. kafka启动命令_Kafka入门
  7. 魔兽世界终端服务器,《魔兽世界》怀旧服数据已上传服务器:登录画面引人怀念...
  8. 《流畅的Python》读书笔记——Python一等函数
  9. 20200127每日一句
  10. JSP中使用JSP模板
  11. python第三方插件登录网易音乐_基于 Python3 的网易云音乐下载器(支持嵌入专辑封面等 ID3-Tags 信息)...
  12. ubuntu 深度音乐播放器
  13. 使用xshell上传文件
  14. 再见2018,你好2019!
  15. 写的不错的《活着》的书评
  16. 大掌门2显示服务器繁忙,大掌门2新手攻略_游戏功能详细攻略(新手攻略二)_软吧...
  17. pycharm——python调用dubbo接口返回句柄无效(Connection dropped:socket connection error:句柄无效)
  18. 常见的10大超参数优化库
  19. else用法的一个小细节
  20. ACC算法学习笔记(六):ASPICE开发流程

热门文章

  1. PostgreSQL中的json解析
  2. 在图片的左上角加上一个图片标签
  3. 分享如何做好Instagram营销
  4. 复杂网络鲁棒性以及节点攻击(随机攻击、蓄意攻击)的相关介绍与代码程序实现
  5. 药一点医疗管理软件供应商—诊所管理系统
  6. Debian利用现有软件包或者光盘镜像搭建本地软件源
  7. python bp神经网络的库_Python_BP神经网络实现
  8. Linux下的tty和pts
  9. 前端Emmet插件使用
  10. 电动车控制器c语言编程,电动车控制器C语言源代码.docx