文字点选识别&验证码识别


Warning!请保证本项目仅用于研究学习!感谢配合支持!

项目地址:
https://github.com/youfengyouyang/Spider_Captcha

本文使用技术栈:

EfficientNet + pytorch + yolov3
环境配置十分简单,解决大部分深度学习的同学环境问题困扰!适用于Linux windows mac 系统!

About this paper:

 分享一下易盾的文字点选识别,其中包括验证码模型,和7w+文字数据集,目前识别率在80左右,当作一个小练习,后续有数据集的同学愿意分享,可以接着训练该模型,由于模型和数据集比较大,就分享在QQ群文件里了,有需要的可以进群一起交流!

About Captcha:

网易易盾、极验等主流验证码破解。
已更新极验文字点选、极验滑动、极验语序、极验九宫格、易盾文字、易盾图标、易盾滑动、易盾乱序还原拼图、税务红黄蓝验证码、梦幻西游8位汉字识别、多种字符验证码。

其验证码类型图片已经放到captcha目录下!


About javascript:

To learn about basic! learn it with us! QQ群:1126310403


About updated:

关于解决类似极验文字点选验证码的两套框架!

一、目标检测框架
二、文字识别框架

易盾文字点选验证码模型训练思路!

一、label_image 标注文字位置约400左右
二、pytorch + yolov3 训练位置预测模型
三、根据预测位置裁剪汉字图片
四、pytorch + CNN 深层神经网络识别汉字
总结:大部分的验证码用目标检测+卷积神经网络是都能搞定的!如果类似易盾图标点选就可以减少数据集,使用孪生网络进行预测!

About share:

验证码的识别的关键影响因素跟数据集的质量和数量影响很大!所以我也希望大家能共同一起分享数据集!


About install:

很多github上都有讲Linux系统的,本文以windows为例!
  • pip install torch1.4.0+cpu torchvision0.5.0+cpu -f https://download.pytorch.org/whl/torch_stable.html
  • pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
  • pip install git+https://github.com/philferriere/cocoapi.git#subdirectory=PythonAPI
  • 本套识别系统环境搭建十分简单!如果使用cuda的高级玩家,把pytorch的版本换下就ok
  • pytorch环境安装链接
  • 安装完毕!启动captcha_server.py 就ok!调用实例在api_requests.py里面!
  • 由于方便大家下载模型和数据集!已经上传至QQ群:1126310403 群文件!

About contact:

欢迎技术交流:923185571@qq.com

QQ群:1126310403

QQ:923185571

商务合作VX:spider_captcha

具体代码详情链接见github: github地址
如果觉得我分享的质量觉着满意,麻烦给个star! _ thank you!也是每个创作者继续分享的动力!fighting!

文字点选识别验证码识别相关推荐

  1. 文字点选行为验证码(KgCaptcha快速入门)

    文字点选行为验证码 按顺序点击图中文字,全新行为验证,安全性极高,保障验证安全 行为验证码采用嵌入式集成方式,接入方便,安全,高效.抛弃了传统字符型验证码展示-填写字符-比对答案的流程,采用验证码展示 ...

  2. 文字点选行为验证码生成器

    click-captcha-server 服务端(Nodejs)的文字点选行为验证码生成/验证器(仅可验证点选坐标是否正确),可自定义背景,字体,文字集等. 无前端sdk支持(demo有前端的代码示例 ...

  3. python点触图形验证码识别_GitHub - AaronJny/captcha_detection: 点选式验证码识别方案...

    方案要点: 点选式验证码的一般解决流程 如何使用 xyolo 训练自己的目标检测模型 不借助 OCR 功能解决中文验证码的识别问题 爬虫,反爬虫,反反爬虫--一个无限循环. 验证码是反爬虫手段中的常用 ...

  4. 如何通过 Serverless 轻松识别验证码?

    作者 | 江昱 来源 | Serverless 公众号 前言 Serverless 概念自被提出就倍受关注,尤其是近些年来 Serverless 焕发出了前所未有的活力,各领域的工程师都在试图将 Se ...

  5. web自动化之验证码识别解决方案

    验证码识别解决方案 对于web应用程序来讲,处于安全性考虑,在登录的时候,都会设置验证码,验证码的类型种类繁多,有图片中辨别数字字母的,有点击图片中指定的文字的,也有算术计算结果的,再复杂一点就是滑动 ...

  6. 验证码识别的原理python_Python验证码识别处理实例

    一.准备工作与代码实例 1.PIL.pytesser.tesseract (1)安装PIL:下载地址:http://www.pythonware.com/products/pil/(CSDN下载) 下 ...

  7. cnn验证码识别代码_中文项目:快速识别验证码,CNN也能为爬虫保驾护航

    原标题:中文项目:快速识别验证码,CNN也能为爬虫保驾护航 机器之心专栏 作者:Nick Li 随着卷积网络的推广,现在有各种各样的快捷应用,例如识别验证码和数学公式等.本文介绍了一个便捷的验证码识别 ...

  8. python神经网络库识别验证码_基于TensorFlow 使用卷积神经网络识别字符型图片验证码...

    本项目使用卷积神经网络识别字符型图片验证码,其基于TensorFlow 框架.它封装了非常通用的校验.训练.验证.识别和调用 API,极大地减低了识别字符型验证码花费的时间和精力. 项目地址:http ...

  9. python验证码识别算法_Python网站验证码识别

    0x00 识别涉及技术 验证码识别涉及很多方面的内容.入手难度大,但是入手后,可拓展性又非常广泛,可玩性极强,成就感也很足. 验证码图像处理 验证码图像识别技术主要是操作图片内的像素点,通过对图片的像 ...

最新文章

  1. 设计模式之迭代器模式java实现代码
  2. phpcms 指定id范围 调用_Elasticsearch v7 中Java High-Level REST Client同步和异步调用
  3. ByteBuf的源码分析
  4. android 文件读写
  5. 2017.10.6 Java命名规范及使用情况
  6. tensorflow内存溢出问题
  7. HTML参考系列(1)-文本格式化标签
  8. vue项目中打包的相关配置问题
  9. 在c++和C中,malloc函数的头文件是什么?C头文件, <stdlib.h>;C++头文件, <cstdlib>
  10. linux嵌入式聊天室的程序,基于Linux网络聊天室的设计与实现
  11. ENSP-----ISIS协议
  12. 单例模式--懒汉模式和饿汉模式
  13. 欧拉汽车,卖“萌”真能行?
  14. 腾讯云服务器架设mir2
  15. php nts ts 版本区分
  16. vscode连接安卓模拟器上autojs
  17. 第十三届蓝桥杯大赛软件组省赛 Python大学A组 个人题解
  18. 双击打开excel内容不显示而显示灰色解决方法
  19. Web安全学习day01
  20. hmmer建立hmmscan

热门文章

  1. 微信小程序Canvs画数据表格 折线图
  2. 使用JavaScript实现图片轮播,上一张后一张,循环播放
  3. 使用Ad Rotator组件的问题
  4. 图片如何转为JPG?分享两个办法
  5. UESTC 1787 论单机幻影刺客的最佳打野路线
  6. 数据科学作业3_鸢尾花分类
  7. 词向量模型之CBOW
  8. 九乐客会员营销系统v1.1.7
  9. win10双系统网络不稳定解决方法
  10. iOS 滑动浏览图片 捏合缩小放大 音量线控