一、中文:

1、Pycorrector:https://github.com/shibing624/pycorrector

当前主流的中文纠错框架,支持规则和端到端模型

2、FASPell:https://github.com/iqiyi/FASPell/blob/master

论文:https://www.aclweb.org/anthology/D19-5522.pdf

使用bert进行预训练+微调,再经过CSD过滤器得到最终结果。支持简体中文文本; 繁体中文文本; 人类论文; OCR结果等

3、YoungCorrector:https://github.com/hiyoung123/YoungCorrector

基于Pycorrector改造,实现基于纯规则的纠错系统。整个系统框架比较详细。与Pycorrector准确度差不多,耗时短(归功于前向最大匹配替代了直接索引混淆词典)

4、SoftMaskedBert:https://github.com/hiyoung123/SoftMaskedBert

对论文Soft-Masked Bert 的复现:https://arxiv.org/pdf/2005.07421.pdf

使用判别模型BiGRU+纠错模型BERT,实现端到端的纠错。

5、bert_chinese:https://github.com/JohanyCheung/bert_chinese/tree/master/corrector

直接预训练的bert模型实现中文的文本纠错,可参照学习bert如何做纠错任务

二、英文:

1、SoftMaskedBert:https://github.com/hiyoung123/SoftMaskedBert

更改训练集和测试集,即可应用于其他语言拼写纠错

2、xfspell:https://github.com/mhagiwara/xfspell

基于Transformer的拼写纠错。原理类似于机器翻译,解决了纠错时输入和输出必须保持一致的问题。通过交换输入数据和输出数据,生成大量包含错别字的文本数据。

3、spelling-correction:https://github.com/huseinzol05/NLP-Models-Tensorflow/tree/master/spelling-correction

基于bert预训练模型的拼写纠错(需指定错误位置)

4、spellcorrect:https://github.com/cbaziotis/ekphrasis/blob/master/ekphrasis/classes/spellcorrect.py

基于编辑距离的英文拼写纠错

中文拼写纠错_中英文拼写纠错开源框架梳理相关推荐

  1. batocera中文整合包_分享一个整合 SSM 框架的高并发和商品秒杀项目

    点击上方"Java基基",选择"设为星标" 做积极的人,而不是积极废人! 源码精品专栏 中文详细注释的开源项目 RPC 框架 Dubbo 源码解析 网络应用框架 ...

  2. python框架大全_常用的Python开源框架有哪些?列举这3个

    随着人工智能快速发展,不仅在各个领域应用日益广泛,同时也引发了教学内容的变革和创新.人工智能的火热得益于成功的开源以及深度学习框架的不断涌现.而Python作为一种脚本语言,具有易学.易维护等优点,它 ...

  3. python开发框架大全_最常用Python开源框架有哪些?

    Python开源框架有很多,像Django.Flask.webpy等等,但哪些是最常用到的呢?我们收集了一些Python使用者的宝贵意见,把他们认为最常用的Python开源框架简单的介绍给大家. 一. ...

  4. 中英文拼写纠错开源框架梳理

    一.中文: 1.Pycorrector:https://github.com/shibing624/pycorrector 当前主流的中文纠错框架,支持规则和端到端模型 2.FASPell:https ...

  5. 2020 年 中英文拼写纠错开源框架梳理

    一.中文: 1.Pycorrector:https://github.com/shibing624/pycorrector 当前主流的中文纠错框架,支持规则和端到端模型 2.FASPell:https ...

  6. quantaxis 云服务器_量化金融策略开源框架:QUANTAXIS

    简介: QUANTAXIS量化金融策略框架,是一个面向中小型策略团队的量化分析解决方案,是一个从数据爬取.清洗存储.分析回测.可视化.交易复盘的本地一站式解决方案. QUANTAXIS量化金融策略框架 ...

  7. 黄聪:Android酷炫实用的开源框架(UI框架)(转)

    Android酷炫实用的开源框架(UI框架) 前言 忙碌的工作终于可以停息一段时间了,最近突然有一个想法,就是自己写一个app,所以找了一些合适开源控件,这样更加省时,再此分享给大家,希望能对大家有帮 ...

  8. 中文拼写纠错_58搜索拼写纠错

    在搜索引擎中,用户希望得到和输入查询词相关的并且质量较好的网页或文档.但是往往出于各种原因,用户输入的查询词本身质量不高或是错误的,如果搜索引擎不对这种错误进行修正弥补,会导致召回错误的结果,或者结果 ...

  9. nlp 中文文本纠错_百度中文纠错技术

    原标题:百度中文纠错技术 分享嘉宾:付志宏 百度资深研发工程师 编辑整理:李润顺 内容来源:Baidu Brain & DataFun AI Talk<百度中文纠错技术> 出品社区 ...

最新文章

  1. c#json对象转数组_数组和对象的区别
  2. 802.11n协议帧格式详解
  3. ASP.NET刷新页面的六种方法
  4. Android——DDMS简单介绍
  5. vue cli 对解析的html内容的图片添加样式
  6. 【java】窗口和流的应用
  7. php js 报错信息,JavaScript中错误异常的分析(附示例)
  8. 使用WebDeployment Project改善VS2005发布网站
  9. A[1054] The Dominant Colour (map!!)
  10. 华为工作十年离职感想
  11. 易飞8无销售报价的BOM成本参考
  12. 芯片设计:FPGA开发学习
  13. MOSAIC扩充VOC数据集
  14. 国内设计师经常逛的5个素材网站
  15. 网格交易 python代码_网格交易原理和代码
  16. 第二阶段--团队冲刺--第四天
  17. Servlet的路径配置
  18. 视频流媒体服务器EasyNVR直播平台如何搭建幼儿园网络监控系统?
  19. kb2919442不适用计算机,无法更新kb2919442,kb2919355,显示此更新不适用于你的计算机,求助...
  20. java mcu视频_如何利用MCU流畅的播放视频?

热门文章

  1. 编译安装nginx实现反向代理、负载均衡、缓存功能
  2. Docker 上传镜像到docker hub
  3. 2022年长沙初级会计考试模拟题及答案
  4. 基于winform的打印标签模板设计器以及打印辅助类
  5. MS Office for Mac的Clipart错误
  6. adb命令重置_ADB命令手册大全
  7. ESXI6.7安装补丁
  8. 转载——MinMax算法详解
  9. 并行传输VS串行传输
  10. cesium使用primitives加载模型数据,点击事件