今天再详细介绍一下Prodigy工具和YEDDA工具。

Prodigy工具

支持实体标注,分类标注,情感标注,但是都是英文的。有一个基于Prodigy的中文github项目。Prodigy官方项目地址:收费的,所以没有必要再去深究了。这里给出它的文本分类标注界面和实体识别标注界面。

这里要强调一下,那个所谓的基于Prodigy思想的中文版根本就不能用,github也很久没更新了,完全就是花架子,issuses里的内容也基本是有问无答,如果有哪个大神把它调出来了,欢迎投稿,或者告诉我。deepwel/Chinese-Annotator,居然还有700个星,真是没有天理。

YEDDA

YEDDA可以进行chunk/entity/event三种标注任务。它使用tkinter开发,当前只支持在Python2.7下运行。对外提供两种用户界面,一种是标注员界面(终端执行python YEDDA.py),一种是管理员界面(终端执行python YEDDA_Admin.py)。标注员界面用于给句子做标注,管理员界面提供针对同一文件的不同人员标注结果的对比等功能。标注界面如下图所示

其中的按钮的大致功能为`Open`按钮用于打开待校对的文件。`ReMap`用于将用户设置的标注快捷键更新到当前配置文件。`NewMap`按钮用于将用户设置的标注快捷键保存到新的配置文件。`RMOn`是打开机器自动标注功能,`RMOff`是关闭机器自动标注功能。`Export`到处当前标注后的文本。`Quit`退出当前标注。字母`A`,`B`,`C`,`D`,`E`,`F`,`G`分别对应右侧所列功能的快捷键,比如Location地名的快捷键为`D`。`Cursor`表示当前光标在文本中的为止,`RMModel`指的是是否启动了机器自动标注。`Map Templates`快捷键配置文件名。

YEDDA的缺点有:

(1)可标记种类数只有7种

(2)没有情感类别或分类类别的标记功能

(3)一次性将文本内容全部展示出来不利于标注者标记

(4)没有分词功能也不能使用自己的分词器

(5)没有类别预测功能

(6)只能运行在Python2.7版本下。

可改进的点有:

(1)添加类别预测展示及标注功能

(2)添加标注进度展示区

(3)添加分词功能

(4)添加实体识别功能

(5)导出时,计算本次标注后系统预测的准确率

github地址:jiesutd/YEDDA​github.com

python 语料标注_语料标注工具(3)相关推荐

  1. paddle 图标注_安卓|尺寸标注工具,让标注更加方便

    全世界只有不到0.00~1 % 的人关注了我们 得到你的关注是小帮的幸运 我想在生活或工作中我们也会有时候会记一下某一个东西尺寸,甚至有的工作天天都要跟尺寸打交道,我们可能简单的量一下然后在本子或者手 ...

  2. python代码覆盖率测试_利用coverage工具进行Python代码覆盖率测试

    Coverage是一种用于统计Python代码覆盖率的工具,通过它可以检测测试代码对被测代码的覆盖率情况. Coverage安装 1.安装命令:pip install coverage 2.查看cov ...

  3. python renamer模块_【免费工具集】4种免费Maya Python脚本集合:重命名、检查UV、分配重叠模型、选边,尽在EL Tool Pack...

    原标题:[免费工具集]4种免费Maya Python脚本集合:重命名.检查UV.分配重叠模型.选边,尽在EL Tool Pack DENG工作室Senior build TD的Erik Lehmann ...

  4. bert pytorch 序列标注_序列标注:Bi-LSTM + CRF

    最近在做序列标注的相关任务,为了理解bi-lstm + crf的原理及细节,找了很多相关资料,以及代码实现,这里分享给大家并附上一些自己的理解. CRF 相关资料推荐 关于crf,我看了很多资料,这里 ...

  5. python模型预测控制_【模型工具】耦合python和 SWMM的城市排水系统模型预测算法...

    美国环境署EPA开发的SWMM模型具有开源性,这使其成为最为广泛使用的城市排水系统模型.但是SWMM是基于C语言开发的,二次开发困难较大.因此本文作者利用开源的PYSWMM程序包,利用python实现 ...

  6. 按键精灵和python功能对比_对比其他工具,Python具有的3个优点

    如果你对数据分析有所了解,一定听说过一些亲民的工具如Excel.Tableau.PowerBI等,都能成为数据分析的得力助手.但它们的不足也是显而易见的:操作繁琐,复用性差,功能相对局限单一. 怎么解 ...

  7. python加权最小二乘_【量化工具系列】Barra加权最小二乘的python实现

    BARRA USE4 page 13中写道,Factor returns in USE4 are estimated using weighted least-squares regression, ...

  8. 标注工具_语料标注工具(2)

    继续总结语料标注工具 3. BRAT BRAT虽然也是实体.实体关系.事件抽取的标注工具,但是中文里有人利用它标注了情感语料. 项目地址: http://brat.nlplab.org/introdu ...

  9. 标注工具_语料标注工具(3)

    今天再详细介绍一下Prodigy工具和YEDDA工具. Prodigy工具 支持实体标注,分类标注,情感标注,但是都是英文的.有一个基于Prodigy的中文github项目.Prodigy官方项目地址 ...

最新文章

  1. 什么是OR MAPPING
  2. 新手学习嵌入式需要掌握的几点知识点
  3. CSRF(跨站请求伪造)攻击 --
  4. cf不能全屏win7的解决方法_win10玩cf不能全屏的解决方法教程
  5. 六石管理学:谈管理的前提,要有一点的胸量
  6. 司徒正美:为什么类 React 框架层出不穷?
  7. 苹果MFi认证协处理器(MFI337S3959)公钥证书分析
  8. 支付宝福利:银行卡信息查询
  9. Android 六大布局
  10. linux增加swap空间的方法
  11. Chrome浏览器网页保存成图片
  12. 网易云课堂-数据结构-练习题实现-00,打印沙漏
  13. 魅族pro 6完美开启usb调试模式的经验
  14. 如何获取微信文章阅读数和点赞数
  15. 华为相册的神仙功能,真的超好用!
  16. 【控制系统数字仿真与CAD——实验报告】实验四:黄金分割法最优化PI调节器参数(文末附完整代码 + 实验结果)
  17. 如何看手相 男左女右(转)
  18. IDL对FY-4A辐射定标
  19. “按键精灵”教你自动免费刷出QQ靓号
  20. 【论文阅读】Scaling Up Your Kernels to 31x31: Revisiting Large Kernel Design in CNNs

热门文章

  1. 【推荐收藏】机器学习12种回归评价指标(附Python代码)
  2. Android中Dialog数据的获取报错空指针问题
  3. 云平台支持哪些java应用服务器_腾讯云部署javaWeb项目之一应用服务器
  4. 矩阵乘法与点乘的区别
  5. iOS Dev (21) 用 AVPlayer 播放一个本地音频文件
  6. 英语翻译软件哪个好用?来试试下面这几款吧
  7. 用python和NetAssist来做TCP客户端和服务器端
  8. 无线充电 Qi认证流程详解
  9. 安卓开发-Android系统起源
  10. idea编写java常用快捷键(),持续更新