python 语料标注_语料标注工具(3)
今天再详细介绍一下Prodigy工具和YEDDA工具。
Prodigy工具
支持实体标注,分类标注,情感标注,但是都是英文的。有一个基于Prodigy的中文github项目。Prodigy官方项目地址:收费的,所以没有必要再去深究了。这里给出它的文本分类标注界面和实体识别标注界面。
这里要强调一下,那个所谓的基于Prodigy思想的中文版根本就不能用,github也很久没更新了,完全就是花架子,issuses里的内容也基本是有问无答,如果有哪个大神把它调出来了,欢迎投稿,或者告诉我。deepwel/Chinese-Annotator,居然还有700个星,真是没有天理。
YEDDA
YEDDA可以进行chunk/entity/event三种标注任务。它使用tkinter开发,当前只支持在Python2.7下运行。对外提供两种用户界面,一种是标注员界面(终端执行python YEDDA.py),一种是管理员界面(终端执行python YEDDA_Admin.py)。标注员界面用于给句子做标注,管理员界面提供针对同一文件的不同人员标注结果的对比等功能。标注界面如下图所示
其中的按钮的大致功能为`Open`按钮用于打开待校对的文件。`ReMap`用于将用户设置的标注快捷键更新到当前配置文件。`NewMap`按钮用于将用户设置的标注快捷键保存到新的配置文件。`RMOn`是打开机器自动标注功能,`RMOff`是关闭机器自动标注功能。`Export`到处当前标注后的文本。`Quit`退出当前标注。字母`A`,`B`,`C`,`D`,`E`,`F`,`G`分别对应右侧所列功能的快捷键,比如Location地名的快捷键为`D`。`Cursor`表示当前光标在文本中的为止,`RMModel`指的是是否启动了机器自动标注。`Map Templates`快捷键配置文件名。
YEDDA的缺点有:
(1)可标记种类数只有7种
(2)没有情感类别或分类类别的标记功能
(3)一次性将文本内容全部展示出来不利于标注者标记
(4)没有分词功能也不能使用自己的分词器
(5)没有类别预测功能
(6)只能运行在Python2.7版本下。
可改进的点有:
(1)添加类别预测展示及标注功能
(2)添加标注进度展示区
(3)添加分词功能
(4)添加实体识别功能
(5)导出时,计算本次标注后系统预测的准确率
github地址:jiesutd/YEDDAgithub.com
python 语料标注_语料标注工具(3)相关推荐
- paddle 图标注_安卓|尺寸标注工具,让标注更加方便
全世界只有不到0.00~1 % 的人关注了我们 得到你的关注是小帮的幸运 我想在生活或工作中我们也会有时候会记一下某一个东西尺寸,甚至有的工作天天都要跟尺寸打交道,我们可能简单的量一下然后在本子或者手 ...
- python代码覆盖率测试_利用coverage工具进行Python代码覆盖率测试
Coverage是一种用于统计Python代码覆盖率的工具,通过它可以检测测试代码对被测代码的覆盖率情况. Coverage安装 1.安装命令:pip install coverage 2.查看cov ...
- python renamer模块_【免费工具集】4种免费Maya Python脚本集合:重命名、检查UV、分配重叠模型、选边,尽在EL Tool Pack...
原标题:[免费工具集]4种免费Maya Python脚本集合:重命名.检查UV.分配重叠模型.选边,尽在EL Tool Pack DENG工作室Senior build TD的Erik Lehmann ...
- bert pytorch 序列标注_序列标注:Bi-LSTM + CRF
最近在做序列标注的相关任务,为了理解bi-lstm + crf的原理及细节,找了很多相关资料,以及代码实现,这里分享给大家并附上一些自己的理解. CRF 相关资料推荐 关于crf,我看了很多资料,这里 ...
- python模型预测控制_【模型工具】耦合python和 SWMM的城市排水系统模型预测算法...
美国环境署EPA开发的SWMM模型具有开源性,这使其成为最为广泛使用的城市排水系统模型.但是SWMM是基于C语言开发的,二次开发困难较大.因此本文作者利用开源的PYSWMM程序包,利用python实现 ...
- 按键精灵和python功能对比_对比其他工具,Python具有的3个优点
如果你对数据分析有所了解,一定听说过一些亲民的工具如Excel.Tableau.PowerBI等,都能成为数据分析的得力助手.但它们的不足也是显而易见的:操作繁琐,复用性差,功能相对局限单一. 怎么解 ...
- python加权最小二乘_【量化工具系列】Barra加权最小二乘的python实现
BARRA USE4 page 13中写道,Factor returns in USE4 are estimated using weighted least-squares regression, ...
- 标注工具_语料标注工具(2)
继续总结语料标注工具 3. BRAT BRAT虽然也是实体.实体关系.事件抽取的标注工具,但是中文里有人利用它标注了情感语料. 项目地址: http://brat.nlplab.org/introdu ...
- 标注工具_语料标注工具(3)
今天再详细介绍一下Prodigy工具和YEDDA工具. Prodigy工具 支持实体标注,分类标注,情感标注,但是都是英文的.有一个基于Prodigy的中文github项目.Prodigy官方项目地址 ...
最新文章
- 什么是OR MAPPING
- 新手学习嵌入式需要掌握的几点知识点
- CSRF(跨站请求伪造)攻击 --
- cf不能全屏win7的解决方法_win10玩cf不能全屏的解决方法教程
- 六石管理学:谈管理的前提,要有一点的胸量
- 司徒正美:为什么类 React 框架层出不穷?
- 苹果MFi认证协处理器(MFI337S3959)公钥证书分析
- 支付宝福利:银行卡信息查询
- Android 六大布局
- linux增加swap空间的方法
- Chrome浏览器网页保存成图片
- 网易云课堂-数据结构-练习题实现-00,打印沙漏
- 魅族pro 6完美开启usb调试模式的经验
- 如何获取微信文章阅读数和点赞数
- 华为相册的神仙功能,真的超好用!
- 【控制系统数字仿真与CAD——实验报告】实验四:黄金分割法最优化PI调节器参数(文末附完整代码 + 实验结果)
- 如何看手相 男左女右(转)
- IDL对FY-4A辐射定标
- “按键精灵”教你自动免费刷出QQ靓号
- 【论文阅读】Scaling Up Your Kernels to 31x31: Revisiting Large Kernel Design in CNNs