文本标注平台搭建之brat
目录
- 1. 下载安装包
- 2. 解压,安装,启动服务
- 2.1 解压安装包
- 2.2 切换路径
- 2.3 运行install.sh进行安装
- 2.4 运行standalone.py启动服务
- 3. 在浏览器登录
- 3.1 登录
- 3.2 导入数据,生成.ann文件
- 3.3 选择需要标注的文件
- 3.4 开始标注
- 4. 对标注的数据结构进行配置
- 4.1 实体添加
- 4.2 中文设置
- 4.3 设置颜色
- 4.4 设置关系
1. 下载安装包
下载地址:http://brat.nlplab.org/index.html
如图所示,点击download下载:
2. 解压,安装,启动服务
2.1 解压安装包
tar xzf brat-v1.3_Crunchy_Frog.tar.gz
2.2 切换路径
cd brat-v1.3_Crunchy_Frog
2.3 运行install.sh进行安装
./install.sh
2.4 运行standalone.py启动服务
python standalone.py
在standalone.py的第63、64行可以修改ip地址和端口号,如图所示:
3. 在浏览器登录
根据设置的地址和端口号,在浏览器登录,登录后如图所示:
3.1 登录
鼠标移动到如图所示右上角登录,不然无法进行标注。
3.2 导入数据,生成.ann文件
将数据放在brat-v1.3_Crunchy_Frog/data路径下,可以根据自己的项目新建文件夹,如test,在路径brat-v1.3_Crunchy_Frog/data/test放入需要进行标注的数据。
文件的格式是.txt的格式。
运行如下指令,生成文件夹下与.txt同名的.ann文件:
find 文件夹名称 -name '*.txt'|sed -e 's|\.txt|.ann|g'|xargs touch
注:必须要同时有.txt和.ann文件,才能进行标注。
3.3 选择需要标注的文件
在浏览器窗口中点击tab键,选择需要标注的文件进行标注,如图所示:
选择文件,点击OK。
3.4 开始标注
选择我们需要标注的内容,如图所示,选择系统性血管炎
选择之后,界面会弹出如下的标注界面,选择Disease对系统性血管炎进行标注:
标记完之后,点击OK,标记完成,如下图所示:
标记完成之后,将鼠标移至上方蓝色处,然后点击data:
之后会弹出如下界面,点击OK保存,标注完毕。标注后的内容会保存在.ann文件中。
4. 对标注的数据结构进行配置
4.1 实体添加
在brat-v1.3_Crunchy_Frog路径中,打开annotation.conf文件,添加我们需要的实体名称,如图所示,这里我们添加了Disease、Drug两个实体名称。
4.2 中文设置
(注:直接在annotation.conf里添加中文实体经常会报错)
这样,在标注的时候,就可以显示中文,如下图所示:
4.3 设置颜色
在路径brat-v1.3_Crunchy_Frog路径中,打开visual.conf,找到[drawing],如图示设置颜色:
4.4 设置关系
在brat-v1.3_Crunchy_Frog路径中,打开annotation.conf文件,找到[relations],设置实体之间的关系,下图45~48行表示:
xx疾病 有 xx症状
xx疾病 推荐使用 xx药物
xx疾病 属于 xx部门
xx疾病 做了 xx检查
设置完关系之后,可以在浏览器界面,对于两个标注后的部分,可以从一端拖动到另一端,实现关系的标注,如下图所示:
**结束。**标记完成后,记得保存(怎么保存见3.4节内容)。
文本标注平台搭建之brat相关推荐
- 文本标注平台doccano的搭建
一.简介 doccano是一个开源的人工文本标注工具.它为文本分类,序列标记和序列到序列任务提供了文本标注功能.我们可以通过该工具标记数据以供情感分析.命名实体识别.文本摘要等任务使用.限免就来简单介 ...
- 文本标注平台 doccano 安装教程
doccano简介 doccano 是一个开源的文本注释工具.它为文本分类.序列标记和序列到序列任务提供注释功能.因此,可以为情感分析.命名实体识别.文本摘要等创建标记数据.只需创建一个项目,上传数据 ...
- 图像标注平台搭建之cvat
目录 1. 项目地址 2. 构建镜像 3. 启动容器 设置超级用户 4. 标注 4.1 登录页面 4.2 创建任务 4.3 任务设置 4.4 进入任务 4.5 根据不同的任务,选择合适的shape进行 ...
- NLP文本标注工具与平台(数据标注公司)
最近在做NLP相关项目,包括句法分析.情感分析等,有大量数据需要标注.我评估了几个文本标注工具,也接触了几家数据标注公司和平台,总结如下,供各位参考. 文本标注平台(标注外包公司) 数据标注公司的工作 ...
- 文本标注工具BRAT的安装与配置
文本标注工具BRAT的安装与配置 因此博客是安装完成之后回顾下写的,所以没有配图说明,仅记录下安装步骤及出现的一些问题,具体安装路线如下: 1.win10下VirtualBox与Ubuntu的安装 B ...
- NLP工具集:【doccano】——标注平台doccano使用手册
一. 简介 doccano 是一个开源的文本标注平台.它为文本分类.序列标记和序列到序列任务提供标注功能.因此,您可以为情感分析.命名实体识别.文本摘要.机器翻译等任务创建标注数据.只需创建一个项目, ...
- 文本标注开源系统Doccano、Label Studio、BRAT比较
竞品分析: Label Studio 多模态数据标注首选,当然也可以做文本标注,但是角色权限管理没有doccano完善. BRAT 老牌文本标注工具,擅长关系标注,构建知识图谱数据集比较有优势.界面比 ...
- brat事件标注平台使用教程
事件图谱首先涉及到的是事件标注,我采用的是brat事件标注平台,该平台使用的是Linux系统,因为我的电脑是windows系统, 将brat安装在了linux虚拟机(Ubuntu)上. 一.下载与安装 ...
- 【文本标注】文本标注工具brat的使用
brat是linux下的一款应用于webserver端的文本标注工具,可用于标注如下类型信息: (1)实体:命名实体,可用于NER: (2)关系:实体间关系,可用于关系抽取: (3)事件:实体参与的事 ...
最新文章
- 软件测试培训适合什么人学习?
- java 弱引用 集合_java 弱引用集合类WeakHashMap
- 深圳.NET俱乐部 Windows 7 社区发布会总结及资源下载
- machine learning for hacker记录(4) 智能邮箱(排序学习推荐系统)
- 高并发系统三大利器之缓存
- 使用System.Timers.Timer类实现程序定时执行
- 卡诺模型案例分析_AMOS案例分析 | 结构方程模型(二)
- 2021年中国一次性医用传感器市场趋势报告、技术动态创新及2027年市场预测
- Halcon 仿射变换
- hdu 1085 Holding Bin-Laden Captive! (母函数)
- 转载 java序列化与反序列化
- windows版本和Linux版本的ffmpeg下载使用方法
- 基于nodejs的excel表格合并工具
- 新东方雅思词汇---8.1、reckon
- 提高办公协同效率,Tracup可能是最好的选择
- Django在Terminal中python manage.py startapp myapp报name ‘os‘ is not defined
- 一道积分不等式的最优估计探索
- 案例研究:设计令人震撼的名片!
- 【面试题】 10.11. 峰与谷
- 【Antdv】input type=number去掉上下箭头、提示文字、鼠标滚轮
热门文章
- linux内核烧写erasing failed,TQIMX6UL开发板手动烧写具体方法
- 你不知道的adb,熟知工具快速开发
- 【0基础快速入门】Python学习快速参考手册
- 系统集成项目管理工程师(软考中级)—— 第二十三章 风险管理 笔记分享
- 树莓派无线网络设置、WLAN0设置
- 走自己的路,听别人的话
- python画龙猫_宫崎骏王国——《龙猫》小梅(超详细零基础马克笔手绘教程)
- 2022年国家高新技术企业认定最新规定及优惠政策重点介绍,补贴10-50万
- Kafka 消费者组管理模块(六):GroupCoordinator 处理成员入组
- 2、并行接口、协议和相关芯片介绍(8080、8060)