目录

  • 1. 下载安装包
  • 2. 解压,安装,启动服务
    • 2.1 解压安装包
    • 2.2 切换路径
    • 2.3 运行install.sh进行安装
    • 2.4 运行standalone.py启动服务
  • 3. 在浏览器登录
    • 3.1 登录
    • 3.2 导入数据,生成.ann文件
    • 3.3 选择需要标注的文件
    • 3.4 开始标注
  • 4. 对标注的数据结构进行配置
    • 4.1 实体添加
    • 4.2 中文设置
    • 4.3 设置颜色
    • 4.4 设置关系

1. 下载安装包

下载地址:http://brat.nlplab.org/index.html
如图所示,点击download下载:

2. 解压,安装,启动服务

2.1 解压安装包

tar xzf brat-v1.3_Crunchy_Frog.tar.gz

2.2 切换路径

cd brat-v1.3_Crunchy_Frog

2.3 运行install.sh进行安装

./install.sh

2.4 运行standalone.py启动服务

python standalone.py

在standalone.py的第63、64行可以修改ip地址和端口号,如图所示:

3. 在浏览器登录

根据设置的地址和端口号,在浏览器登录,登录后如图所示:

3.1 登录

鼠标移动到如图所示右上角登录,不然无法进行标注。

3.2 导入数据,生成.ann文件

将数据放在brat-v1.3_Crunchy_Frog/data路径下,可以根据自己的项目新建文件夹,如test,在路径brat-v1.3_Crunchy_Frog/data/test放入需要进行标注的数据。
文件的格式是.txt的格式。
运行如下指令,生成文件夹下与.txt同名的.ann文件:

find 文件夹名称 -name '*.txt'|sed -e 's|\.txt|.ann|g'|xargs touch

注:必须要同时有.txt和.ann文件,才能进行标注。

3.3 选择需要标注的文件

在浏览器窗口中点击tab键,选择需要标注的文件进行标注,如图所示:

选择文件,点击OK。

3.4 开始标注

选择我们需要标注的内容,如图所示,选择系统性血管炎

选择之后,界面会弹出如下的标注界面,选择Disease对系统性血管炎进行标注:

标记完之后,点击OK,标记完成,如下图所示:


标记完成之后,将鼠标移至上方蓝色处,然后点击data:


之后会弹出如下界面,点击OK保存,标注完毕。标注后的内容会保存在.ann文件中。

4. 对标注的数据结构进行配置

4.1 实体添加

在brat-v1.3_Crunchy_Frog路径中,打开annotation.conf文件,添加我们需要的实体名称,如图所示,这里我们添加了Disease、Drug两个实体名称。

4.2 中文设置

(注:直接在annotation.conf里添加中文实体经常会报错)

这样,在标注的时候,就可以显示中文,如下图所示:

4.3 设置颜色

    在路径brat-v1.3_Crunchy_Frog路径中,打开visual.conf,找到[drawing],如图示设置颜色:

4.4 设置关系

在brat-v1.3_Crunchy_Frog路径中,打开annotation.conf文件,找到[relations],设置实体之间的关系,下图45~48行表示:
xx疾病 有 xx症状
xx疾病 推荐使用 xx药物
xx疾病 属于 xx部门
xx疾病 做了 xx检查

设置完关系之后,可以在浏览器界面,对于两个标注后的部分,可以从一端拖动到另一端,实现关系的标注,如下图所示:


**结束。**标记完成后,记得保存(怎么保存见3.4节内容)。

文本标注平台搭建之brat相关推荐

  1. 文本标注平台doccano的搭建

    一.简介 doccano是一个开源的人工文本标注工具.它为文本分类,序列标记和序列到序列任务提供了文本标注功能.我们可以通过该工具标记数据以供情感分析.命名实体识别.文本摘要等任务使用.限免就来简单介 ...

  2. 文本标注平台 doccano 安装教程

    doccano简介 doccano 是一个开源的文本注释工具.它为文本分类.序列标记和序列到序列任务提供注释功能.因此,可以为情感分析.命名实体识别.文本摘要等创建标记数据.只需创建一个项目,上传数据 ...

  3. 图像标注平台搭建之cvat

    目录 1. 项目地址 2. 构建镜像 3. 启动容器 设置超级用户 4. 标注 4.1 登录页面 4.2 创建任务 4.3 任务设置 4.4 进入任务 4.5 根据不同的任务,选择合适的shape进行 ...

  4. NLP文本标注工具与平台(数据标注公司)

    最近在做NLP相关项目,包括句法分析.情感分析等,有大量数据需要标注.我评估了几个文本标注工具,也接触了几家数据标注公司和平台,总结如下,供各位参考. 文本标注平台(标注外包公司) 数据标注公司的工作 ...

  5. 文本标注工具BRAT的安装与配置

    文本标注工具BRAT的安装与配置 因此博客是安装完成之后回顾下写的,所以没有配图说明,仅记录下安装步骤及出现的一些问题,具体安装路线如下: 1.win10下VirtualBox与Ubuntu的安装 B ...

  6. NLP工具集:【doccano】——标注平台doccano使用手册

    一. 简介 doccano 是一个开源的文本标注平台.它为文本分类.序列标记和序列到序列任务提供标注功能.因此,您可以为情感分析.命名实体识别.文本摘要.机器翻译等任务创建标注数据.只需创建一个项目, ...

  7. 文本标注开源系统Doccano、Label Studio、BRAT比较

    竞品分析: Label Studio 多模态数据标注首选,当然也可以做文本标注,但是角色权限管理没有doccano完善. BRAT 老牌文本标注工具,擅长关系标注,构建知识图谱数据集比较有优势.界面比 ...

  8. brat事件标注平台使用教程

    事件图谱首先涉及到的是事件标注,我采用的是brat事件标注平台,该平台使用的是Linux系统,因为我的电脑是windows系统, 将brat安装在了linux虚拟机(Ubuntu)上. 一.下载与安装 ...

  9. 【文本标注】文本标注工具brat的使用

    brat是linux下的一款应用于webserver端的文本标注工具,可用于标注如下类型信息: (1)实体:命名实体,可用于NER: (2)关系:实体间关系,可用于关系抽取: (3)事件:实体参与的事 ...

最新文章

  1. 软件测试培训适合什么人学习?
  2. java 弱引用 集合_java 弱引用集合类WeakHashMap
  3. 深圳.NET俱乐部 Windows 7 社区发布会总结及资源下载
  4. machine learning for hacker记录(4) 智能邮箱(排序学习推荐系统)
  5. 高并发系统三大利器之缓存
  6. 使用System.Timers.Timer类实现程序定时执行
  7. 卡诺模型案例分析_AMOS案例分析 | 结构方程模型(二)
  8. 2021年中国一次性医用传感器市场趋势报告、技术动态创新及2027年市场预测
  9. Halcon 仿射变换
  10. hdu 1085 Holding Bin-Laden Captive! (母函数)
  11. 转载 java序列化与反序列化
  12. windows版本和Linux版本的ffmpeg下载使用方法
  13. 基于nodejs的excel表格合并工具
  14. 新东方雅思词汇---8.1、reckon
  15. 提高办公协同效率,Tracup可能是最好的选择
  16. Django在Terminal中python manage.py startapp myapp报name ‘os‘ is not defined
  17. 一道积分不等式的最优估计探索
  18. 案例研究:设计令人震撼的名片!
  19. 【面试题】 10.11. 峰与谷
  20. 【Antdv】input type=number去掉上下箭头、提示文字、鼠标滚轮

热门文章

  1. linux内核烧写erasing failed,TQIMX6UL开发板手动烧写具体方法
  2. 你不知道的adb,熟知工具快速开发
  3. 【0基础快速入门】Python学习快速参考手册
  4. 系统集成项目管理工程师(软考中级)—— 第二十三章 风险管理 笔记分享
  5. 树莓派无线网络设置、WLAN0设置
  6. 走自己的路,听别人的话
  7. python画龙猫_宫崎骏王国——《龙猫》小梅(超详细零基础马克笔手绘教程)
  8. 2022年国家高新技术企业认定最新规定及优惠政策重点介绍,补贴10-50万
  9. Kafka 消费者组管理模块(六):GroupCoordinator 处理成员入组
  10. 2、并行接口、协议和相关芯片介绍(8080、8060)