doccano数据标注平台使用
Step 1. 本地安装doccano
$ pip install doccano
Step 2. 初始化数据库和账户(用户名和密码可替换为自定义值)
$ doccano init
$ doccano createuser --username my_admin_name --password my_password
Step 3. 启动doccano
- 在一个窗口启动doccano的WebServer,保持窗口
$ doccano webserver --port 8000
- 在另一个窗口启动doccano的任务队列
$ doccano task
Step 4. 运行doccano来标注实体和关系
打开浏览器(推荐Chrome),在地址栏中输入
http://0.0.0.0:8000/
后回车即得以下界面。登陆账户。点击右上角的
LOGIN
,输入Step 2中设置的用户名和密码登陆。创建项目。点击左上角的
CREATE
,跳转至以下界面。- 勾选序列标注(
Sequence Labeling
) - 填写项目名称(
Project name
)等必要信息 - 勾选允许实体重叠(
Allow overlapping entity
)、使用关系标注(Use relation labeling
) - 创建完成后,项目首页视频提供了从数据导入到导出的七个步骤的详细说明。
- 勾选序列标注(
设置标签。在Labels一栏点击
Actions
,Create Label
手动设置或者Import Labels
从文件导入。- 最上边Span表示实体标签,Relation表示关系标签,需要分别设置。
导入数据。在Datasets一栏点击
Actions
、Import Dataset
从文件导入文本数据。- 根据文件格式(File format)给出的示例,选择适合的格式导入自定义数据文件。
- 导入成功后即跳转至数据列表。
标注数据。点击每条数据最右边的
Annotate
按钮开始标记。标记页面右侧的标签类型(Label Types)开关可在实体标签和关系标签之间切换。- 实体标注:直接用鼠标选取文本即可标注实体。
- 关系标注:首先点击待标注的关系标签,接着依次点击相应的头尾实体可完成关系标注。
导出数据。在Datasets一栏点击
Actions
、Export Dataset
导出已标注的数据。
ps:安装过程遇到的一些问题可以参照这个博客文本标注工具doccano安装及使用_夕由呀的博客-CSDN博客_doccano 数据库
doccano数据标注平台使用相关推荐
- labelme标注需要精确标注吗_国内需要一个数据标注平台
一.数据团队业务的痛点 过去一年中,我加入美图数据团队,虽然我的职位是开发,但平时也主动和leader以及同事聊到目前数据上的业务流程.先来说说美图公司的数据业务吧. 1.数据业务 即然是业务,就有甲 ...
- 数据标注去哪接任务订单?靠谱的数据标注平台有哪些?
目录 与专业的数据服务公司合作 在数据标注众包平台上寻求项目 主动的商务拓展 最近接触了一些具备一定数据标注技能的朋友,有个人做数据标注兼职的,也有组建过标注团队接单的,虽然说他们的专业性.标注效率等 ...
- 浅谈数据标注平台运营模式
现如今,AI行业发展火热各大巨头都投入巨资在此领域布局,智能驾驶.人脸识别以及近段时间正火的AI养猪都是AI技术应用在实际生活上的体现,毫不夸张的说AI技术正在逐渐改变我们的生活而我们的生活也将因此变 ...
- 数据标注平台哪家好?
数据标注平台是一种用于协助人工标注数据的工具.为了支持各种数据类型和应用场景,数据标注平台需要具备多种功能.下面详细罗列了数据标志平台需要具备的各种功能. 数据导入功能 数据标注平台需要支持多种数据格 ...
- ByteBridge数据标注平台:图像分类数据标注服务
ByteBridge数据标注平台:图像分类数据标注服务 2020年的一场疫情,打扰了人们工作与生活的节奏,但却无法打乱人们的爱美之心.物理条件的受限,不同产业线上线下的表现出现了天壤之别.但不可置 ...
- 【标注小课堂】关于数据标注平台设计的几点思考
最近好多小伙伴留言问关于如果开发数据标注平台怎么做?需要注意哪些问题?有没有相关资料?但是目前开源的相关资料几乎没有,刚好之前工作也设计过几款数据平台以及数据处理平台的设计.研发.测试的工作,所以就想 ...
- MindFlow SEED——由自动驾驶而生的全能高效数据标注平台
现在汽车行业混淆着一个概念,认为只要堆料,就能造出自动驾驶.作为智能汽车的命脉,数据是自动驾驶量产决胜的正负手,在多数人眼中,数据量越大.数据学习速度越快,自动驾驶就能更快完成数据闭环,实现自动驾驶技 ...
- 数据标注平台分析与使用经验
最近在做语音类的深度学习项目,手上有1000小时的数据需要标注,公司内部雇人标注是不太现实的,人员管理起来太麻烦,再加上项目比较紧急,所以找了几家数据标注平台,下面简单介绍一下吧. 什么是数据标注平台 ...
- 景联文科技—专业数据标注公司和智能数据标注平台
近年来,人工智能技术所带来的创新增量价值引人瞩目,各大企业开始在算力.算法.数据三大基础要素上做整体布局,加速推进人工智能产业进入效率化.工业化生产阶段.AI已成为数字经济时代的核心生产力,驱动着数字 ...
最新文章
- linux 保留内核中sas驱动的加载导致crash问题
- xslt中的Javascript取得xml中的参数
- 可见性得以保障,并不意味着_战略模式并不意味着春天!
- [html] HTML5如何播放ts视频流?
- Java web后端1 XML URI与URL HTTP Tomcat
- java socket 线程池_java socket编程的一个例子(线程池)
- c#中connect函数_C#.NET 各种连接字符串
- 学习Spring Boot:(八)Mybatis使用分页插件PageHelper
- 4月8日--关于Date的练习题--自定义获取当前时间
- sql server 比较大小
- AI研发新药真有那么神?可能哈佛、斯坦福和阿斯利康实验室都在吹牛
- JavaScript的可变参数介绍
- Android TextView 跑马灯滚动效果
- 面试官问:Java 中的锁有哪些?我跪了……
- SNMP TRAP实战
- 如何从虚拟机复制文件到实体机
- 用python 制作视频播放器
- 播布客视频PIT专用播放器MBOO2015
- 基于安卓的健康体检预约系统APP
- 什么是Android逆向?如何学习安卓逆向?Android逆向自学笔记入门到实战