doccano简介

doccano 是一个开源的文本注释工具。它为文本分类、序列标记和序列到序列任务提供注释功能。因此,可以为情感分析、命名实体识别、文本摘要等创建标记数据。只需创建一个项目,上传数据并开始注释。

安装

本文是基于anaconda来进行安装。

首先,在anaconda下创建虚拟环境:

conda create -n doccano python=3.9

注:建议python版本为3.9+

然后,激活doccano环境:

conda activate doccano

在doccano环境下安装doccano:

pip install doccano

运行

在doccano环境下执行:

doccano init

注:在初始化过程中可能会遇到如下报错:

django.db.utils.OperationalError: error in index django_celery_results_taskresult_hidden_cd77412f after drop column: no such column: hidden

此时的解决方案为:

pip uninstall Django
pip install Django==4.0.4

即更换Django版本为4.0.4。

初始化成功后,创建用户名和密码:

doccano createuser --username admin --password pass

然后再开启一个Web服务:

doccano webserver --port 8000

最后,再开启一个cmd命令框,进去doccano环境,运行一下命令:

doccano task

现在就可以在浏览器打开下面的链接,用刚才创建的用户名和密码进行登录,进行相关操作了。

http://127.0.0.1:8000/

具体使用方法请参见:如何使用文本标注工具doccano

文本数据标注平台-doccano安装使用教程相关推荐

  1. 文本标注平台 doccano 安装教程

    doccano简介 doccano 是一个开源的文本注释工具.它为文本分类.序列标记和序列到序列任务提供注释功能.因此,可以为情感分析.命名实体识别.文本摘要等创建标记数据.只需创建一个项目,上传数据 ...

  2. 文本数据标注工具doccano【介绍最详细的一遍文章】

    向AI转型的程序员都关注了这个号

  3. doccano数据标注平台使用

    Step 1. 本地安装doccano $ pip install doccano Step 2. 初始化数据库和账户(用户名和密码可替换为自定义值) $ doccano init $ doccano ...

  4. 数据标注基础知识:文本数据标注的类型及应用场景

    目录 一.文本数据标注的类型 二.文本数据标注的基本流程 三.文本数据标注应用场景 (1)新零售行业: (2)客服行业: (3)广告行业: (4)金融行业 自然语言处理是指用计算机对自然语言信息进行处 ...

  5. 数据标注平台哪家好?

    数据标注平台是一种用于协助人工标注数据的工具.为了支持各种数据类型和应用场景,数据标注平台需要具备多种功能.下面详细罗列了数据标志平台需要具备的各种功能. 数据导入功能 数据标注平台需要支持多种数据格 ...

  6. 【标注小课堂】关于数据标注平台设计的几点思考

    最近好多小伙伴留言问关于如果开发数据标注平台怎么做?需要注意哪些问题?有没有相关资料?但是目前开源的相关资料几乎没有,刚好之前工作也设计过几款数据平台以及数据处理平台的设计.研发.测试的工作,所以就想 ...

  7. MindFlow SEED——由自动驾驶而生的全能高效数据标注平台

    现在汽车行业混淆着一个概念,认为只要堆料,就能造出自动驾驶.作为智能汽车的命脉,数据是自动驾驶量产决胜的正负手,在多数人眼中,数据量越大.数据学习速度越快,自动驾驶就能更快完成数据闭环,实现自动驾驶技 ...

  8. 景联文科技—专业数据标注公司和智能数据标注平台

    近年来,人工智能技术所带来的创新增量价值引人瞩目,各大企业开始在算力.算法.数据三大基础要素上做整体布局,加速推进人工智能产业进入效率化.工业化生产阶段.AI已成为数字经济时代的核心生产力,驱动着数字 ...

  9. labelme标注需要精确标注吗_国内需要一个数据标注平台

    一.数据团队业务的痛点 过去一年中,我加入美图数据团队,虽然我的职位是开发,但平时也主动和leader以及同事聊到目前数据上的业务流程.先来说说美图公司的数据业务吧. 1.数据业务 即然是业务,就有甲 ...

最新文章

  1. Scrum Meeting 博客汇总
  2. linux进程--自旋锁和互斥锁的区别(十四)
  3. Android加速度传感器
  4. 计算机专业期末考试是编程序,武汉大学计算机学院C语言期末考试
  5. 软件工程基础-结对项目-WordCount(单词计数)
  6. 学成在线--14.使用RabbitMQ完成页面发布
  7. 功败垂成的王安石是大宋最后的体面
  8. IAR EW8051-8.10.4安装及破解方法
  9. 一个软件公司需要多少前端_内幕!软件外包公司开发一个软件需要多少钱?
  10. 四叶草启动linux黑屏,四叶草剧场黑屏进不去解决方法一览
  11. linux zip文件无法解压,无法解压zip文件在linux centos
  12. 什么是 Access Token
  13. 一文带你彻底厘清 Kubernetes 中的证书工作机制
  14. 前端开发笔记:记一次网站创建的过程
  15. 【Linux】Linux环境基础开发工具使用 —— yum | vim | gcc g++ | gdb | make makefile | 进度条 | git
  16. codevs奇怪的梦境(拓扑排序)
  17. android APN解析
  18. 腾讯微博开放平台授权教程(1)
  19. UE4开发常见问题:导入插件、代码调试、格式异常
  20. Python 进阶(六): Excel 基本操作

热门文章

  1. 松果时序数据库安装,3.0.2最新版本
  2. From Image to Imuge: Immunized Image Generation
  3. conj在c语言中什么意思,关于conj是什么词性
  4. 搜索引擎的数据库设计
  5. web飞信 接口解析
  6. win10鼠标右击 新建文件夹 反应缓慢、迟钝
  7. 自然数幂和 斯特林数
  8. 6:直角坐标系象限判断
  9. Word文档中--邮件合并
  10. java中bad request_IIS服务器返回Bad Request (Invalid Hostname)解决办法