作为国内领先的智能文本处理企业达观数据主办发起“达观杯”人工智能算法竞赛,每年一届,至今已成功举办四届。2021年,在CCF(中国计算机学会)自然语言处理专业委员会的特别支持下,第五届“达观杯”于7月正式拉开帷幕。本届“达观杯”为自然语言处理算法竞赛,围绕“基于大规模预训练模型的风险事件标签识别”的主题展开,积极推动国内NLP技术创新,努力拓展更多应用场景。

赛题背景

在大数据和人工智能技术加持下,不同行业的新兴风险控制手段也在高速发展。但这些风险信息散落在互联网的海量资讯中,如果可以及时识别出其中的风险事件并挖掘出潜在的风险特征,就能够大幅提升识别和揭示风险的能力。风险事件以文本的形式存在,需要采用自然语言理解模型实现风险事件的高精度智能识别,其本质属于一个文本分类任务。NLP(自然语言处理)作为人工智能领域皇冠上的“明珠”,其技术的科研创新一直精进不休。而文本分类在自然语言处理领域处于非常基础且核心的地位,目前文本分类已经广泛运用于金融、政务、银行、证券、运营商等各个行业中的多个场景中,如金融领域和政务领域的风险事件标签。很多领域的子任务通常也转化成分类任务,完整的分类任务处理包括了分类标签体系、标注数据、算法模型等不同环节。

赛题任务

本次大赛的任务是基于一定量的风险事件标注语料和大规模无标注的资讯文本,训练模型对资讯文本包含何种风险标签进行预测。大赛提供的数据集:风险事件分类的训练集规模是10000+,包含9个一级标签和35个二级标签;大规模无标注的文本规模是亿级,可供选手选择用来进行语言模型训练。数据性质均为新闻资讯数据,并且进行了字符编码(保留了句子划分的标点符号),文中的字符会转换成唯一的ID,ID之间使用空格进行分割。希望选手结合当下的前沿自然语言处理和深度学习技术,提升模型的训练性能和泛化能力,深入挖掘实现风险事件标签的精准识别。

数据简介

本赛事采用了互联网的新闻和资讯数据,目标在于识别新闻资讯文本中的风险事件标签。场景示例包括以下:

组队规则

丰厚奖励

 

其他奖励

  1. 比赛颁奖典礼将在CCF自然语言处理与中文计算国际会议(NLPCC)会场内举行,获奖队伍将得到中国计算机学会自然语言处理技术委员会的宣传支持,主办方将邀请最终成绩前10名队伍代表出席“NLPCC”大会
  2. 比赛排名Top30的选手将获得达观数据全职实习工作的面试直通机会,优先录用。
  3. “周榜单激励”,开赛后赛中开启持续5周“周榜单”活动。

周榜活动时间:8月12日-9月16日

周榜活动规则:

  • 初赛A榜开始后第三周开启“周榜单激励”活动,每周一公布截至上周日24点时周榜单TOP1团队信息,Top1团队即为“周冠军团队”
  • 经审核后,“周冠军团队”可获得价值300元的精美礼品一份,本活动每个团队最多领取2次奖品,超出则顺延至下一名次团队。奖品将在初赛结束后统一发放。

赛程安排

大赛采取线上比赛、线下颁奖的模式。选手于官方竞赛平台DataFountain报名、组队、提交作品测评。线上比赛结束,经作品审核后,排行榜前十名的获奖团队或个人将有机会出席CCF自然语言处理与中文计算国际会议(NLPCC)交流成果并参与颁奖典礼。

赛程安排如下:

2021年7月28日

大赛启动

2021年7月28日-9月19日

初赛A榜阶段(发布赛题,选手可登录大赛官网报名参赛、提交作品,每日最多在竞赛平台提交2次作品)

2021年9月21日(00:00-24:00)

初赛B榜阶段(选手可提交2次作品,但仅以最后一次作为有效成绩,B榜于24点定时公布排名)

2021年9月22日-9月29日

代码复现、晋级资格审核

2021年9月30日

公布决赛获奖名单

2021年10月13-17日

参加颁奖典礼(具体时间另行通知)

注:如因不可抗力或其他因素影响而变更时间,组委会将在第一时间通知获奖团队。若获奖团队来自于海外,则建议进行远程分享对接

组织架构

特别支持

中国计算机学会自然语言处理专业委员会

主办单位

达观数据

官方赛事平台

DataFountain

报名参赛

大赛面向社会各界开放,欢迎全国高校大学生、科技型企业自然语言处理爱好者登录DataFountain官网报名参赛,共同参与和研究实际业务场景下的人工智能技术问题。报名直通车:http://navo.top/E7NrY3(复制至浏览器报名)

达观数据携手CCF举办第五届“达观杯”自然语言处理文本分类竞赛 ,开赛报名中!相关推荐

  1. 第五届“达观杯”自然语言处理文本分类竞赛开启报名,丰厚奖金等你来战!...

    在 CCF(中国计算机学会)自然语言处理专业委员会的特别支持下,第五届"达观杯"正式拉开帷幕.达观杯是由国内文本智能处理领军企业达观数据主办发起的人工智能算法竞赛,每年一届,至今已 ...

  2. R语言构建文本分类模型并使用LIME进行模型解释实战:文本数据预处理、构建词袋模型、构建xgboost文本分类模型、基于文本训练数据以及模型构建LIME解释器解释多个测试语料的预测结果并可视化

    R语言构建文本分类模型并使用LIME进行模型解释实战:文本数据预处理.构建词袋模型.构建xgboost文本分类模型.基于文本训练数据以及模型构建LIME解释器解释多个测试语料的预测结果并可视化 目录

  3. 达观数据曾彦能:如何用深度学习做好长文本分类与法律文书智能化处理

    在NLP领域中,文本分类舆情分析等任务相较于文本抽取,和摘要等任务更容易获得大量标注数据.因此在文本分类领域中深度学习相较于传统方法更容易获得比较好的效果.正是有了文本分类模型的快速演进,海量的法律文 ...

  4. 达观数据桂洪冠:一文详解达观数据知识图谱技术与应用

    本文根据达观数据桂洪冠在"达观杯"文本智能处理挑战赛期间的技术直播分享整理而成,内容略有删减. ▌一.知识图谱的概述 我们先直观的来看一下什么是知识图谱,下面有一张图,从这张图里可 ...

  5. 达观数据搜索引擎排序实践

    前言 随着互联网的深入发展,人类已然进入大数据时代.如何在浩瀚的数据海洋里高速有效的获取有价值的信息,正是促使大数据技术具备走向众多企业的潜力.搜索引擎作为获取信息的有效入口,已然经历了20多年的发展 ...

  6. 一文详解达观数据知识图谱技术与应用——技术直播回顾

    本文根据达观数据桂洪冠在"达观杯"文本智能处理挑战赛期间的技术直播分享整理而成,内容略有删减. ▌一.知识图谱的概述 我们先直观的来看一下什么是知识图谱,下面有一张图,从这张图里可 ...

  7. 达观数据:文本大数据的机器学习自动分类方法

    随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类.组织和管理,已经成为一个具有重要用途的研究课题.而在这些数据中,文本数据又是数量最大的一类.文本分类是指在给定分类体系下,根据文本内容自动 ...

  8. 达观数据中标招商证券企业级数字员工管理平台项目

    近日,达观数据喜讯连连.凭借过硬的产品实力.技术创新能力以及优质的交付能力,成功中标招商证券企业级数字员工管理平台项目.该项目将整合现有RPA系统和内部平台,集成AI中台能力,搭建数字员工门户商店.精 ...

  9. 达观数据智能问答技术研究

    在机器人围棋大胜李世石.柯洁之后,人工智能越来越火.作为一项新兴技术,智能问答也是人工智能中必不可少的一环.智能问答一般用于解决企业客服.智能资讯等应用场景,实现的方式多种多样,包括简单的规则实现,也 ...

最新文章

  1. StartOS 5.0 正式版发布
  2. CF570D Tree Requests
  3. 【caffe解读】 caffe从数学公式到代码实现1-导论
  4. oracle log.xml分析,Oracle11g 中使用ADRCI 查看alert log文件(xml格式)
  5. 用计算机怎么弹离人愁数字,拇指琴新手入门曲谱——离人愁
  6. 前端之sublime text配置
  7. 微信小程序Mustache语法
  8. 关于生命周期函数dealloc的使用小结
  9. 2006 飞行员配对(二分图最大匹配)
  10. Linux网络管理常用命令:net-tools VS iproute2
  11. UE 材质编辑器快捷键
  12. 计算机讲Word文档中的组合,电脑Word文档中两个表格如何合并
  13. 视频分配器中提高信号完整性的方法
  14. Word如何删除尾注的横线(Office 2003)
  15. 基于PyQT5制作一个二维码生成器
  16. 12.12下周黄金白银价格走势分析及期货原油操作建议布局
  17. 10大主流压力测试工具推荐
  18. 利用BibTeX批量导入参考文献
  19. 指定位置插入字符串(c++insert函数、find函数使用)
  20. 程序人生 - Python 攻克移动开发失败!

热门文章

  1. Windows XP下安装配置声卡
  2. zeromq v.s. erlang
  3. 国庆创意H5哪家强?鹅厂这次刷屏了
  4. Linux之crontab(例行性任务)
  5. mininet在哪编写python脚本_【SDN专栏】Mininet下编写python,实现自定义的网络topo结构 | 学步园...
  6. 局域网硬盘 linux,linux局域网内磁盘映射
  7. XP系统CMCC-AUTO客户端自动认证配置教程
  8. 【Metashape精品教程14】五镜头倾斜数据空三 空三成果导入CC
  9. 线性代数 04.07 向量组的线性相关性 习题课
  10. VS2013 Windows7(X64被测试)安装方法 离线安装