阿里妹导读:阿里小蜜的算法专家们最近在意大利都灵筹备一场国际数据挖掘竞赛。这场竞赛的名字叫CIKM AnalytiCup,是全球著名的公开、公正的大数据开放式竞赛。

去年,这场比赛是与阿里云、深圳气象局合办,最终选手们成功建立降水预报模型,其中最好成绩为RMSE10.997,比主办方提供的标准线提高了25%,大幅提高了短期降水预报的准确性。今年,CIKM再次与阿里巴巴集团携手,与阿里小蜜团队一起举办本次竞赛。

阿里小蜜是什么?

阿里小蜜是阿里巴巴集团智能服务事业部旗下的面向电商领域的服务机器人。阿里小蜜所在的智能服务事业部,致力于以体验为核心,通过人工智能算法,以数据和技术为驱动,提升用户的服务体验以及解决问题的效率。目前围绕着智能对话、智能辅助、智能决策、智能管理4大核心体系通过人工智能技术全面赋能客户,引领服务的智能化升级。在2017年,阿里小蜜家族产品通过自然语言处理、知识图谱、深度学习等技术引领阿里小蜜从阿里走向行业,从中国走向国际,围绕这商家生态圈及阿里云生态圈,赋能数百万商家和全球中小企业,覆盖了英语、俄语、葡萄牙语、西班牙语、印尼语、泰语等多个国家和地区。

阿里小蜜吉祥物

在过去的一年中,阿里小蜜团队已经在文本匹配及迁移学习两个方向上做了很多工作,不仅在工业界落地,真实服务消费者,而且在一些重要的国际会议上,如ACL、WSDM、CIKM等,发表了多篇论文。例如在2018的WSDM上,我们提出了一个文本匹配模型的迁移学习框架,尝试解决了同种语言下的文本匹配模型的冷启动问题。

为什么会选择“跨语言短文本匹配算法”相关赛题?

随着人工智能时代的到来,大数据和算法成为了互联网企业发展的两个重要驱动力。作为人工智能重要的落地场景之一,以聊天机器人出现的智能服务系统,为企业减少大量劳动力的同时,也对提升用户体验具有重要意义。因此在过去几年中,聊天机器人成为了商业公司重金投入的热点。从微软小冰、亚马逊的Echo等到各种垂直行业的客服机器人,聊天机器人蓬勃发展,形态各异,又不乏共性。阿里小蜜正是阿里巴巴集团围绕电商领域构建的超级个人助理,不仅可以解决用户的各种信息咨询类问题,也可以帮助用户挑选商品,为用户订购机票等任务。

根据应答产生的方式,聊天机器人可以分为检索式、生成式或者混合式。在检索式的聊天机器人中,文本匹配模型是至关重要的一个模块,决定了聊天机器人解决用户问题的能力。文本匹配模型接受一个用户的问题,在FAQ数据集上寻找一个匹配的问答对,并将人工编写的答案回传给用户。为了构建一个文本匹配模型,不仅需要人工收集一个称之为FAQ(Frequently Asked Questions)的数据集,同时也需要人工标注一批用户问题与FAQ中问答对的匹配语料,用于训练模型。然而这种情况在一些小语种中不太现实,一方面缺乏相应的标注语料,另一方面了解小语种的NLP研发人员很稀少,这两个方面都限制了聊天机器人的研发。

阿里巴巴集团在去年开始明显加快了国际化的进程,不仅通过速卖通(AliExpress)覆盖了俄罗斯、西班牙等120多个国家和地区,而且还在不同地区收购或投资了当地的电商企业,比如收购了东南亚地区最大的电商Lazada,在印度地区投资了Paytm等。

未来,阿里巴巴集团将为20亿用户提供服务。在这样一个背景下,作为阿里集团内最大的服务团队,在服务好国内消费者的前提下,也需要思考如何服务好国外的消费者,其中就包括使用技术手段解决消费者的服务咨询类问题。然而,现有的技术手段需要大量的标注数据,以帮助深度学习或机器学习系统训练出有效的模型。但一些小语种(如印尼语、泰语、菲律宾语等)不仅缺乏大规模的标注数据,而且相应的算法研发人员也相当匮乏。如何为使用这些语种的国家和地区的消费者提供高质量的服务,将是对算法人员很大的挑战。因此我们设计了这种一个题目,希望将数据资源丰富的语言理解能力迁移到资源匮乏的语言上。

期待你的参与

通过本次比赛,我们不仅希望为学术界抛砖引玉,贡献一个在真实场景中需要面对解决的问题,而且希望有更多的优秀选手参与比赛,共同帮助我们提升聊天机器人的能力。未来,对于消费者,他们可以自由地选择语言,不管是使用官方语言(如英语)还是使用日常用语(如印尼语等小语种),都将得到高质量的服务。

在这项比赛中,为了使参赛人员关注于语言本身的特性及迁移能力上,我们做了一些限制,比如不要过分关注于机器翻译技术等。这些限制,本质上是为了回归问题本身,而不是利用外部的能力。在此之外,参赛人员可以发挥想象力和创造力,提出各种模型和解决方案。

本次大赛将向全社会开放,我们期待来自高等院校、科研单位、互联网企业等算法工程师,在这个舞台大展身手。

点击CIKM AnalytiCup 2018,进入阿里天池平台了解大赛详情、报名。

全球最强大脑在哪?阿里小蜜算法团队在寻找相关推荐

  1. 如何构建阿里小蜜算法模型的迭代闭环?

    简介: 伴随着 AI 的兴起,越来越多的智能产品诞生,算法链路也会变得越来越复杂,在工程实践中面临着大量算法模型的从 0 到 1 快速构建和不断迭代优化的问题,本文将介绍如何打通数据分析 - 样本标注 ...

  2. 阿里小蜜人工智能助理,唯一入选麻省理工十大突破性技术的中国代表

    从 2001 年开始,<麻省理工科技评论>每年都会评选出当年的"十大突破性技术".这份报告会对未来的科技发展方向进行分析与预测,在全球科技领域都有着举足轻重的作用. 今 ...

  3. 颠覆传统的电商智能助理-阿里小蜜技术揭秘

    http://www.infoq.com/cn/articles/electricity-supplier-intelligent-assistant 一.双11的挑战与服务模式的转型 在全球人工智能 ...

  4. 未来已来!阿里小蜜AI技术揭秘

    原文链接 1.双11的挑战与服务模式的转型 在全球人工智能领域不断发展的今天,包括Google.Facebook.Microsoft.Amazon.Apple等互联公司相继推出了自己的智能私人助理和机 ...

  5. 2017年出品干货 | 阿里小蜜-电商领域的智能助理技术实践

    作者简介 陈海青,阿里巴巴智能服务事业部资深技术专家,在阿里从事智能人机交互领域相关的工作和研究8年,带领团队构建了阿里巴巴智能交互机器人系统.本文来自陈海青在"携程技术沙龙--人机语义交互 ...

  6. 智能人机交互在电商领域的技术实践 ——阿里小蜜

    智能人机交互在电商领域的技术实践 --阿里小蜜 人机交互  聊天机器人 阅读716  作者:周伟,陈海青  责编:何永灿,欢迎人工智能领域技术投稿.约稿.给文章纠错,请发送邮件至heyc#csdn.n ...

  7. 拆开阿里小蜜的内核,看智能人机交互的实现逻辑

    在全球人工智能领域不断发展的今天,包括Google.Facebook.Microsoft.Amazon.Apple等互联公司相继推出了自己的智能私人助理和机器人平台. 智能人机交互通过拟人化的交互体验 ...

  8. 深度学习核心技术精讲100篇(四十六)-情感分析算法在阿里小蜜的应用实践

    前言 人机对话一直是自然语言处理领域内的重要研究方向之一,近年来随着人机交互技术的进步,对话系统正逐渐走向实际应用.其中,智能客服系统受到了很多企业尤其是中大型企业的广泛关注.智能客服系统旨在解决传统 ...

  9. 揭秘阿里小蜜:基于检索模型和生成模型相结合的聊天引擎 | PaperDaily #25

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

最新文章

  1. 如何在sqlite3连接中创建并调用自定义函数
  2. maya批量命名插件_教你玩转MAYA的四十二精华造诣(第一期)
  3. 成功解决ERROR: Unable to find the development tool `make` in your path; please make sure that you have t
  4. 不小心删表删库了,还能救
  5. 获取当天0点数据scala实现
  6. linux 删除乱码的文件夹,Linux服务器删除乱码文件和文件夹的方法
  7. [bbk2908]第4集 - Chapter 03 - 介绍RAC的体系结构
  8. 华为云发布五大新品,这个成功实践也首次对外公开
  9. 绿洲因涉嫌抄袭下架;Facebook 泄露 4.19 亿条用户数据;Go 1.13 发布 | 极客头条...
  10. java正则表达式获得html字符串中图片的url地址
  11. 拓端tecdat|新能源车主数据图鉴
  12. 韩国被申遗 (转自果壳)
  13. 四元数和旋转_使用OpenCV的四元数
  14. These dependencies were not found:问题
  15. i.MX6 交叉编译zlib、yasm、xvidcore、libpng、x264、jpegsrc、ffmpeg
  16. arduino步进电机程序库_Arduino步进电机控制示例
  17. 微信公众测试号授权登录 学习笔记
  18. 2021-2027全球与中国天然眼部卸妆产品市场现状及未来发展趋势
  19. 【渝粤教育】国家开放大学2018年秋季 1318T社会统计学 参考试题
  20. API接口:公司信息查询在线工具应用

热门文章

  1. 70 个数据分析常用网址,我先收藏了!
  2. Python骚操作!你还在用PS制作电子签名吗?
  3. 那些功能逆天,却鲜为人知的pandas骚操作
  4. 中秋佳节,这个网络安全 7 年经验的大佬来发福利了!
  5. html table导出excel 插入图片_前端 Table 用 JS 导出EXCEL(支持大量数据,保留报表格式) - pensive2019...
  6. mysql与mimic安装_MIMIC专题 | MIMIC数据库的安装
  7. 一句话理解tf.identity的含义
  8. [TCP/IP]TCP服务端accept发生在三次握手的哪一个阶段
  9. Hash(4) hashtable,hashmap
  10. ###Fedora下安装Retext