策划编辑 | Vincent
编辑 | Natalie、Debra
AI 前线导读:一年一度的博鳌亚洲论坛于 4 月 8-11 日在海南博鳌拉开帷幕,作为一场国际化的交流活动,论坛吸引了来自世界各地的参与者。作为本次论坛的一大亮点:AI 同传可以说是抢足了风头,不仅参会的人们能够在活动现场感受科技带来的改变,没有参会的群众也表示强烈关注,想一睹 AI 同传到底有多么高大上。然而就在昨天,网友晒出的一张图片打破了人们对 AI 同传的各种幻想,引来了不少吐槽,不管是专业翻译人士,还是机器翻译专家,都纷纷发声。那么问题来了,AI 翻译想要媲美甚至超越人类,到底还有多远的路要走?

更多干货内容请关注微信公众号“AI 前线”,(ID:ai-front)

AI 同传亮相(瞎)博鳌论坛

本届博鳌亚洲论坛首次启用 AI 翻译为现场嘉宾提供同传服务,然而仅仅一天过后,AI 同传“掉链子”的消息就在网上散播开来,甚至有传言称:现场不得不再次聘请人工翻译“接盘”。

“一带一路”被翻译成“一条公路和一条腰带”等不恰当表述

除了翻译不准确的问题意外,现场还被爆出翻译系统崩溃“抽风”,出现乱码的情况,不知现场嘉宾看到这样的翻译时,心里作何感想:

抱歉,我们是真的看不懂这段“文字”想说什么

腾讯方面在今天也已做出回应,称这是个乌龙事件,外界提及的邀请人工同传,并非“腾讯同传”团队用于此次海南博鳌的现场 AI 同传,而是用于服务腾讯新闻团队北京直播间的专业报道。

腾讯承认,面对博鳌亚洲论坛复杂的语言环境和高大上的专业内容,“腾讯同传”确实出现了错误,答错了几道题。腾讯表示,作为创新孵化和落地的 AI 产品,“腾讯同传”还在不断学习和成长当中,但是不足就是不足,不足的地方就要继续加强学习。

看笑话的人类

腾讯 AI 同传在博鳌论坛上“掉链子”的事故一出,各方人士的反应不一,基本上分为三拨:吐槽的吃瓜群众,看笑话的翻译界人士(不乏理智思考者),以及为 AI 翻译挽尊或理智分析问题可能原因的技术专家和 AI 研究者。

这让人想起今年 3 月份,微软宣布“其研发的机器翻译系统首次在通用新闻翻译的汉译英达到了人类专业水平,超越业余译者,实现了自然语言处理里程碑突破”,结果引起诸多吐槽、分析、和评测。并一度掀起了对机器翻译到底能否媲美甚至超越人类,机器翻译的进展到底会对人类翻译员产生什么影响等“老生常谈”的问题大讨论。

同样地,这次腾讯的事故又将这一幕上演了一遍。

翻译界

翻译界一片唏嘘和自嘲“饭碗终于暂时保住了”的声音,比如这位从事翻译的知乎用户“翻一姐”道出了一部分翻译人士的心声:

但同时也有比较理智,冷静分析腾讯 AI 同传在这么重要的场合犯错反映出的问题:这么高大上且带有浓厚政治色彩的博鳌论坛,腾讯敢押注 AI,出错后也主动说明原因并辟谣:这已经很能说明目前政府和大企业对机器翻译的看法了。

也有人表示,现在虽然机器翻译的水平差强人意,但是近年来机器学习的发展很快,译稿需要人工处理的地方越来越少,成为辅助翻译人员快速做任务的有力帮手。

但进步却掩盖不了市场上的确存在的过度宣传问题,某些大企业大肆鼓吹 AI 翻译将会代替人工翻译。对此,有豆瓣网友做了比较冷静的分析,认为总有一天机器翻译可能会像律师、医生、健身教练等职业一样被机器取代,现在机器翻译取代人工翻译这个领域之所以会这么活跃,获得资本的青睐是因为不同于传统一些担任技术和道德风险较大的行业,如医疗行业,在翻译这个领域犯错的成本较低,也对错误有更大的容忍度。但大家需要对市场公关对 AI 的过度吹嘘宣传保持警惕,有自己的判断。 引用一位豆瓣用户的评价,大企业的公关传播社会化执行力惊人,“一分的产品吹成十分都不及格,吹出一百分也不为过。”

专家和 AI 研究者

机器翻译在重大场合犯错其实不是一次两次了,比如科大讯飞、搜狗等都因为机器翻译闹出过笑话,但大企业仍然乐此不疲,前仆后继投入 MT 的开发和研究。

从技术角度出发,一些专家和 AI 研究者也对此次腾讯 AI 同传在博鳌论坛上的表现做出了评价,例如清华大学计算机硕士、卡内基梅隆大学计算机科学硕士,曾担任 360 搜索技术负责人的陈利人。

此次,陈利人在微博上发表了自己的看法:

深度学习系统一旦发疯,都束手无策,因为不可解释性。要是自动驾驶这样就麻烦大了。

这条微博引起圈内人士的转发和评论,这其中有人质疑,腾讯 AI 此次的表现让人啼笑皆非可能是系统模型的粗陋,“感觉像是上错了系统,直接丢了一个 seq2seq 进去的样子。”也有人从中看到了黑箱问题的局限,提出在大型活动时要有预案。

对机器翻译产品的性能,用户有自己的使用体验,技术专家和研究者也有自己的技术评判。现任京东硅谷研究院主任研究员、NLP 资深专家李维博士(微博账号:立委 _ 米拉)曾发表过两篇文章,对微软、百度、谷歌、有道等机器翻译产品进行了效果比对,并认为“机器翻译超越业余水平已成事实”,但这几家公司的产品还存在问题,他还指出了 MT 接下来的突破点,两篇文章链接在此,感兴趣的朋友可以进一步了解,也可以用文中的评测文字对比一下腾讯翻译君的表现:

http://blog.sciencenet.cn/blog-362400-1104572.html

http://blog.sciencenet.cn/home.php?mod=space&uid=362400&do=blog&id=1104695

AI 翻译离人工水平到底还有多远?

机器翻译真的会取代人类吗?

Yes and No。

今年 3 月 14 日,由微软亚洲研究院与雷德蒙研究院的研究人员组成的团队宣布,其研发的机器翻译系统在通用新闻报道的中译英测试集上,达到了人类专业译者水平。这是首个在新闻报道的翻译质量和准确率上媲美人类专业译者的翻译系统。

对于 NLP 的发展而言,这确实是是个里程碑一般的突破。但是,请恕小编无礼,根据小编多年的使用经验,在英译中的表现,微软的翻译系统并没有那么强大:

这是吴恩达着手准备新书的推特,经过微软的翻译如上图所示,看上去有些难懂对吗?那么谷歌翻译能做到什么程度呢?

这只是两个小小的实验,为了说明问题:人工智能翻译系统虽然目前取得了非常好的成绩,但是以目前的水平,想要取代专业翻译人士,怕是有些困难。

哪怕有了深度学习模型,如果语义理解做的不到位,依然解决不了机器翻译存在的问题。

上文我们提到李维先生对几家主流翻译产品进行了对比,根据他的测评:“搜狗和有道可以并列第一、谷歌第三、百度第四,微软,对不起,你还欠了火候:不仅是比不了谷歌,其他小兄弟也比你更准更顺。(也有人说,线上的不是他们的新版,最新的技术还没进去,我们拭目以待吧)。”

这里引述知乎答主田月的回答,进一步解释:

(原答案链接:https://www.zhihu.com/question/51097484/answer/124146726)

现在的本地化产业中,机器翻译到底是用来干什么的呢?新闻媒体是不会直接用机器翻译来翻译社论的,制造商也不会用机器翻译来翻译产品说明书。目前就我所知道的纯机器翻译直接使用的最大的市场,是翻译电商或者其他网站的搜索词 (search queries) 或是用户评论。这个情景的特点是:因为要求翻译得非常快,或者量非常大,人工翻译根本不可能。要不就用机器翻译,要不就没有翻译,这又回到第一条的观点,机器翻译虽不完美,但比没有强。实际上,因为有些厂商会雇佣人工来校对或修改机器翻译的这些评论,或是对搜索词翻译进行事后评价,我曾听到过有人认为机器翻译实际上为人工翻译提供了更多的工作机会。

可以这样总结:在特定的场景中,在给定了充足的背景资料的前提下,机器翻译或许真的可以比人工翻译做的要好一些,同时由于是机器翻译,速度也会比人工快一些。然而这正是机器翻译的局限性所在:无法快速响应复杂情境下的翻译,如果临时切换了话题和场景,机器翻译或许就无法达到特别高精度的翻译水准了。

2017 年,深度学习 NLP 领军人 Chris Manning 教授曾表示:相比语音识别,神经机器翻译还差得很远,虽然现在已经好到可以用(useful),但我想大概再过 5 年,会变得真的很好,超越一个界限,用起来很顺手(usable),方便人们沟通和交流。

“再过 5 年”、“提前 7 年”,相信很多用户都不怎么在乎机器翻译能不能替代人工,而更多的是希望 AI 翻译什么时候能变得更加好用。在 AI 蓬勃发展的时代,我们见到了太多华丽、浮夸的宣传与报导,但是我们更愿意相信这些宣传是建立在真正好用的基础之上,这次的博鳌亚洲论坛虽说只是出现了一些小失误,并未引起什么重大事故,如果有一天 AI 翻译被用在了更加重要的场合,一旦出现了这种情况,后果恐怕不仅仅是遭到调侃这么简单了。

有网友这样评价这次的翻译事件:

说实话我很期待 AI 技术的发展,如果有一天 AI 翻译能完全取代人类,任何的宣传都不过分。不过语言作为人类文明高度发展的产物,是人类复杂思维的载体,如果说 AI 可以完全突破人类的语言障碍,能够跨越各国语言所包涵的深层次文化差异的话,那么可以想见的是 AI 也可以写小说、写诗、做科研、写程序、得诺贝尔奖、管理腾讯,到时候马化腾爸爸都下岗了,我还怕什么? 目前看,AI 更多地是作为一种噱头,一种提振股价、获得投资的工具罢了。

面对企业和部分媒体的过度宣传,相信不少人对于AI都抱有如上想法。

作为AI时代的亲历者与AI信息与技术的传播者,我们只希望有更加可用、好用、耐用的AI产品出现,能够打破AI在用户心中的刻板印象。没有夸大其词的宣传,不要动不动就“超越人类”,如果是真正好用的AI产品,想必也不会因为技术上的失误就引来一片冷嘲热讽。

参考链接:

1.https://www.zhihu.com/question/27161394https://weibo.com/lirenchen?profile_ftype=1&is_all=1#_06

2.mp.weixin.qq.com/s/ByJMqhq2O…

3.https://weibo.com/u/2316531634?from=myfollow_all&is_all=1

4.http://blog.sciencenet.cn/blog-362400-1104572.html

5.http://blog.sciencenet.cn/home.php?mod=space&uid=362400&do=blog&id=1104695


更多干货内容请关注微信公众号“AI 前线”,(ID:ai-front),回复“公开课”可获得AI前线历史直播课程。

腾讯AI同传博鳌会上闹乌龙,技术界和翻译界怎么看?相关推荐

  1. 腾讯AI Lab涂兆鹏:如何提升神经网络翻译的忠实度 | 附PPT + 视频

    本文为 1 月 4 日,腾讯 AI Lab 高级研究员--涂兆鹏在第 22 期 PhD Talk 中的直播分享实录. 机器翻译是自然语言处理的经典任务之一,涉及到自然语言处理的两个基本问题:语言理解和 ...

  2. 今晚直播 | 腾讯AI Lab涂兆鹏:如何提升神经网络翻译的忠实度

    「PhD Talk」是 PaperWeekly 的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果.我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义 ...

  3. 腾讯AI Lab涂兆鹏:如何提升神经网络翻译的忠实度 | PhD Talk #22

    「PhD Talk」是 PaperWeekly 的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果.我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义 ...

  4. 技术界与翻译界的交锋:机器翻译离我们还有多远? | 清华AI Time

    来源:大数据文摘 本文约4350字,建议阅读7分钟. 机器翻译对于人工翻译而言是威胁还是可利用工具?在多大程度上机器翻译又能帮助普通用户呢? 作为自然语言处理中一项非常重要的应用,现代意义上的机器翻译 ...

  5. 腾讯回应博鳌AI同传:系谣言,承认出现失误

    作者 | 明明 出品 | AI 科技大本营(公众号ID:rgznai100) 2018 年 4 月 8 日- 4 月 11 日,博鳌亚洲论坛在海南举行.此次论坛汇聚了全球 60 多个国家 2000 多 ...

  6. 讯飞AI同传被指造假:同传译员亲自揭发,讯飞用人类翻译冒充AI

    郭一璞 乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 2018年9月,人类的AI技术已经可以流畅实现同传了? 一场国际会议上,的确出现了"AI同传",来自知名语音识 ...

  7. 腾讯AI翻译搞砸成笑话,马化腾仅给你勇气就够了?

    作者|震霆            出品|遇见人工智能        公众号|GOwithAI 久久不见久久见,久久见过还想见. 今天上午主席一句海南经典民歌拉开了博鳌亚洲论坛的大幕. 博鳌亚洲论坛的规 ...

  8. 腾讯AI Lab:深度解读AI辅助翻译的研究及应用

    11月13日,深圳 - 腾讯AI Lab今日发布了一款AI辅助翻译产品 - "腾讯辅助翻译"(Transmart),可满足用户快速翻译的需求,用AI辅助人工翻译提高效率和质量.该产 ...

  9. 第二期腾讯AI加速器将面向全球招募AI创业者

    2018年1月9日,腾讯众创空间CES之夜在美国拉斯维加斯举行,众创空间英文官网(http://westart.tencent.com)上线.与此同时,腾讯AI加速器宣布面向全球招募,并交上了一份答卷 ...

最新文章

  1. ROS限速教程全集很实用
  2. 数据结构:单向链表的反转
  3. Python标准库的强大功能的相关介绍
  4. jquery中ajax格式
  5. LeetCode:棒球比赛【682】
  6. 编程语言50年来的变化,我用50种编程语言告诉你“Hello world”怎么写!
  7. MySQL日期、字符串、数值型转换
  8. JavaTPoint 编程语言中文教程【翻译完成】
  9. [Alpha阶段]第二次Scrum Meeting
  10. BigDecimal的add方法
  11. Weblogic 部署问题及解决方法
  12. c语言程序调试方法有哪些,c语言程序的调试方法有哪些
  13. 对项目工时的估算: PERT(计划评审技术) 三点估算法
  14. EMC VMAX关于vault有关的概念
  15. LiLeiHanMeiMei的隐式马尔可夫爱情
  16. 文章标题一个应届计算机毕业生的2012求职之路
  17. python 爬虫小案例 8684网站爬取北京公交路线站点信息。
  18. 奇瑞鲍思语将十万级无界Pro推出市场
  19. FST(Finite State Transducers, 有限状态转换器)简介及示例
  20. 如何实现情感分析在舆情场景下的千人千面效果——情感分析在舆情中的研发实践(上)

热门文章

  1. 天梯赛练习——L2-028 秀恩爱分得快
  2. 搭建Spark Standalone集群
  3. c语言return返回有什么作用,C语言中return用法?
  4. 如何修复“网络路径”,错误代码0x80070035,网络共享
  5. android sqlite自定义函数,如何在SQLite中创建用户定义的函数?
  6. 居中元素的 scrollleft 的计算方法
  7. Win7 服务优化个人单机版
  8. 第三章 运算方法与运算器
  9. python提高照片分辨率_如何在python中提高图像的分辨率一个可能的解决方案?
  10. 全球最高摩天轮落户北京 高208米直径193米(图)