人工智能的道路我们还有很长的路要走,我们期待一场未来与机器人的真正博弈,而这种博弈的结果是:人与机器的和谐共存,生活的更加便捷。从我们感受到的智能来举例,如果你的手机是iphone,那你一定不会对siri陌生,这个人机交互的神器,可以帮助我们读短信、介绍餐厅、询问天气、语音设置闹钟。当然,这都不算太高大上,真正让用户叫奇的是siri还能够不断学习新的声音和语调,提供对话式的应答。而siri所表现的种种智能,也不过是未来实现AI的冰山一角,庆幸的是我们或许能为未来的机器翻译,人机交互技术添砖加瓦,看到更好的智能应用。( 如果大家对siri的技术想更深入的了解的话,推荐一篇文章给大家:http://www.infoq.com/cn/articles/zjl-siri   )

我们知道早期的机器翻译都有板有眼的,使用的语料也多来源于新闻,看起来似乎还不是那么接地气,但是看到大家常常使用的谷歌翻译、有道翻译(感兴趣的也可以试试紫冬口译 中科院自动化所开发的)慢慢贴近生活,翻译的内容也越来越生活化,也就知道我们的技术也会越来越平易近人,这种贴近将不再满足于新闻报道、论文专利正统文字的翻译,而是日常交流口语的翻译。笔者这篇博客作为一个科普blog,大家一起来了解一下口语翻译的前世今生和关键技术。

口语翻译从总体上来看应该有三大模块组成:自动语音识别器、机器翻译引擎、语音合成器;显然传统意义上的机器翻译并不能完全适应这种口语式的翻译,只有当把翻译和识别看成一个整体,我们才能更好的服务于口语翻译的系统。因此在做翻译模块时,我们必须考虑到语音识别时存在的识别错误,我们也必须使得我们的翻译系统能更好的接受或者纠正这种错误,同时最好考虑到口语在语言学上的意义。不同于书面语,口语的句法相对松散,常常存在重复、冗余、省略、颠倒等多个“不规矩”的语法现象,而这一切也都会增加研究的难度。

列举几个典型的口语现象:

1.啊 打九折 行 下礼拜 下礼拜二三吧 (重复)

2.有房间吗 现在  (颠倒)

3.那个 可以预定吗 行吗 (冗余)

先来看看我们的前人们都做了些什么吧?1989年Speech Trans(美国CMU)作为第一个语音翻译实验系统与大家见面,此后的20多年期间,一匹针对不同领域的语音翻译系统相继问世,现在我们能看到的siri、google 翻译语音版、itranslate Voice 都已经慢慢被我们所熟知,相应的科技领域的探索也变成我们关注的热点:U-STAR(全球语音翻译前沿研究组织)组织的23国语音同声翻译技术(VoiceTra4U-M)应用也得到了成功的展示,语音翻译看起来也慢慢走下神坛。虽然语音翻译已经开始投入应用,但是现阶段的应用大多是限定领域的,如果想要具有真正意义上的通用性,我们还是会有更长的路要走的,我们希望我们未来的翻译可以完成知识库的自动扩充,我们希望我们未来的翻译可以实现人与人的无国籍的无障碍沟通。当然,这一切的实现,都不能脱离技术。

长期以来,使用的比较多的是一种面向中间表示的口语解析方法,采用IF格式理论,其基础是对话行为理论——即语言不是只用来陈述事实,而且还附载着说话人的意图。这样做的一个好处是,便于使用规则解析且能产生很好的准确率。缺点就是限定领域,且IF格式的使用构建耗费巨大。这里举个例子来说明IF格式的含义(以旅馆预定的语料为例):

明天我想要预定一个单人间

IF:c:give-information+reservation+room(room-spec=(room-type=single,quantity=1),reservation-spec=(time=(relative-time=tomorrow)))

表示含义:说话人为c,句子的意图是提供信息,主题是预定房间,而房间的类型为单人间,数量为1,预定的时间为tomorrow。

除了这个方法之外,还可以使用基于实例的方法,目前比较好的方法是基于统计的方法。然而回归问题的本质,目前的语言翻译核心大体相似——基于短语、基于层次化短语、基于句法,导致翻译结果的差异往往集中在语料的不同,以及输入格式的质量的差异上。因此笔者认为,如果核心的翻译过程不容易做改进的时候,不如转念想想语料的预处理该怎么去做,将会对我们的口语翻译有很大的帮助的。O(∩_∩)O

最后附图一张,希望机器翻译越来越好~

转载于:https://www.cnblogs.com/inspirationhyl/p/3938340.html

口语翻译——AI过程的必经之路相关推荐

  1. AI口语翻译,遇到的可不止口齿不清…….

    https://www.toutiao.com/a6717504788998652427/ 不论是学习外语,亦或是出国旅游等,不同的语言成为人与人之间沟通交流的障碍,市场对于翻译的需求不断上升,如今机 ...

  2. 中国AI军团称霸全球口语翻译大赛!搜狗夺冠,讯飞阿里二三

    https://blog.csdn.net/yH0VLDe8VG8ep9VGe/article/details/83629504 中国AI,再次称雄全球机器翻译大赛. 在刚刚落幕的IWSLT(Inte ...

  3. 实战 | 深度学习轻松学:如何用可视化界面来部署深度学习模型 转载 2017年12月27日 00:00:00 109 翻译 | AI科技大本营 参与 | 王赫 上个月,我有幸结识了 DeepCogn

    实战 | 深度学习轻松学:如何用可视化界面来部署深度学习模型 转载 2017年12月27日 00:00:00 标签: 109 编辑 删除 翻译 | AI科技大本营 参与 | 王赫 上个月,我有幸结识了 ...

  4. 必读 | 六月份不容错过的十大重磅好文,机器学习和数据科学的小伙伴拿走不谢 原创 2017-07-10 爱收藏的 AI科技大本营 作者 | Flavian Hautbois 翻译 | AI科技大

    必读 | 六月份不容错过的十大重磅好文,机器学习和数据科学的小伙伴拿走不谢 原创 2017-07-10 爱收藏的 AI科技大本营 作者 | Flavian Hautbois 翻译 | AI科技大本营( ...

  5. DL之Attention-ED:基于TF NMT利用带有Attention的 ED模型训练、测试(中英文平行语料库)实现将英文翻译为中文的LSTM翻译模型过程全记录

    DL之Attention-ED:基于TF NMT利用带有Attention的 ED模型训练(中英文平行语料库)实现将英文翻译为中文的LSTM翻译模型过程全记录 目录 测试输出结果 模型监控 训练过程全 ...

  6. 【编译原理笔记14】中间代码生成:布尔表达式的回填,控制流语句的回填,switch语句的翻译,过程调用语句的翻译

    本次笔记内容: 6-8 布尔表达式的回填 6-9 控制流语句的回填 6-10 SWITCH语句的翻译 6-11 过程调用语句的翻译 本节课幻灯片,见于我的 GitHub 仓库:第14讲 中间代码生成_ ...

  7. 高级语言的程序被翻译的过程

    像C/C++这样的高级语言写出的程序,被翻译的过程可分为四个阶段,如下图所示: 四个阶段如下: 一.预处理阶段 预处理器根据以字符#开头的预处理命令,修改原始文件,得到一个以.i为扩展名的文本文件. ...

  8. 计算机专业 英语口语,计算机专业英语口语翻译-重要控制键

    1.Num Lock (short for Numeric Lock) Like a light, Num Lock shifts the numeric keypad between calcula ...

  9. python爬百度翻译-Python爬虫实现百度翻译功能过程详解

    首先,需要简单的了解一下爬虫,尽可能简单快速的上手,其次,需要了解的是百度的API的接口,搞定这个之后,最后,按照官方给出的demo,然后写自己的一个小程序 打开浏览器 F12 打开百度翻译网页源代码 ...

  10. python实现翻译功能_Python爬虫实现百度翻译功能过程详解

    首先,需要简单的了解一下爬虫,尽可能简单快速的上手,其次,需要了解的是百度的API的接口,搞定这个之后,最后,按照官方给出的demo,然后写自己的一个小程序 打开浏览器 F12 打开百度翻译网页源代码 ...

最新文章

  1. UVA1146 / LA3211(ACM-ICPC 2004 Europe - Southwestern) Now or later(2-SAT问题 + 二分答案)
  2. 我在Archlinux下使用的软件
  3. 流媒体传输协议---RTP--基础
  4. GDCM:dicom文件的SHA1测试程序
  5. cmake 编译安装方法
  6. 女生心中的理想男生!这些条件你符合几条?
  7. 利用多线程句柄设置鼠标忙碌状态
  8. Hadoop问题:The auxService:mapreduce_shuffle does not exist
  9. 程序员未来的职业生涯路该怎么走,如何避免35岁中年危机?
  10. 网页中调用Google地图
  11. java系列2:方法的重载
  12. React-12 Context的使用
  13. 为贝尔吉比特电信G-120W-B光猫添加自动重启功能
  14. NBU备份vmware虚机创建静默快照失败
  15. 【2020年高被引学者】 汤继良 密歇根州立大学
  16. 学计算机的能看出批图吗,P过的图片能看出来吗?给你4个鉴别方法!
  17. 以预测股票涨跌案例入门基于SVM的机器学习
  18. 凤凰系统基于android x x86,凤凰系统X86版pc客户端_凤凰系统X86免费版_易玩网
  19. iOS/iPadOS中Office中文字体显示不正确的解决方法
  20. Eclipse常规设置(我的Style我做主)

热门文章

  1. 史海峰:在时代节点上顺势而为是一种幸运
  2. 洛谷8月月赛I Div.2题解
  3. SD卡插电脑上有声音但是没有盘符的解决办法
  4. 关键词快速排名至百度首页的技巧
  5. 大学生计算机实验基础考试题库,大学生计算机基础考试题库完整.pdf
  6. 创业1.2,创业就是三个字
  7. 基于SSM的题库考试试卷管理系统-JAVA.VUE【数据库设计、开题报告】
  8. 五个免费海报制作网站推荐分享
  9. WPF-CefSharp基于C#的客户端内嵌网页-2(性能和展示问题)
  10. android base64的参数,android.util.Base64编码/解码标志参数