浅析机器翻译发展历程——某节课课堂测试

为什么会有机器翻译?其实从那块罗赛塔石碑上我们就可以发现人类文明发展对翻译的强烈需求,而机器翻译不过是在人类翻译史里出现的一种以机器为工具的翻译方法。
前苏联科学家曾用4种语言的卡片、一部打字机、以及一部旧式的胶卷照相机发明了人类历史上第一台双语翻译的机器,也就是机器翻译的第一种形式。这就是最初我们模仿人工翻译的对应原则发明的翻译机器。尽管当时被人们认为无用,但在1956年被人们重新发现。当时正值冷战,美国对于英译俄的需求剧增,于是IBM研制出了将60个俄语句子自动翻译成英语的一套方法。各国间就此展开了竞争,机器翻译迅速成为研究热点。起初,人们对语言和语言学的认识会使机器翻译设计者“自然而然”地首先遵循基于规则的词法、句法分析的道路进行探索。第二,那时候机器能力有限,也缺乏机器可读的大规模语料库,所以几乎没有滋生统计机器翻译模型的土壤(虽然有研究者开始利用统计方法从一定规模的语料库中提取双语词汇和语法信息,但那只是局部的统计方法)。所以,这一时期的机器翻译以基于规则的方法为主。随着若干机器翻译系统被陆续研制出来并投入使用,人们得以直接观察和评
论机器翻译系统的输出结果。但观察得到的总体印象是:机器翻译的质量与期望相差甚远。并且,学者们越来越体会到语言的复杂性,越来越感受到机器翻译面对人类变化无常的语言无力穷举。接下来发生的事便是上述理性认识合乎逻辑的发展结果:1966年,美国的自动处理咨询委员会(ALPAC)宣称机器翻译昂贵、不准确、且没有希望,即著名的 ALPAC 报告。该报告的影响是深远的,以致美国政府对机器翻译的支持几乎都停止了,而且一停就是十年,世界范围内机器翻译热潮也突然消失了,从第一个波峰深深地跌入了波谷。机器翻译遇到如此大的挫折,其实是无可避免的:第一,那时的计算机计算能力和存储能力还不够;第二,基于规则的翻译方法是人类分析之所长,但恰恰是机器分析之所短。
但是,人类错误认知的一篇报告阻挡不了事物发展的必然规律——翻译需求将随着全球化的扩展不断增强。需求促进了研究的再次兴起。不仅基于规则的方法以及基于“中间语言”的方法仍在不断增加研究深度,个别新的方法也开始被提出,如Nagao(1984)基于实例的机器翻译方法。这个方法虽然不算是一次彻底的变革,但显然是向前迈进了一大步。因为这个方法启发了人们可能机器翻译可以无需花费多年的时间建立规则和例外。之后,随着计算机处理能力的不断提高和大规模语料库逐步构建,革命性的发明——统计型机器翻译出现了。较之基于规则的系统,机器翻译的性能得以显著提升,很快催生了商业化的的互联网机器翻译系统。这里淋漓尽致地展示了大数据的力量:人类的翻译知识和经验其实已经最大限度地“隐式”地反映在极大规模的双语语料库中了。统计机器翻译模型不需要人的任何帮助和介入,就可以有效挖掘和利用这些知识。到了2014年,机器翻译迎来了史上最大的改变——“深度学习”来了!神经网络并不是新东西,它的发明已经距今80多年了,但是自从2006年Geoffrey Hinton改善了神经网络优化过于缓慢的致命缺点后,深度学习就不断地伴随各种奇迹似的成果频繁出现在我们的生活中。于是,研究人员开始尝试将其应用于机器翻译领域。深度学习三大神中的Yoshua Bengio在2014年的论文中,首次奠定了深度学习技术用于机器翻译的基本架构。此文一出,Google如获至宝。很快地, Google于2016年正式宣布将所有统计机器翻译下架,神经网络机器翻译上位,成为现代机器翻译的绝对主流。
尽管神经机器翻译模型的内涵与统计机器翻译模型已经全然不同,其机理初看上去甚至难以理喻,但从外部特性来看,它们的基本点是完全一致的:第一,神经机器翻译模型具有更加广泛的一般性(与语言学研究几乎彻底分道扬镳);第二,更加体现了大数据的力量。此外,神经机器翻译模型比统计机器翻译模型更需要极其强大的计算能力的支持。
机器翻译从最初那个简单“无用”的小机器走到今天这一步,不仅是由人类科学研究的深入和创新推动的,更是从另一层面上体现了社会需求对技术进步的重要作用。而这种需求的产生又是生产力的提高,即其他科学技术的发展带动的。机器翻译只是一种工具,它的背后是一种历史必然,即人类这一物种繁衍壮大的过程中产生的信息流通效率必须跟上高速发展的生产力。而机器翻译发展历程中涌现的这些基于规则,实例,统计或是神经网络的方法,则是人类研究世界,研究问题所常用的思路决定的,或许也是人类的脑结构决定的,这一点我以后会深入探索。仅仅从这些方法的发明上看,我们可以发现人类的发明创造最开始就是模仿。基于规则的翻译就像是模仿我们小学时做的汉译英,根据词义和各种语言规则翻译。这也是因为最早的机器翻译是由语言学家研究的。之后出现了一个重大波折,因为人类这么多的辛苦研究却没有获得预期的良好翻译效果,美国语言自动处理咨询委员会发布了一份“终结报告”,机器翻译研究便几乎停滞下来。其实这很像我们个人的学习奋斗过程,刚开始是获取知识,然后根据已有知识产生的各种解决方法如果都不能在实际中取得良好效果,大多数人估计都会放弃甚至得出此路不通的结论,开始转向其它领域发展。但是历史发展带来的高效翻译需求终会把我们重新推回,去面对这个亟待解决的问题。此时计算机性能已大规模提升,人们发明了基于实例的方法。这个方法又进一步启发人们去摆脱规则的束缚,利用机器之所长。于是,基于统计的方法应运而生。之后又由于神经网络在其他领域的出色表现,科学家们开始把它运用到机器翻译上,取得了很不错的效果。这个过程说明各种不同技术的发展会相互促进,并且发明创造是具有一定偶然性的。但发展是必然会导致这些技术进步的。科技就是在必然中的偶然间一点点进步。

本文参考了一篇知网论文和多篇报道类资讯

浅析机器翻译发展历程——课堂测试相关推荐

  1. 计算机技术应用发展历程,浅析计算机应用技术发展的历程与方向

    浅析计算机应用技术发展的历程与方向 作者:闻红 来源:<科技创新与应用>2014年第35期 摘 要:在科技飞速发展的今天,计算机应用技术已不可替代的角色广泛的应用到了各个行业领域中.文章从 ...

  2. mpls 保留标签值_浅析MPLS多协议标签交换的发展历程

    一.MPLS概念 MPLS:multipule protocol label seitch 多协议标签交换,是通过一个叫label的东西来做交换转发的,这个label中可以承载多种协议payload, ...

  3. 浅析抖音发展历程及未来趋势

    抖音无疑是当前很火的短视频软件,在2022年用户数量达到了8亿,日活跃用户达到了7亿的两个巨大的数值.那么抖音为什么可以拥有今天这样庞大的体量,在抖音发布到如今抖音一步步发展的历程是怎么的,这些发展历 ...

  4. 人工智能概述、人工智能发展历程、人工智能主要分支、机器学习工作流程、完整机器学习项目的流程、机器学习算法分类、独立同分布、模型评估、深度学习简介

    日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) 1.1 人工智能概述 1 人工智能应用场景 2 人工智能小案例 ...

  5. 7 大主题!梳理神经网络中 Normalization 的发展历程

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本篇文章用于总结近年来神经网络中 Normalization 操作 ...

  6. 计算机视觉:目标检测的发展历程与基础概念

    计算机视觉:目标检测的发展历程与基础概念 目标检测发展历程 目标检测基础概念 边界框(bounding box) 锚框(Anchor box) 交并比 对计算机而言,能够"看到"的 ...

  7. 一家创业公司发展历程-真实记录

    文章大纲 一.前言 二.来这家公司之前的我 三.介绍我目前在公司的情况 四.公司发展历程与感悟 五.技术部门发展详述 六.总结 一.前言   昨晚就寝时,忽然脑子晃出来了一个东西-关于我职业生涯规划, ...

  8. .NET 6 平台系列1 .NET Framework发展历程

    自1995年互联网战略日以来最雄心勃勃的事业 -- 微软.NET战略, 2000年6月30日. 微软公司于2002年2月13日正式推出第一代.NET平台 .NET Framewrok 1.0.借助于自 ...

  9. 你需要了解操作系统发展历程

    本文我们大概回顾计算机操作系统发展历程,这里不会记录关于操作系统的完整历史记录,只是记录那些里程碑事件,看看各位接触计算机时,操作系统发展正处于哪个年代 起初 没有操作系统,没有编程语言或编译器,甚至 ...

最新文章

  1. 【深度学习】基于Torch的Python开源机器学习库PyTorch概述
  2. python magic文档
  3. 自定义PopupWindow弹出后背景灰色状态
  4. linux建立普通用户命令,Linux普通用户执行特定的命令配置
  5. 大剑无锋之UNION 和 UNION ALL (SQL)【面试推荐】
  6. IC Order search 的debugging关键点
  7. 【CF1200E】Compress Words【kmp】
  8. 操作系统03进程管理Process_Scheduling
  9. graphpad画生存曲线怎么样去掉删失点_GraphPad作生存曲线数据点超出轴限制
  10. sqlserver按'一二三四五'排序(hibernate对中文数字进行排序)
  11. 详谈归并排序时间复杂度过程推导----软考
  12. 【C语言】二维数组指针,字符数组指针输出程序实例(注释详细)
  13. 局域网vnc远程控制软件,那些超级好用的局域网vnc远程控制软件
  14. 湖南工业大学计算机学院有哪些社团,湖南工业大学学生社团联合会
  15. Cocoa-专业术语
  16. Scala入门小纸条(3)
  17. Linux 下查询 DNS 服务器信息
  18. 图像和流媒体 -- 帧率、分辨率、码流的概念和关系
  19. 服务器灰度部署和原理
  20. 炫舞服务器显示方框怎么回事,win10界面全是显示方块如何解决_win10系统界面出现白色方框该怎么去除-win7之家...

热门文章

  1. 细数1款国内外贸开源商城系统和15款国外的英文开源商城系统
  2. iOS扬声器和听筒模式的切换以及距离传感器红外感应的设置
  3. 按键控制led灯python程序_树莓派使用threading函数实现多按键控制LED灯
  4. RabbitMQ安装教程(超鸡细)
  5. iOS 给照片加水印,文字
  6. 云服务器扩容系统盘优点,UCloud云服务器扩容系统盘且不影响已运行数据「还得备份」...
  7. android课堂小测试,[小薇班]APPIUM自动化测试 优酷APP测试脚本编写实例
  8. 全球与中国佐米曲普坦市场深度研究分析报告
  9. 2020.12.16 ps临摹
  10. Go try 新提案靠谱吗?想简化错误处理了