自然语言处理:背景和概述
Natural Language Processing:Background and Overview
作者:Regina Barzilay(MIT,EECS Department,September 8, 2004)
译者:我爱自然语言处理(www.52nlp.cn ,2009年1月3日)

这堂课将要回答的问题(Questions that today’s class will answer):
1、什么是自然语言处理(What is Natural Language Processing (NLP))?
2、为什么自然语言处理比较难(Why NLP is hard)?
3、我们能够构建一个可以从文本中学习的程序吗?(Can we build programs that learn from text)?
4、这门课程将包含哪些内容(What will this course be about)?

一、 什么是自然语言处理(What is Natural Language Processing)?
1、计算机将自然语言作为输入或输出:
  图略……
  输入对应的是自然语言理解(NLU: Natural Language Understanding);
  输出对应的是自然语言生成(NLG: Natural Language Generation);
2、关于NLP的多种观点:
  A、人类语言处理的计算模型(Computational models of human language processing):
  ——程序内部按人类行为方式操作(Programs that operate internally the way humans do)
  B、 人类交流的计算模型(Computational models of human communication):
  ——程序像人类一样交互(Programs that interact like humans)
  C、有效处理文本和语音的计算系统(Computational systems that efficiently process text and speech)
3、NLP的应用(NLP Applications):
  A、“宝贝鱼”机器翻译(Machine Translation with Babel Fish)…….
  B、MIT翻译系统(MIT Translation System)……
  C、文本摘要(Text Summarization)……
  D、对话系统(Dialogue Systems)……
  E、其他应用(Other NLP Applications):
  ——语法检查(Grammar Checking)
  ——情绪分类(Sentiment Classification)
  ——ETS作文评分(ETS Essay Scoring)

二、 为什么自然语言处理比较难(Why NLP is hard)?
1、 歧义(Ambiguity)
 “At last, a computer that understands you like your mother”
对于这句话的理解:
  A、 它理解你就像你的母亲理解你一样(It understands you as well as your mother understands you);
  B、 它理解你喜欢你的母亲(It understands (that) you like your mother);
  C、 它理解你就像理解你的母亲一样(It understands you as well as it understands your mother)
  D、 我们来看看Google的翻译:最后,一台计算机能够理解你喜欢你的母亲(译者附加上去的,看上去Google的理解更像B)。
 A到C这三种理解好还是不好呢?(1 and 3: Does this mean well, or poorly?)
2、 不同层次的歧义(Ambiguity at Many Levels)
  A、 声音层次的歧义——语音识别(At the acoustic level -speech recognition):
  ——“ … a computer that understands you like your mother”
  ——“ … a computer that understands you lie cured mother”
  B、 句法层次的歧义(At the syntactic level):
   图略
   不同的结构导致不同的解释(Different structures lead to different interpretations)
   更多的句法歧义例子(More Syntactic Ambiguity)…….图略
  C、 语义(意义)层次的歧义(At the semantic (meaning) level):
   Two definitions of “mother”:
   ——a woman who has given birth to a child
   ——a stringy slimy substance consisting of yeast cells and bacteria; is added to cider or wine to produce vinegar
   这是一个词义歧义的例子(This is an instance of word sense ambiguity)
   更多的词义歧义例子:
    ——They put money in the bank
     = buried in mud?
    ——I saw her duck with a telescope
  D、话语(多语)层次的歧义(At the discourse (multi-clause) level):
  ——Alice says they’ve built a computer that understands you like your mother
  ——But she …
   … doesn’t know any details
   … doesn’t understand me at all
   This is an instance of anaphora, where she co-referees to some other discourse entity

未完待续:第二部分

 附:课程及课件pdf下载MIT英文网页地址:
   http://people.csail.mit.edu/regina/6881/

注:本文遵照麻省理工学院开放式课程创作共享规范翻译发布,转载请注明出处“我爱自然语言处理”:www.52nlp.cn

from:http://www.52nlp.cn/mit-nlp-first-lesson-introduction-and-overview-first-part/

MIT自然语言处理第一讲:简介和概述(第一部分)相关推荐

  1. MIT自然语言处理第二讲:单词计数(第一、二部分)

    MIT自然语言处理第二讲:单词计数(第一部分) 自然语言处理:单词计数 Natural Language Processing: (Simple) Word Counting 作者:Regina Ba ...

  2. MIT自然语言处理第二讲:单词计数(第三、四部分)

    MIT自然语言处理第二讲:单词计数(第三部分) 自然语言处理:单词计数 Natural Language Processing: (Simple) Word Counting 作者:Regina Ba ...

  3. DICOM标准及应用——第一讲 DICOM标准概述

    一 什么是DICOM? DICOM是Digital Imaging and COmmunication of Medicine的缩写,是美国放射学会(American College of Radio ...

  4. Python基础学习——面向对象编程(第一讲:面向对象概述、面向对象三个基本特征(封装性、继承性、多态性)、类和对象(定义类、创建和使用对象、实例变量、类变量、构造方法、实例方法、类方法、静态方法))

    面向对象是Python最重要的特性,在Python中一切数据类型都是面向对象的. 1.面向对象概述 面向对象的编程思想是,按照真实世界客观事物的自然规律进行分析,客观世界中存在什么样的实体,构建软件系 ...

  5. 网络安全第一讲 计算机网络安全概述

    一 网络安全基本概念 1.网络安全定义 安全在字典中的定义是为了防范间谍活动或蓄意破坏.犯罪.攻击而采取的措施. 网络安全就是为了防范计算机网络硬件.软件.数据被偶然或蓄意破坏.篡改.窃听.假冒.泄露 ...

  6. ccnp笔记: 闫辉CCNP第一讲(NP概述还有3层回顾)

    GNS3实验: 重要作用在R2中 ip route 1.1.1.0 255.255.255.0 fastEthernet 0/0 12.1.1.1(注:此句作用是让R3收不到1.1.1.0段) 设备连 ...

  7. 2019-0331视觉SLAM的学习第一讲

    视觉SLAM第一讲学习笔记 框架显示 第一讲主要内容 资源获取 框架显示 第一讲主要内容 我就不多bb后面三个概述了,今天开始说明一下SLAM的第一讲的内容,接下来13天每天按时按量完成任务,立个FL ...

  8. 项目管理培训资料(第一讲+第二讲,持续更新中.....)

    这是公司内部进行的项目管理培训资料,培训由我主持.目前已经进行了两讲,半个月一次:P 前两讲注重的是理论知识,没有太多实际的指导性内容,这也和培训的受众有关.本系列培训针对的是公司所有的开发人员,因此 ...

  9. 视觉slam爬坑——高翔深蓝学院——第一讲

    前沿:研二狗,之前一直是做四轴无人机控制的,现在退魔转来学学自动驾驶方面关于vslam的内容.现在关于slam相关的学习很火,尤其是有了高翔大佬的视觉slam十四讲之后,使得普通学生入门有了系统性的方 ...

  10. 【HNUMSC】C语言第一讲

    C语言第一讲 简介 C语言是一种底层语言 C语言是一种小型语言 C语言是一种包容性语言 #include<stdio.h> int main(){int a,i; a=6; for(i=1 ...

最新文章

  1. 用db-RDA进行微生物环境因子分析-“ggvegan“介绍
  2. 菜鸟配置SAMBA服务器之2
  3. 2006年世界杯小组赛日程表
  4. 家用电器用户行为分析与事件识别代码详解+修改后运行无误的代码
  5. junit注释_通过此注释改善您的JUnit体验
  6. 手机触摸屏的分类和原理,供大家选择手机时用
  7. Object Detection API 相关
  8. 【网友投稿】大家都在谈裁员,我却默默干倒了3家公司!
  9. 软件盘将dialog顶上去_Android dialog软键盘弹出顶起View
  10. springboot @value 默认值_原创 | 搞定默认值
  11. FDDB人脸库评价人脸检测模型超详细步骤
  12. 常用的向量矩阵求导公式
  13. 海外游戏广告应该怎么做
  14. C语言红楼梦人物分析系统
  15. mac如何用移动随E行连接有线网络(中国计量大学)
  16. 关于中国地图审图号的说明
  17. win7怎么设置计算机的性能,windows7旗舰版电脑如何为电脑设置高性能计划
  18. mac下mysql安装,忘记初始临时密码怎么破。
  19. 5800p计算机公式,我的5800p测量程序及公式-20210324065951.docx-原创力文档
  20. 算法---消除游戏(Kotlin)

热门文章

  1. Python基础学习-Python中最常见括号()、[]、{}的区别 2015-08-13 07:54 by xuxiaoxiaoxiaolu, 1138 阅读, 0 评论, 收藏, 编辑 Pytho
  2. 深度学习-LeCun、Bengio和Hinton的联合综述(上)
  3. 马云卖数据,你卖商品
  4. delphi xe firedac mysql_xe6+firedac 连接sybase
  5. Spring Cloud Alibaba - 15 微服务之间使用Feign实现参数的透传
  6. Spring Cloud Alibaba - 05 Nacos 领域模型_NameSpac/Group/Cluster
  7. Spring-AOP @AspectJ切点函数之@annotation()
  8. Python 命令行参数
  9. 数据结构-队(C语言代码)
  10. mysql查询时给字段加内容,mysql数据库查询之对应库对应表中的注释信息查询以及加字段查询...