《数学之美》第1章 文字和语言 vs 数字和信息
数字、文字和自然语言一样,都是信息的载体,它们之间原本有着天然的联系。
语言和数学的产生都是为了同一个目的——记录和传播信息。
1 信息
随着人类的进步和文明化的发展,需要表达的信息也越来越多,不再是几种不同的声音就能覆盖,语言就此产生。
2 文字和数字
当语言和词汇多到一定程度,人类仅靠大脑已经记不住所有词汇了。于是,高效记录信息的需求就产生了,这便是文字的起源。
文字按照意思来聚类,最终会带来一些歧义性。解决这个问题的方法,过去和现在没有什么不同,都是依靠上下文。对上下文建立的模型在好,也有失灵的时候,这是语言从产生伊始就固有的特点。
翻译这件事之所以能达成,仅仅是因为不同的文字系统在记录信息上的能力是等价的。文字只是信息的载体,而非信息本身。
罗塞塔石碑的启发:
(1)信息的冗余是信息安全的保障。
(2)语言的数据,我们称之为语料,尤其是双语或者多语的对照语料对翻译至关重要,它是从事机器翻译的基础。
数字:
中国:用个十百千万亿兆。解码的方法是乘法。200万的写法含义是:2 x 100 x 10000
罗马:用字符I表示1,V表示5,X表示10,L表示50,C表示100,D表示500,M表示1000.解码的方法是加减法——小叔子出现在大数字左边为减,右边为加。比如:IV表示:5-1=4;VII表示:5+2=7;IIXX表示:20-2=18
阿拉伯数字的革命性不仅在于它的简洁有效,而且标志着数字和文字的分离。
3 文字和语言背后的数学
任何事物的规律都是内在的,并不随它的载体而改变。自然语言的发展,在冥冥之中都受着信息科学规律的引导。
从象形文字道拼音文字是一个飞跃,因为人类在描述物体的方式上,从物体的外表进化到了抽象的概念,同时不自觉的采用了对信息的编码。
在通信时,如果信道较宽,信息不必压缩就可以直接传递;如果信道很窄,信息在传递前需要尽可能的压缩。然后在接收端进行解压缩。
《数学之美》第1章 文字和语言 vs 数字和信息相关推荐
- (一)文字和语言、数字和信息(从进化史看自然语言)
前言:数字.文字和自然语言一样,都是信息的载体,它们之间原本有着天然的联系.语言和数学的产生都是为了同一个目的--记录和传播信息.然而,为什么直到半个多世纪前香农博士提出信息论后,人们才开始把数学和信 ...
- 《数学之美》——第一章 个人笔记
数学之美 最近在读<数学之美>这本书,做一下个人笔记.看的是PDF,看完后会买一本的哦!版权意识还是有的. ps:图片文字都是这本书中的内容,侵权立删.会有点自己的理解. 第一章 文 ...
- 数学之美 第3章 统计语言模型
数学之美 第3章 统计语言模型 回顾一下: 前面两章都是基础知识,告诉我们自然语言的起源基础,和一些发展过程遇到的问题,第二章告诉我们规则:理解自然语言(即分析语句和获取语义)这种处理方法不可能实现智 ...
- 《数学之美》——第九章 个人笔记
数学之美 最近在读<数学之美>这本书,做一下个人笔记.看的是PDF,看完后会买一本的哦!版权意识还是有的. ps:图片文字都是这本书中的内容,侵权立删.会有点自己的理解. 第九章 图 ...
- 《数学之美》第一章读后感
第一章分别讲述了早期信息的传播,文字和数字的发展,文字和语言背后的数学三个部分. 我从中了解到了信息传递,不论是早期的远古社会,还是如今快速发展的互联网时代,其规律都是异曲同工的.比如信息传播的模型都 ...
- 《数学之美》选章精读
曾经花了一个月的时间阅读受推荐的书籍<数学之美>,对基于统计的自然语言处理的历史作一个大致的了解,每周精读一章,做下了一些粗略的笔记,算是有个交代吧. 第9章-图论和网络爬虫 概念 图论起 ...
- 【原创】《数学之美》读书笔记——第1章
写正文前的一段关于数学的感概~ 作为一名即将毕业的大四狗,经历了一年的考研时光,对数学重拾高中时的感觉,热爱. 还记得小学五年级前我是如此的痛恨数学,直到在五年级遇到了一位非常幽默的数学老师,是他让我 ...
- 度量相似性数学建模_数学之美读书笔记
2020年6月读,先通读一遍,随后为写读书笔记又重新读了一遍,收获颇丰,虽然没有很多数学或者编程方面的知识,但正如作者所说,这本书讲述的是道,而非术. 读这本书让我领略到了科学的趣味,并不是枯燥的敲代 ...
- 《数学之美》-吴军 读书笔记
从吴军的<数学之美>找到了伽莫夫的<从一到无穷大>,前段时间先整理了<从一到无穷大>的笔记.现在整理下<数学之美>以巩固下. 近段时间AlfaGo 与人 ...
最新文章
- ClearCanvas DICOM 开发系列 一
- django请求与响应(HttpRequest对象和HttpResponse对象)
- 浅谈二次元场景特征和绘制手法
- python第一周小测验_Python第一周小结
- CodeIgniter的快速操作
- linux修改su的PAM配置文件,linux pam安全认证模块su命令的安全隐患
- OSChina 周四乱弹 —— 要成立复仇者联盟了,来报名
- EL表达式的11个内置对象
- SQL 2014 AlwaysOn 搭建
- tftpd32+ tftpd64文件传输安装和使用教程【图文并茂】
- 蜘蛛采集单域名网站克隆镜像源码
- 公众号数据分析总结怎么做?教你玩转公众号后台数据
- 对象存储BOS服务介绍
- 2019年8月2 星期五 今日计划
- 2021年茶艺师(初级)考试资料及茶艺师(初级)考试技巧
- Tableau基础-第一章(初学者)
- Android读书笔记(一)
- 登陆页面+匹配数据库+提示登陆成功或失败
- 软文营销如何建立独特内容让读者自动掉入“圈套”
- 工具篇:解压缩工具 tar