数字、文字和自然语言一样,都是信息的载体,它们之间原本有着天然的联系。

语言和数学的产生都是为了同一个目的——记录和传播信息。

1 信息

随着人类的进步和文明化的发展,需要表达的信息也越来越多,不再是几种不同的声音就能覆盖,语言就此产生。

2 文字和数字

当语言和词汇多到一定程度,人类仅靠大脑已经记不住所有词汇了。于是,高效记录信息的需求就产生了,这便是文字的起源。

文字按照意思来聚类,最终会带来一些歧义性。解决这个问题的方法,过去和现在没有什么不同,都是依靠上下文。对上下文建立的模型在好,也有失灵的时候,这是语言从产生伊始就固有的特点。

翻译这件事之所以能达成,仅仅是因为不同的文字系统在记录信息上的能力是等价的。文字只是信息的载体,而非信息本身。

罗塞塔石碑的启发:

(1)信息的冗余是信息安全的保障。

(2)语言的数据,我们称之为语料,尤其是双语或者多语的对照语料对翻译至关重要,它是从事机器翻译的基础。

数字:

中国:用个十百千万亿兆。解码的方法是乘法。200万的写法含义是:2 x 100 x 10000

罗马:用字符I表示1,V表示5,X表示10,L表示50,C表示100,D表示500,M表示1000.解码的方法是加减法——小叔子出现在大数字左边为减,右边为加。比如:IV表示:5-1=4;VII表示:5+2=7;IIXX表示:20-2=18

阿拉伯数字的革命性不仅在于它的简洁有效,而且标志着数字和文字的分离。

3 文字和语言背后的数学

任何事物的规律都是内在的,并不随它的载体而改变。自然语言的发展,在冥冥之中都受着信息科学规律的引导。

从象形文字道拼音文字是一个飞跃,因为人类在描述物体的方式上,从物体的外表进化到了抽象的概念,同时不自觉的采用了对信息的编码。

在通信时,如果信道较宽,信息不必压缩就可以直接传递;如果信道很窄,信息在传递前需要尽可能的压缩。然后在接收端进行解压缩。

《数学之美》第1章 文字和语言 vs 数字和信息相关推荐

  1. (一)文字和语言、数字和信息(从进化史看自然语言)

    前言:数字.文字和自然语言一样,都是信息的载体,它们之间原本有着天然的联系.语言和数学的产生都是为了同一个目的--记录和传播信息.然而,为什么直到半个多世纪前香农博士提出信息论后,人们才开始把数学和信 ...

  2. 《数学之美》——第一章 个人笔记

    数学之美 最近在读<数学之美>这本书,做一下个人笔记.看的是PDF,看完后会买一本的哦!版权意识还是有的. ps:图片文字都是这本书中的内容,侵权立删.会有点自己的理解. 第一章    文 ...

  3. 数学之美 第3章 统计语言模型

    数学之美 第3章 统计语言模型 回顾一下: 前面两章都是基础知识,告诉我们自然语言的起源基础,和一些发展过程遇到的问题,第二章告诉我们规则:理解自然语言(即分析语句和获取语义)这种处理方法不可能实现智 ...

  4. 《数学之美》——第九章 个人笔记

    数学之美 最近在读<数学之美>这本书,做一下个人笔记.看的是PDF,看完后会买一本的哦!版权意识还是有的. ps:图片文字都是这本书中的内容,侵权立删.会有点自己的理解. 第九章    图 ...

  5. 《数学之美》第一章读后感

    第一章分别讲述了早期信息的传播,文字和数字的发展,文字和语言背后的数学三个部分. 我从中了解到了信息传递,不论是早期的远古社会,还是如今快速发展的互联网时代,其规律都是异曲同工的.比如信息传播的模型都 ...

  6. 《数学之美》选章精读

    曾经花了一个月的时间阅读受推荐的书籍<数学之美>,对基于统计的自然语言处理的历史作一个大致的了解,每周精读一章,做下了一些粗略的笔记,算是有个交代吧. 第9章-图论和网络爬虫 概念 图论起 ...

  7. 【原创】《数学之美》读书笔记——第1章

    写正文前的一段关于数学的感概~ 作为一名即将毕业的大四狗,经历了一年的考研时光,对数学重拾高中时的感觉,热爱. 还记得小学五年级前我是如此的痛恨数学,直到在五年级遇到了一位非常幽默的数学老师,是他让我 ...

  8. 度量相似性数学建模_数学之美读书笔记

    2020年6月读,先通读一遍,随后为写读书笔记又重新读了一遍,收获颇丰,虽然没有很多数学或者编程方面的知识,但正如作者所说,这本书讲述的是道,而非术. 读这本书让我领略到了科学的趣味,并不是枯燥的敲代 ...

  9. 《数学之美》-吴军 读书笔记

    从吴军的<数学之美>找到了伽莫夫的<从一到无穷大>,前段时间先整理了<从一到无穷大>的笔记.现在整理下<数学之美>以巩固下. 近段时间AlfaGo 与人 ...

最新文章

  1. ClearCanvas DICOM 开发系列 一
  2. django请求与响应(HttpRequest对象和HttpResponse对象)
  3. 浅谈二次元场景特征和绘制手法
  4. python第一周小测验_Python第一周小结
  5. CodeIgniter的快速操作
  6. linux修改su的PAM配置文件,linux pam安全认证模块su命令的安全隐患
  7. OSChina 周四乱弹 —— 要成立复仇者联盟了,来报名
  8. EL表达式的11个内置对象
  9. SQL 2014 AlwaysOn 搭建
  10. tftpd32+ tftpd64文件传输安装和使用教程【图文并茂】
  11. 蜘蛛采集单域名网站克隆镜像源码
  12. 公众号数据分析总结怎么做?教你玩转公众号后台数据
  13. 对象存储BOS服务介绍
  14. 2019年8月2 星期五 今日计划
  15. 2021年茶艺师(初级)考试资料及茶艺师(初级)考试技巧
  16. Tableau基础-第一章(初学者)
  17. Android读书笔记(一)
  18. 登陆页面+匹配数据库+提示登陆成功或失败
  19. 软文营销如何建立独特内容让读者自动掉入“圈套”
  20. 工具篇:解压缩工具 tar

热门文章

  1. 入门Python之后还是搞不定面试、做不来项目,推荐读读这本书
  2. SEE Conf 2021 如期而至,体验科技极致美
  3. Java 地位不保,落后已成定局 ?| 10月编程语言排行
  4. 有奖活动:写书评赢O'Reilly Velocity大会门票
  5. Isometric Game 及译法漫谈
  6. 一起学spring--依赖注入---简单粗暴的例子展示
  7. 做砸数据中台项目的9种方法
  8. 深度学习被高频引用的41篇论文下载(附下载)
  9. 2019前沿信息科技创新论坛成功举办
  10. 世界欠他一个图灵奖! LSTM之父的深度学习“奇迹之年”