Rosetta罗赛塔
信息的冗余是信息安全的保障。罗赛塔石碑上的内容是同一信息重复三次,(上面有三种语言:埃及象形文字、埃及的拼音文字、古希腊文),因此只要有一份内容完好保留下来,原有的信息就不会丢失,这对信道编码有指导意义。(感谢2000多年前古埃及人在罗赛塔石碑上用三种文字记录了托勒密五世登基的诏书)
自然语言处理:应用最多的是N=3的三元模型。
古德-图灵估计(Good-Turing Estimate)原理:对于没有看见的事物,我们不能认为它发生的概率就是零,因此我们从概率总量(Probability Mass)中,分配一个很小的比例给这些没有看见的事件。 “越是不可信的统计折扣越多”
雅各布森(roman jakobson):发送者(信息源)、信道、接收者、信息、上下文、编码
隐含马尔可夫模型 ——>训练算法:无监督。鲍姆-韦尔奇算法(Baum-Welch Algorithm) 期望最大化(Expectation-Maximization,EM过程)
——>解码算法:维特比算法
几乎所有的自然语言处理、信息与信号处理的应用都是一个消除不确定性的过程。
信息的作用在于消除不确定性,自然语言处理的大量问题就是寻找相关的信息。
消除词义的二义性:使用互信息。
“相对熵”也称为“交叉熵”(Relative Entropy,或Kullback-Leibler Divergence):KL(f(x)||g(x))不等于KL(g(x)||f(x))
用来衡量相关性,但和变量的互信息不同,它用来衡量两个取值为正数的函数的相似性。
注:KL散度是不对称的,为了让他对称,詹森和香农提出了一种新的相对熵的计算方法,JS(f(x)||g(x))=1/2*[KL(f(x)||g(x))+KL(g(x)||f(x))]
贾里尼克
技术分为术和道两种。具体的做事方法是“术”,做事的原理和原则是“道”。
数学的发展实际上是不断的抽象和概括的过程。
布尔代数对于数学的意义等同于量子力学对于物理学的意义,他们将我们对世界的认识从连续状态扩展到离散状态。
我们的宇宙的基本粒子数目是有限的,而且远比古高尔(googol,10的100次方)要小得多。
(google公司的名字便是来源于此,表示他的索引量大。)
搜索引擎:下载(图论中的遍历(Traverse)算法)、索引、排序。
Truth is ever to be found in simplicity, and not in the multiplicity and confusion of things.
离散数学:数理逻辑、 集合论、图论、近世代数 四个分支。
遍历:广度优先搜索(Breadth-First Search,简称BFS)
深度优先搜索(Depth-First Search,简称DFS)
google革命性的发明:PageRank 网页排名算法—>核心思想:在互联网上,如果一个网页被很多其他网页所链接,说明它受到普遍的承认和信赖,那么它的排名就高。(并且网页排名高的网站贡献的链接权重大。)
智能手机的定位和导航功能,三项关键技术:1.利用卫星定位;2.地址的识别;3.根据用户输入的起点和终点,在地图上规划最短路线或者最快路线
全球导航的关键算法:动态规划(Dynamic Programming,简称 DP算法)算法
加权的有限状态传感器(Weighted Finite State Transducer,简称WFST)
阿米特-辛格博士(google AK-47的设计者):先帮助用户解决80%的问题,再慢慢解决剩下的20%的问题,是在工业界成功的秘诀之一。
许多失败并不是因为人不够优秀,而是做事情的方法不对,一开始追求大而全的解决方案,之后长时间不能完成,最后不了了之。
奇异值分解(Singular Value Decomposition,简称SVD):一次就能把所有的相关性都计算出来。
文本分类问题:实际应用中,可以先进行奇异值分解,得到粗分类结果,再利用计算向量余弦的方法,在粗分类结果的基础上,进行几次迭代,得到比较精确的结果。——>既节省时间,又准确。
伪随机数产生器算法(Pseudo-Random Number Generator,简称PRNG)
现在常用:梅森旋转算法(Mersenne Twister)
基于加密的伪随机数产生器(Cryptographically Secure Pseudo-Random Number Generator,简称CSPRNG)
相似哈希(Simhash)
信息论实际上就是情报学的直接产物。
最大熵原理(The Maximum Entropy Principle)
把各种特征综合在一起最好的方法是采用最大熵模型。
布隆过滤器(Bloom Filter):是一个很长的二进制向量和一系列随机映射函数。它只需要散列表1/8到1/4的大小就能解决同样的问题。
维特比算法(Viterbi Algorithm)
期望最大化算法(Expectation Maximization Algorithm) —>上帝的算法
云计算: 分治算法
MapReduce根本原理:将一个大任务拆分成小的子任务,并且完成子任务的计算,这个过程叫做Map,将中间结果合并成最终结果,这个过程叫做reduce。 —— 而如何将一个大矩阵自动拆分,保证各个服务器负载均衡,如何合并返回值,这就是MapReduce在工程上所做的事情了。
人工神经网络—>在多维空间进行模式分类的问题。
在现实生活中,真正能够通用的工具在形式上必定是简单的。
大数据的好处远不只是成本和准确性的问题,它的优势还在于多维度(或叫全方位)。

《数学之美》-读书笔记相关推荐

  1. 读书笔记 | 墨菲定律

    1. 有些事,你现在不做,永远也不会去做. 2. 能轻易实现的梦想都不叫梦想. 3.所有的事都会比你预计的时间长.(做事要有耐心,要经得起前期的枯燥.) 4. 当我们的才华还撑不起梦想时,更要耐下心来 ...

  2. 读书笔记 | 墨菲定律(一)

    1. 有些事,你现在不做,永远也不会去做. 2. 能轻易实现的梦想都不叫梦想. 3.所有的事都会比你预计的时间长.(做事要有耐心,要经得起前期的枯燥.) 4. 当我们的才华还撑不起梦想时,更要耐下心来 ...

  3. 洛克菲勒的38封信pdf下载_《洛克菲勒写给孩子的38封信》读书笔记

    <洛克菲勒写给孩子的38封信>读书笔记 洛克菲勒写给孩子的38封信 第1封信:起点不决定终点 人人生而平等,但这种平等是权利与法律意义上的平等,与经济和文化优势无关 第2封信:运气靠策划 ...

  4. 股神大家了解多少?深度剖析股神巴菲特

    股神巴菲特是金融界里的传奇,大家是否都对股神巴菲特感兴趣呢?大家对股神了解多少?小编最近在QR社区发现了<阿尔法狗与巴菲特>,里面记载了许多股神巴菲特的人生经历,今天小编简单说一说关于股神 ...

  5. 2014巴菲特股东大会及巴菲特创业分享

     沃伦·巴菲特,这位传奇人物.在美国,巴菲特被称为"先知".在中国,他更多的被喻为"股神",巴菲特在11岁时第一次购买股票以来,白手起家缔造了一个千亿规模的 ...

  6. 《成为沃伦·巴菲特》笔记与感想

    本文首发于微信公众帐号: 一界码农(The_hard_the_luckier) 无需授权即可转载: 甚至无需保留以上版权声明-- 沃伦·巴菲特传记的纪录片 http://www.bilibili.co ...

  7. 读书笔记002:托尼.巴赞之快速阅读

    读书笔记002:托尼.巴赞之快速阅读 托尼.巴赞是放射性思维与思维导图的提倡者.读完他的<快速阅读>之后,我们就可以可以快速提高阅读速度,保持并改善理解嗯嗯管理,通过增进了解眼睛和大脑功能 ...

  8. 读书笔记001:托尼.巴赞之开动大脑

    读书笔记001:托尼.巴赞之开动大脑 托尼.巴赞是放射性思维与思维导图的提倡者.读完他的<开动大脑>之后,我们就可以对我们的大脑有更多的了解:大脑可以进行比我们预期多得多的工作:我们可以最 ...

  9. 读书笔记003:托尼.巴赞之思维导图

    读书笔记003:托尼.巴赞之思维导图 托尼.巴赞的<思维导图>一书,详细的介绍了思维发展的新概念--放射性思维:如何利用思维导图实施你的放射性思维,实现你的创造性思维,从而给出一种深刻的智 ...

  10. 产品读书《滚雪球:巴菲特和他的财富人生》

    作者简介 艾丽斯.施罗德,曾经担任世界知名投行摩根士丹利的董事总经理,因为撰写研究报告与巴菲特相识.业务上的往来使得施罗德有更多的机会与巴菲特亲密接触,她不仅是巴菲特别的忘年交,她也是第一个向巴菲特建 ...

最新文章

  1. 安利10款效率工具,打造windows超强生产力
  2. linux清除邮件队列
  3. 基于SpringBoot的乡村医生诊疗系统的设计与实现
  4. 关于文章 Generating Impact-Based Summaries... By Mei qiaozhu
  5. 什么是分布式锁?redis、zookeeper、etcd实现分布式锁有什么不同之处?
  6. 开灯变形问题(枚举法)
  7. (二)Mac系统Nginx的安装
  8. Springboot-application.properties
  9. 重定向 12 21 解析
  10. ASP.net(C#)]用DataSet进入对数据源的插入数据、更新数据及刪除数据
  11. 【JVM】三色标记法与读写屏障
  12. KVM 介绍(6):Nova 通过 libvirt 管理 QEMU/KVM 虚机 [Nova Libvirt QEMU/KVM Domain]
  13. C语言-汉诺塔问题详解
  14. 打字游戏html代码,JavaScript打字小游戏代码
  15. Mac数据库可视化工具,workbench完全替代Navicat和PowerDesigner,Oracle官方免费可视化工具workbench!!
  16. 3线spi屏幕驱动方式
  17. android手机碎片管理,安卓手机如何进行系统碎片整理
  18. 不会制作优质抖音视频?以下附步骤方法
  19. 朱光潜给青年的十二封信 之 谈读书
  20. 腾讯T2大牛亲自讲解!Android开发唯一的出路:进阶学习

热门文章

  1. heartbeat如何监控程序_heartbeat+drbd监控脚本(自动发现问题,并邮件通知)
  2. MathType6.9与Word2010兼容问题的解决
  3. 三星经典android手机,回忆杀,三星最经典的Note系列旗舰手机
  4. 零基础小白如何提高学Python的效率?
  5. 箱线图入门,一文看懂箱线图,matplotlib画箱线图
  6. Fatal error compiling: 无效的目标发行版
  7. 联想微型计算机m4350q升级,拆解:高度集成化的联想M4350q_联想ThinkCentre台式电脑_台式电脑评测-中关村在线...
  8. 相关滤波跟踪·KCF公式详细推导
  9. 销售和程序员哪个好_进销存销售软件哪个好
  10. OpenCV中的图像处理 —— 改变颜色空间+图像几何变换