1. 信息的冗余是信息安全的保障。
  2. 早起数字并没有书写的形式,而是掰指头,这就是我们今天使用十进制的原因。
  3. 1970年以后统计语言学的出现使得自然语言处理重获新生,并取得了今天的非凡成就。
  4. 一个句子是否合理,就看它的可能性大小如何。至于可能性,就用概率来衡量。
  5. 事实证明,统计语言模型比任何已知的借助某种规则的解决方法更有效。
  6. 词是表达语义的最小单位。
  7. 最好的一种分词方法应该保证分完词后这个句子出现的概率最大。
  8. 任何方法都有它的局限性,虽然利用统计语言模型进行分词,可以取得比人工更好的结果,但是也不可能做到百分之百准确。
  9. 通信的本质就是一个编解码和传输的过程。
  10. 一条信息的信息量与其不确定性有着直接的关系,可以认为,信息量就等于不确定的多少。
  11. 变量的不确定性越大,熵也就越大,要把它搞清楚,所需信息量也就越大。
  12. 在英语里,信息和情报是同一个词(Information),而我们知道情报的作用就是排除不确定性。
  13. 信息是消除系统不确定性的唯一办法。
  14. 几乎所有的自然语言处理、信息与信号处理的应用,都是一个消除不确定性的过程。
  15. 合理利用信息,而非玩弄什么公式和机器学习算法,是做好搜索的关键。
  16. 所谓两个事件相关性的量化度量,就是在了解了其中一个Y的前提下,对消除另一个X不确定性所提供的信息量。
  17. 我一直认为,一个人想要在自己的领域做到世界一流,他的周围必须有非常多的一流人物。
  18. 技术分为“术”和“道”两种,具体的做事方法是术,做事的原理和原则是道。这本书的目的是讲道而不是术。
  19. 二进制的历史其实很早,中国古代的阴阳学说可以认为是最早二进制的雏形。
  20. 布尔代数对于数学的意义等同于量子力学对于物理学的意义,它们将我们对世界的认识从连续状态扩展到离散状态。
  21. 常用的索引需要访问速度块,附加信息多,更新也要快。
  22. 一个商业的网络爬虫需要有成千上万个服务器,并且通过高速网络连接起来。
  23. 在互联网上,如果一个网页被很多其他网页所链接,说明它受到普遍的承认和信赖,那么它的排名就高。
  24. TF-IDF的概念被公认为信息检索中最重要的发明。TF:词频;IDF:逆文本频率指数
  25. 智能手机的定位和导航功能,其实只有三项关键技术:第一,利用卫星定位;第二,地址的识别;第三,根据用户输入的起点和终点,在地图上规划最短路线或者最快路线
  26. 有限状态机是一个特殊的有向图,它包括一些状态(节点)和连接这些状态的有向弧。
  27. 所有的导航系统都采购动态规划(DP)的办法,这里面的Programming一词在数学上的含义是“规划”。
  28. 正确的数学模型可以将一个计算量看似很大的问题的计算复杂度大大降低,这便是数学的妙用。
  29. 在计算机科学领域,一个好的算法应该像AK-47冲锋枪那样:简单、有效、可靠性好而且容易读懂(或者说易操作),而不应该是故弄玄虚。
  30. 新闻分类乃至各种分类其实都是一个聚类问题,关键是计算两篇新闻的相似程度。
  31. 对于任何问题,我们总是在找相应的准确的数学模型。
  32. 最大熵原理:保留全部的不确定性,将风险降到最小。
  33. 数学的妙处在于它的每一个工具都具有相当的普遍性,在不同的应用中都可以发挥很大的作用。
  34. 过去20年里,在机器学习和自然语言处理领域,80%的成果来自于数据量的增加。
  35. 云计算的关键之一是,如何把一个非常大的计算问题,自动分解到许多计算能力不是很强大的计算机上,共同完成。
  36. 人类的文明与进步,从某种意义上讲是通过对数据进行收集、处理和总结而达成的。
  37. 统计学是通过搜索、整理、分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。
  38. 如果数据具有代表性,统计量又足够,那么从这些数据中得到的统计结果,对我们的工作就有非常大的指导意义了,对产品质量的提升也大有帮助。
  39. 大数据更重要的在于它的多维度和完备性,有了这两点才能将原本看似无关的事物联系起来,恢复出对事物全方位完整的描述。
  40. 除了IT行业,医疗保健是对大数据最热衷的行业。

《数学之美》吴军-读书笔记相关推荐

  1. 数学之美 吴军 读书笔记

    第一章 文字和语言VS数字和信息 1.信息 发送信息--->编码----->信道传播------>解码---->接收信息 2.文字 1.信息的沉余是信息安全的保证. 2.语言的 ...

  2. 吴军《数学之美》-读书笔记

    <数学之美>读书笔记 前言 第一章-文字和语言 vs 数字和信息 第二章-自然语言处理(从规则到统计) 第三章-统计语言模型 前言 本来想把题目写作读后有感或者叫什么心得体会,但是斟酌之后 ...

  3. 数学之美》读书笔记和知识点总结(一)

    <数学之美>读书笔记和知识点总结(一) 早在前几个月我在台湾的时候,就听说<数学之美>是一本非常不错的书,也正好是我喜欢的类型,一直想买.回到北京之后的第一件事就是把我这半年积 ...

  4. 《数学之美》读书笔记_No.10_PageRank

    其实很早之前就被推荐<数学之美>这本书,拖到现在才读,最大的感受可能真的是"相见恨晚".记一些笔记供以后复习翻看. 第10章 PageRank Google的民主表决式 ...

  5. 《数学之美》读书笔记和知识点总结(一)

    早在前几个月我在台湾的时候,就听说<数学之美>是一本非常不错的书,也正好是我喜欢的类型,一直想买.回到北京之后的第一件事就是把我这半年积攒的书单全部兑现,其中包括<数学之美>和 ...

  6. 《数学之美》读书笔记(2)

    上篇写了<数学之美>的第一到十一章,这篇把后面几章写完.后面的内容比较广泛而且很多都是很熟悉的内容.让我感觉眼前一亮的是用SVD做新闻分类.SVD的物理意义以前都没有仔细的想过. 第12章 ...

  7. 《数学之美》-读书笔记

    Rosetta罗赛塔 信息的冗余是信息安全的保障.罗赛塔石碑上的内容是同一信息重复三次,(上面有三种语言:埃及象形文字.埃及的拼音文字.古希腊文),因此只要有一份内容完好保留下来,原有的信息就不会丢失 ...

  8. 【原创】《数学之美》读书笔记——第1章

    写正文前的一段关于数学的感概~ 作为一名即将毕业的大四狗,经历了一年的考研时光,对数学重拾高中时的感觉,热爱. 还记得小学五年级前我是如此的痛恨数学,直到在五年级遇到了一位非常幽默的数学老师,是他让我 ...

  9. 《编程之美》读书笔记19: 3.9 重建二叉树

    <编程之美>读书笔记19: 3.9 重建二叉树 对根节点a以及先序遍历次序P和中序遍历次序I,查找a在I中的位置,将I分为两部分,左边部分的元素都在a的左子树上,右边的元素都在a的右子树上 ...

  10. 《编程之美》读书笔记08:2.9 Fibonacci序列

    <编程之美>读书笔记08:2.9 Fibonacci序列 计算Fibonacci序列最直接的方法就是利用递推公式 F(n+2)=F(n+1)+F(n).而用通项公式来求解是错误的,用浮点数 ...

最新文章

  1. 5GS 协议栈 — PFCP 协议 — PDR 报文检测规则
  2. 网络宣传推广教大家网站的过期页面更合理的处理方法
  3. EF映射之修改数据库
  4. linux学习(7)-压缩与解压缩
  5. 云中的机器学习:FPGA 上的深度神经网络
  6. javascript各种事件
  7. 王道计算机网络 应用层整理 超详细版
  8. MFC图像增强之图像普通平滑、高斯平滑、Laplacian、Sobel、Prewitt锐化
  9. 计算机课具体任务驱动,计算机基础课程的任务驱动的教学设计与实践论文
  10. 天天在做图表,其实你根本不懂数据可视化
  11. mysql排序之order by
  12. iOS 获取屏幕的属性和宽度
  13. ecshop 后台添加评论_技术小白如何添加服务号模板消息?服务号的模板消息功能到底该怎么使用?...
  14. Linux下Keepalived 安装与配置 此博文包含图片
  15. electron加载html加载不起来,Electron 预加载远程页面提升用户体验
  16. mongodb导入bson文件_分布式文档存储数据库之MongoDB备份与恢复
  17. Hi,Let's Get Started,Mr Qu
  18. 玩转Spring Boot 集成Dubbo
  19. windows系统MSDN下载地址
  20. Linux 编译 python3.7

热门文章

  1. Hi3512的IPCAM开发
  2. 2021-04-09
  3. 《神雕侠侣》——一见杨过误终生,格格一笑很倾城
  4. 2020哔哩哔哩校招后端开发笔试编程题总结
  5. 2021届BiliBili校招 数据分析/后端开发 笔试题记录
  6. 同步时序逻辑电路分析——数电第六章学习
  7. 数电逻辑门方框中各符号所含意义(全)
  8. 股票做空和做多是什么意思
  9. 电脑常识——屏幕亮度无法调节
  10. 用Date计算日期相差多少天