• 从人类学习到机器学习 - 机器学习模型

    人类通过【观察】积累知识,如果运用所掌握的知识完成一个目标,就是【技能】,一个小白从观察开始到获取技能的过程,就是【学习(Learning)】:

    同理,机器通过【数据】输入积累知识,如果运用其学到的知识完成指定的目标,并且在一定的标准下完成的更好(例如精确度更高、速度更快等),就是【技能】,一个初始程序从大量数据中获得技能的过程就是【机器学习(Machine Learniing)】:

  • 机器学习精髓 - 什么时候用?解决什么问题?

    1    该问题有一个【潜在的模式】需要学习

    对这个模式的判断越准确就说明机器的【技能】越NB。例如,刚出生的婴儿不知道什么是“树”,后来在大人的帮助下通过大量观察,他发现树通常有粗粗的树干,树干向上分裂成很多树枝,树枝上大多都长着绿色的叶子,这时在小孩的脑中形成了对“树”的模式的初步判断,以后看到类似物体他会说:“爸比爸比,这是树!”。

    但是有一天,小孩看到了一个物体,有着较粗的树干,上面分开成树枝,但是却长着红色的叶子,他疑惑了,这与他理解的“树”的模式匹配不上啊?直到爸爸告诉他正确答案,他明白了这也是一种树叫“枫树”,这时他脑中的“树”模式更加接近现实中的树模式,他识别树的技能提升了!

    2    该问题很难用数学或程序的方式定义

    如何用程序来定义一棵树?或者树有哪些属性?

    树有叶子?很多树冬天叶子会掉光。。。树叶有几种颜色?绿色,黄色,红色,褐色。。。树枝都是硬的?柳树树枝能编织成帽子。。。树是有生命的?死去的胡杨木算不算。。。树冠很大?水杉活生生像插在地上的一根大葱。。。

    根本无法用确定的描述来定义“树”。所以,让机器慢慢学吧,多喂给它一些树的图片,见多识广了就分得清树和鸡毛掸子了。。。

    3    有足够的有效数据

    小孩子需要在大人帮助下看过很多树以后才能知道秋天的红色枫树和沙漠中枯死的胡杨木都是树,它们与杨树,杉树本质上是相同的。同理,机器也要在用大量的数据训练之后才能具有某方面的智能,例如:    ===》 柳树

        ===》 枫树

    大量这样形式的数据作为输入,成为机器建立“树”模式的初始学习材料。

  • 机器学习的应用场景

    太多了,举有限的几个例子:

    衣 - 【数据】:衣物销售数据,客户调查数据;【技能】:对特定的客户提出针对性的时尚建议。

    食 - 【数据】:社交网络数据(文本和地理位置信息);【技能】:给出餐馆的食物中毒概率。

    住 - 【数据】:建筑的工程参数和能耗;【技能】:给出相似建筑的能耗预测。

    行 - 【数据】:交通信号灯的图片和意义;【技能】:在实际场景下立即识别出信号灯的信息。

    教育 - 【数据】:学生在某门课程的历史考试成绩;【技能】:预测学生在下一次考试中的成绩水平。

    娱乐 - 【数据】:用户对大量电影的打分;【技能】:给定一个电影,预测不同用户会打多少分。

    最后一个例子来自于2006年Netflix举办的一个有奖竞赛,一共有480,189个用户对17,770部电影的100,480,507条评论作为初始数据,来预测用户未来的评论行为,如果预测精确度较之前提高10%以上,就能获得100万美刀的奖励。6年后Netflix基于大数据制作了大热美剧《纸牌屋》。

    课程针对这个问题给出了一个可行的解决方法:

    把用户和电影划分成若干维度,例如:

    用户 - 是否喜欢动作片?多喜欢?是否喜欢喜剧片?多喜欢?是不是小李子的粉丝?粉到什么程度?等。。。

    影片 - 有没有动作元素?有多少?有没有喜剧元素?有多少?有没有小李子出演?等。。。

    用户与影片的维度可以一一对应上,这样用户和影片就是两个维度相同的向量,每个元素的值代表了该属性的权重,比如某用户是小李子的脑残粉,那么用户向量中对应小李子的元素值就相对更大(对应图中的圆圈就更大)。

    将两个向量点乘,得到他们的内积,就是对该用户对该影片平价水平的预测。如果该影片没有小李子出演,影片向量中的小李子元素值为零,乘了一个很大的权重以后还是零,可能会显著降低脑残粉对该影片的评价。

  • 将机器学习符号化

    教程中使用的是“形式化”(Formalize),我个人更愿意理解为“符号化”(Symbolize)。

    只有符号化的理论才能用逻辑严谨的数学语言表述。还是举例描述。

    一个人向一家银行申请办理信用卡。银行需要根据用户资料判断是否发卡,用户数据有以下几个维度:

    用符号化的机器学习理论表述这个问题:

    作些解释,输入数据包括了过去与未来所有可能的用户数据,每个用户的数据是一个向量;输出结果{η}就是发卡和不发卡两种(可以用1,0或+1,-1代表);目标函数 f 是所有用户数据{χ}到结果集{η}的映射,这个函数我们不知道(知道就不用学习了);训练数据 D 是手头已有的用户数据,是用户数据集合{χ}的子集;通过训练得到一个训练数据D 到结果集{η}的映射 g ,这个g就是对f的近似,以后有用户申请信用卡就用g来算就行啦。

    教程用图表解释了该方法:

    机器学习的核心是“学习算法 A ”(Learning Algorithm),它根据训练数据从近似目标函数集 H 中挑选出最接近 f 的函数,也就是 g。

  • 机器学习与其他研究领域的关系

    本节课最后简要讨论了机器学习与数据挖掘、人工智能及统计学之间的关系。

Machine Learning 扫盲相关推荐

  1. 机器学习(Machine Learning)大家

    原文:http://blog.tianya.cn/blogger/post_read.asp?BlogID=272727&PostID=15814815 机器学习(Machine Learni ...

  2. zz[读书笔记]《Interpretable Machine Learning》

    [读书笔记]<Interpretable Machine Learning> Jul 19, 2019 看到这本书,特意翻了下微博妖僧老冯_之前的一条微博,这样写道:"在机器学习 ...

  3. bff v2ex_语音备忘录的BFF-如何通过Machine Learning简化Speech2Text

    bff v2ex by Rafael Belchior 通过拉斐尔·贝尔基奥尔(Rafael Belchior) 语音备忘录的BFF-如何通过Machine Learning简化Speech2Text ...

  4. 吴恩达新书《Machine Learning Yearning》完整中文版 PDF 下载!

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale资源 推荐人:GithubDaily,Datawhale伙伴 <Mach ...

  5. 吴恩达《Machine Learning》Jupyter Notebook 版笔记发布!图解、公式、习题都有了

    在我很早之前写过的文章<机器学习如何入门>中,就首推过吴恩达在 Coursera 上开设的<Machine Learning>课程.这门课最大的特点就是基本没有复杂的数学理论和 ...

  6. 吴恩达新书《Machine Learning Yearning》完整中文版开源!

    选自Github 来源:机器学习算法与自然语言处理 吴恩达新书<Machine Learning Yearning>完整中文版开源,整理给大家. <Machine Learning ...

  7. Auto Machine Learning 自动化机器学习笔记

    ⭐适读人群:有机器学习算法基础 1. auto-sklearn 能 auto 到什么地步? 在机器学习中的分类模型中: 常规 ML framework 如下图灰色部分:导入数据-数据清洗-特征工程-分 ...

  8. 机器学习与优化基础(Machine Learning and Optimization)

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自|新机器视觉 引用大佬Pedro Domingos的说法: ...

  9. Machine Learning | (12) 非监督学习-k-means

    Machine Learning | 机器学习简介 Machine Learning | (1) Scikit-learn与特征工程 Machine Learning | (2) sklearn数据集 ...

最新文章

  1. linux执行命令段错误,Linux运行fortran程序 出现段错误(segmentation fault)
  2. FPGA中实现对数运算
  3. Python网络爬虫与信息提取(二):网络爬虫之提取
  4. python matplotlib.pyplot中的.plot()和.scatter()以及.subplot()和.add_axes()区别
  5. Xilinx+AWS F1+VP9带来30倍实时转码性能提升
  6. 特性和混入不是面向对象的
  7. 使用虚拟机VMware12定制安装redhat6企业版
  8. elasticdump 数据导入导出
  9. 维修变频器和服务器赚钱吗,过来人经验分享:变频器维修杂谈(一)
  10. QQ农场外挂、QQ牧场外挂专偷QQ号
  11. vue ui创建项目的常见错误
  12. NeRF 从入门到精通
  13. 好家伙!微软苏州 M365,上班时间打王者荣耀?
  14. oracle 按汉字拼音顺序排序
  15. python输出一棵树_如何用Python画一棵树
  16. 【六袆 - Java】跟WebService说Hola;入门WebService;
  17. CSS总结1-来自freecode
  18. 100天精通Oracle-实战系列(第16天)使用 RMAN 备份快速恢复误删数据表
  19. java编写打字游戏_程序设计:简单字母打字游戏(JAVA编写)
  20. FCN的学习及理解(Fully Convolutional Networks for Semantic Segmentation)

热门文章

  1. matlab实现在原图上勾画mask
  2. 软件测试工程师三次面试失败的血泪教训!!!
  3. pytorch深度学习保姆级笔记--gpu环境配置
  4. 苹果6s照相快门声音设置_原来苹果手机自带扫描仪,学会这2个方法,纸质档一键电子化...
  5. OWIN的理解和实践(二) – Host和Server的开发
  6. 打造高质量外链,助力外贸网站快速提升Google自然排名
  7. 生活…感情…工作…各种…都是浮云
  8. 工程复现 -- 占据栅格地图 G-VOM
  9. OpenCV人脸识别---相关图片操作
  10. Jmetal计算并保存世代平均IGD时填坑