1.1

针对西瓜分类分题进行讲解

属性: 3个属性

色泽:(青绿,乌黑,浅白)

根蒂:(蜷缩,硬挺,稍蜷)

敲声:(浊响,清脆,沉闷)

假设空间: 属性所有可能取值组成的可能的样本

假设空间的个数:4 * 4 * 4+1 = 49个,

求法:这三个值组成一个向量,这个向量的每个属性的可能

取值的集合就是假设空间。每个属性可以取通配符 *,为都符合

的意思,上面的+1是存在 Ø的情况

1 色泽=*,根蒂=*,敲声=*

2 色泽=青绿,根蒂=*,敲声=*

3 色泽=乌黑,根蒂=*,敲声=*

4 色泽=*,根蒂=蜷缩,敲声=*

5 色泽=*,根蒂=硬挺,敲声=*

6 色泽=*,根蒂=稍蜷,敲声=*

7 色泽=*,根蒂=*,敲声=浊响

8 色泽=*,根蒂=*,敲声=清脆

9 色泽=*,根蒂=*,敲声=沉闷

10 色泽=青绿,根蒂=蜷缩,敲声=*

11 色泽=青绿,根蒂=硬挺,敲声=*

12 色泽=青绿,根蒂=稍蜷,敲声=*

13 色泽=乌黑,根蒂=蜷缩,敲声=*

14 色泽=乌黑,根蒂=硬挺,敲声=*

15 色泽=乌黑,根蒂=稍蜷,敲声=*

16 色泽=青绿,根蒂=*,敲声=浊响

17 色泽=青绿,根蒂=*,敲声=清脆

18 色泽=青绿,根蒂=*,敲声=沉闷

19 色泽=乌黑,根蒂=*,敲声=浊响

20 色泽=乌黑,根蒂=*,敲声=清脆

21 色泽=乌黑,根蒂=*,敲声=沉闷

22 色泽=*,根蒂=蜷缩,敲声=浊响

23 色泽=*,根蒂=蜷缩,敲声=清脆

24 色泽=*,根蒂=蜷缩,敲声=沉闷

25 色泽=*,根蒂=硬挺,敲声=浊响

26 色泽=*,根蒂=硬挺,敲声=清脆

27 色泽=*,根蒂=硬挺,敲声=沉闷

28 色泽=*,根蒂=稍蜷,敲声=浊响

29 色泽=*,根蒂=稍蜷,敲声=清脆

30 色泽=*,根蒂=稍蜷,敲声=沉闷

31 色泽=青绿,根蒂=蜷缩,敲声=浊响

32 色泽=青绿,根蒂=蜷缩,敲声=清脆

33 色泽=青绿,根蒂=蜷缩,敲声=沉闷

34 色泽=青绿,根蒂=硬挺,敲声=浊响

35 色泽=青绿,根蒂=硬挺,敲声=清脆

36 色泽=青绿,根蒂=硬挺,敲声=沉闷

37 色泽=青绿,根蒂=稍蜷,敲声=浊响

38 色泽=青绿,根蒂=稍蜷,敲声=清脆

39 色泽=青绿,根蒂=稍蜷,敲声=沉闷

40 色泽=乌黑,根蒂=蜷缩,敲声=浊响

41 色泽=乌黑,根蒂=蜷缩,敲声=清脆

42 色泽=乌黑,根蒂=蜷缩,敲声=沉闷

43 色泽=乌黑,根蒂=硬挺,敲声=浊响

44 色泽=乌黑,根蒂=硬挺,敲声=清脆

45 色泽=乌黑,根蒂=硬挺,敲声=沉闷

46 色泽=乌黑,根蒂=稍蜷,敲声=浊响

47 色泽=乌黑,根蒂=稍蜷,敲声=清脆

48 色泽=乌黑,根蒂=稍蜷,敲声=沉闷

49 Ø

训练集: 人为给定的训练数据

注:不同的训练集合会求出不同的版本空间

求版本空间:

对应着给出的已知数据集,将与正样本不一致的、与负样本一致的假设删除。

更据训练集依次删除假设空间里的数据样本:

(1,(色泽=青绿、根蒂=蜷缩、敲声=浊响),好瓜)

可以删除假设空间中的3、5、6、8、9、11-15、17-21、23-30、32-49

(2,(色泽=乌黑、根蒂=蜷缩、敲声=浊响),好瓜)

可以删除剩余假设空间中的2、10、16、31

(3,(色泽=青绿、根蒂=硬挺、敲声=清脆),坏瓜)

可以删除剩余假设空间中的1

(4,(色泽=乌黑、根蒂=稍蜷、敲声=沉闷),坏瓜)

剩余假设空间中无可删除的假设

学习过后剩余的假设为:

4 色泽=*,根蒂=蜷缩,敲声=*

7 色泽=*,根蒂=*,敲声=浊响

22 色泽=*,根蒂=蜷缩,敲声=浊响

这三个就是这个训练集下的版本空间

总结:

1、写出假设空间:先列出所有可能的样本点(即特征向量)

(即每个属性都取到所有的属性值)

2、对应着给出的已知数据集,将与正样本不一致的、与负样本

一致的假设删除。

若表1.1只含编号为1和4的两个样例,则数据集如下

表 1.1 西瓜数据集

编号

色泽

根蒂

敲声

好瓜

1

青绿

蜷缩

浊响

4

乌黑

稍蜷

沉闷

从一般到特殊或是从特殊到一般对整个假设空间进行搜索,删除与正例1不一致的假设,或与反例4一致的假设,最终得到版本空间为:

1.(色泽=青绿)∧(根蒂= ∗ )∧(敲声= ∗ )

2.(色泽= ∗ )∧(根蒂=蜷缩)∧(敲声= ∗ )

3.(色泽= ∗ )∧(根蒂= ∗ )∧(敲声=浊响)

4.(色泽=青绿)∧(根蒂=蜷缩)∧(敲声= ∗ )

5.(色泽=青绿)∧(根蒂= ∗ )∧(敲声=浊响)

6.(色泽= ∗ )∧(根蒂=蜷缩)∧(敲声=浊响)

7.(色泽=青绿)∧(根蒂=蜷缩)∧(敲声=浊响)

import re  # 正则表达式def get_all_hyp(list_attr):""""获取所有假设,其中不考虑空集的情况"""set_hyp = set()for value_attr0 in list_attr[0]:for value_attr1 in list_attr[1]:for value_attr2 in list_attr[2]:x = value_attr0 + value_attr1 + value_attr2set_hyp.add(x)set_hyp.add("#")  #代表空集return set_hypdef classify(list_ins):"""划分正反例"""positive_class = []negative_class = []for instance in list_ins:ins = instance[0:3]if instance[3] == "Y":positive_class.append(ins[0:3])else:negative_class.append(ins[0:3])return positive_class, negative_classdef get_version_space(list_ins, set_hyp):"""如果某假设未能包含所有的正例,剔除如果某假设包含任何反例,剔除"""p_class, n_class = classify(list_ins)delete_items = set()for hypothesis in set_hyp:for negative in n_class:re_hyp_n = re.match(hypothesis, negative)  # 判断两者是否匹配if re_hyp_n is None:for positive in p_class:re_hyp_p = re.match(hypothesis, positive)if re_hyp_p is None:delete_items.add(hypothesis)else:delete_items.add(hypothesis)version_space = set_hyp - delete_itemsreturn version_spacedef main():#正文案例# "A"->青绿  "B"->乌黑# "C"->蜷缩, ”D"->硬挺  “E"->稍蜷# “F"->浊响   ”G"->清脆  "H" ->沉闷list_attr = [["A", "B", "."], ["C", "D","E" ,"."], ["F", "G","H", "."]]list_ins = ["ACFY","BCFY", "ADGN","BDHN"]all_hypothesis = get_all_hyp(list_attr)print("假设空间:", all_hypothesis, len(all_hypothesis))version_space = get_version_space(list_ins, all_hypothesis)print("版本空间:", version_space, len(version_space))#练习题1.1list_attr = [["A", "B", "."], ["C", "D", "."], ["E", "F", "."]]"""该程序的局限:仅支持三个属性,但属性值任意,有机会再完善"""list_ins = ["ACEY", "BDFN"]all_hypothesis = get_all_hyp(list_attr)print("假设空间:",all_hypothesis, len(all_hypothesis))version_space = get_version_space(list_ins, all_hypothesis)print("版本空间:", version_space, len(version_space))if __name__ == "__main__":main()

执行结果

假设空间: {'.CF', '.EG', 'ADF', 'BDH', 'AEH', 'BCF', 'BC.', '.EH', 'AEG', 'A.G', 'ACH', 'BEG', 'BE.', '.DF', 'AE.', 'BCH', 'AC.', 'BDF', 'BD.', 'ADH', '..H', '.E.', 'A.F', '.C.', '..F', '.DH', '.EF', 'AD.', 'BCG', 'BEF', 'ACF', 'BEH', 'B.F', 'ACG', 'B.H', 'A..', 'ADG', '#', 'B..', 'B.G', '.DG', '...', '.D.', '.CG', 'AEF', '.CH', '..G', 'A.H', 'BDG'} 49

版本空间: {'.C.', '.CF', '..F'} 3

假设空间: {'.CF', 'ADF', '..E', 'BCF', 'BDE', 'BC.', 'ADE', '.DF', 'A.E', 'BDF', 'AC.', 'BD.', 'A.F', '.C.', '..F', 'AD.', 'BCE', 'ACF', 'B.F', 'A..', 'ACE', 'B..', '...', '#', 'B.E', '.D.', '.DE', '.CE'} 28

版本空间: {'A..', '.C.', 'ACE', '..E', 'A.E', 'AC.', '.CE'} 7

相关参考:

https://zhuanlan.zhihu.com/p/355235881

https://blog.csdn.net/weixin_43592261/article/details/106197907?spm=1001.2101.3001.6650.4&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-4-106197907-blog-123402713.pc_relevant_recovery_v2&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-4-106197907-blog-123402713.pc_relevant_recovery_v2&utm_relevant_index=6

https://blog.csdn.net/qq_40273675/article/details/89856447?spm=1001.2101.3001.6650.4&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EOPENSEARCH%7ERate-4-89856447-blog-128678234.pc_relevant_aa&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EOPENSEARCH%7ERate-4-89856447-blog-128678234.pc_relevant_aa&utm_relevant_index=5

西瓜书第一章课后题答案(一)相关推荐

  1. 西瓜书第一章课后习题答案

    第1章 绪论 1.1 略 1.2 参考链接:西瓜书第一章习题 - 简书 (jianshu.com) 首先明确基本合取式有多少种,设西瓜的三个不同属性的特征分别为(A1,A2),(B1,B2,B3),( ...

  2. 计算机网络第一章1-28答案,北邮计算机网络 第一章 课后题答案

    What are two reasons for using layered protocols? What is one possible disadvantage of using layered ...

  3. 概率论与数理统计第一章课后题答案及详解

  4. 《工程伦理》网课第一章课后习题答案

    工程伦理1-13章汇总: <工程伦理>网课第一章课后习题答案_u011895157的博客-CSDN博客 <工程伦理>网课第二章课后习题答案_u011895157的博客-CSDN ...

  5. 《计算机网络技术》第一章课后习题答案(全)

    <计算机网络技术>第一章课后习题答案(全) 1.请从资源共享的角度给出计算机网络的定义. 答:计算机网络,是指将地理位置不同的具有独立功能的多台计算机及其外部设备,通过通信线路连接起来,在 ...

  6. 西瓜书第一章阅读笔记

    西瓜书第一章阅读笔记 第一章 绪论 1.机器学习基本术语 2.归纳偏好 3.所有学习算法一样优秀? 4.补充资料 第一章 绪论 1.机器学习基本术语 记录:对一个事件或对象的描述,也称为"示 ...

  7. 无机化学(第四版)(上册、下册)课后答案 宋天佑 徐家宁 程功臻 王莉版答案解析 高等教育出版社 第5章课后题答案 习题解答

    无机化学(第四版)(上册.下册)课后答案 宋天佑 徐家宁 程功臻 王莉版答案解析 高等教育出版社 第5章课后题答案 完整版答案看文章末尾处 上册 第1章 化学基础知识 第2章 化学热力学基础 第3章 ...

  8. 操作系统第一章课后题

    操作系统第一章课后题 1. 设计现代OS的主要目标是什么? 答:方便性,有效性,可扩充性和开放性 2. OS的作用可表现在哪几个方面? 答:(1) OS作为用户与计算机硬件系统之间的接口.(2) OS ...

  9. 是一种以计算机为工具 应用决策科学,管理信息系统第十一章课后题答案1

    管理信息系统第十一章课后题答案 第十一章决策支持系统 11.1请为DSS做简要特征描述. 答:DSS是一种以计算机为工具,应用决策科学及有关学科的理论.方法与技术,以人机交互方式辅助决策者解决半结构化 ...

最新文章

  1. Eclipse 搭建struts2 spring3 hibernate3环境实战 待完善
  2. Linux--Ubuntu12.04安装NDK
  3. memcached全面剖析--3.memcached的删除机制和发展方向
  4. 《第3选择》学习笔记
  5. Fiddler 从安装到使用 (creation of the root certificate wasn)
  6. Mac os下android studio模拟器无法联网解决方法
  7. juyter显示决策树图形_决策树分析细分市场
  8. rabbitmq配置文件_RabbitMQ 负载均衡 ( 2 ) — HAProxy
  9. 突然!高通骁龙855 Plus公布:手机厂商们集体沸腾
  10. 在ubuntu16.04上搭建svn服务器
  11. Ghost 命令参数详解
  12. KNN的k该如何选择
  13. python中的文字怎么居中_各位大神,wxPython中,怎么让text文本居中显示?
  14. 上海-苏州 100公里徒步旅行心情分享(二)
  15. java 6面骰子_《剑指offer》 面试题43 n个骰子的点数 (java)
  16. java web 小学期实训小节
  17. 强化学习笔记3:RL agent的主要组成部分
  18. RPG Maker mv框架代码解析之Sprite_Button
  19. AcWing 2019. 拖拉机(双端队列BFS)
  20. Matlab学习手记——非线性方程组求解:牛顿下山法

热门文章

  1. 华住旗下施柏阁将与保时捷设计打造联名奢华酒店;希尔顿酒店及度假村首次亮相长沙 | 全球旅报...
  2. 万卷书 - 向阳而生 [The Optimistic Child]
  3. 【UE4 第一人称射击游戏】37-拾取副武器“M4A1”
  4. HTML图片img标签空白解决方法
  5. Jmeter设置CSV Data Set Config,未读取文件中参数的原因
  6. MySQL LOAD DATA INFILE 导入 CSV 格式数据
  7. 蚂蚁金服服务注册中心 SOFARegistry 解析 | 服务发现优化之路
  8. upc 个人训练赛第一场:叠罗汉+踢石头(贪心+优先队列)
  9. 数学和计算机 李开复
  10. 【附源码】Java计算机毕业设计领导干部听课评课管理系统(程序+LW+部署)