西瓜书第一章课后题答案(一)
1.1
针对西瓜分类分题进行讲解
属性: 3个属性
色泽:(青绿,乌黑,浅白)
根蒂:(蜷缩,硬挺,稍蜷)
敲声:(浊响,清脆,沉闷)
假设空间: 属性所有可能取值组成的可能的样本
假设空间的个数:4 * 4 * 4+1 = 49个,
求法:这三个值组成一个向量,这个向量的每个属性的可能
取值的集合就是假设空间。每个属性可以取通配符 *,为都符合
的意思,上面的+1是存在 Ø的情况
1 色泽=*,根蒂=*,敲声=*
2 色泽=青绿,根蒂=*,敲声=*
3 色泽=乌黑,根蒂=*,敲声=*
4 色泽=*,根蒂=蜷缩,敲声=*
5 色泽=*,根蒂=硬挺,敲声=*
6 色泽=*,根蒂=稍蜷,敲声=*
7 色泽=*,根蒂=*,敲声=浊响
8 色泽=*,根蒂=*,敲声=清脆
9 色泽=*,根蒂=*,敲声=沉闷
10 色泽=青绿,根蒂=蜷缩,敲声=*
11 色泽=青绿,根蒂=硬挺,敲声=*
12 色泽=青绿,根蒂=稍蜷,敲声=*
13 色泽=乌黑,根蒂=蜷缩,敲声=*
14 色泽=乌黑,根蒂=硬挺,敲声=*
15 色泽=乌黑,根蒂=稍蜷,敲声=*
16 色泽=青绿,根蒂=*,敲声=浊响
17 色泽=青绿,根蒂=*,敲声=清脆
18 色泽=青绿,根蒂=*,敲声=沉闷
19 色泽=乌黑,根蒂=*,敲声=浊响
20 色泽=乌黑,根蒂=*,敲声=清脆
21 色泽=乌黑,根蒂=*,敲声=沉闷
22 色泽=*,根蒂=蜷缩,敲声=浊响
23 色泽=*,根蒂=蜷缩,敲声=清脆
24 色泽=*,根蒂=蜷缩,敲声=沉闷
25 色泽=*,根蒂=硬挺,敲声=浊响
26 色泽=*,根蒂=硬挺,敲声=清脆
27 色泽=*,根蒂=硬挺,敲声=沉闷
28 色泽=*,根蒂=稍蜷,敲声=浊响
29 色泽=*,根蒂=稍蜷,敲声=清脆
30 色泽=*,根蒂=稍蜷,敲声=沉闷
31 色泽=青绿,根蒂=蜷缩,敲声=浊响
32 色泽=青绿,根蒂=蜷缩,敲声=清脆
33 色泽=青绿,根蒂=蜷缩,敲声=沉闷
34 色泽=青绿,根蒂=硬挺,敲声=浊响
35 色泽=青绿,根蒂=硬挺,敲声=清脆
36 色泽=青绿,根蒂=硬挺,敲声=沉闷
37 色泽=青绿,根蒂=稍蜷,敲声=浊响
38 色泽=青绿,根蒂=稍蜷,敲声=清脆
39 色泽=青绿,根蒂=稍蜷,敲声=沉闷
40 色泽=乌黑,根蒂=蜷缩,敲声=浊响
41 色泽=乌黑,根蒂=蜷缩,敲声=清脆
42 色泽=乌黑,根蒂=蜷缩,敲声=沉闷
43 色泽=乌黑,根蒂=硬挺,敲声=浊响
44 色泽=乌黑,根蒂=硬挺,敲声=清脆
45 色泽=乌黑,根蒂=硬挺,敲声=沉闷
46 色泽=乌黑,根蒂=稍蜷,敲声=浊响
47 色泽=乌黑,根蒂=稍蜷,敲声=清脆
48 色泽=乌黑,根蒂=稍蜷,敲声=沉闷
49 Ø
训练集: 人为给定的训练数据
注:不同的训练集合会求出不同的版本空间
求版本空间:
对应着给出的已知数据集,将与正样本不一致的、与负样本一致的假设删除。
更据训练集依次删除假设空间里的数据样本:
(1,(色泽=青绿、根蒂=蜷缩、敲声=浊响),好瓜)
可以删除假设空间中的3、5、6、8、9、11-15、17-21、23-30、32-49
(2,(色泽=乌黑、根蒂=蜷缩、敲声=浊响),好瓜)
可以删除剩余假设空间中的2、10、16、31
(3,(色泽=青绿、根蒂=硬挺、敲声=清脆),坏瓜)
可以删除剩余假设空间中的1
(4,(色泽=乌黑、根蒂=稍蜷、敲声=沉闷),坏瓜)
剩余假设空间中无可删除的假设
学习过后剩余的假设为:
4 色泽=*,根蒂=蜷缩,敲声=*
7 色泽=*,根蒂=*,敲声=浊响
22 色泽=*,根蒂=蜷缩,敲声=浊响
这三个就是这个训练集下的版本空间
总结:
1、写出假设空间:先列出所有可能的样本点(即特征向量)
(即每个属性都取到所有的属性值)
2、对应着给出的已知数据集,将与正样本不一致的、与负样本
一致的假设删除。
若表1.1只含编号为1和4的两个样例,则数据集如下
表 1.1 西瓜数据集
编号 |
色泽 |
根蒂 |
敲声 |
好瓜 |
1 |
青绿 |
蜷缩 |
浊响 |
是 |
4 |
乌黑 |
稍蜷 |
沉闷 |
否 |
从一般到特殊或是从特殊到一般对整个假设空间进行搜索,删除与正例1不一致的假设,或与反例4一致的假设,最终得到版本空间为:
1.(色泽=青绿)∧(根蒂= ∗ )∧(敲声= ∗ )
2.(色泽= ∗ )∧(根蒂=蜷缩)∧(敲声= ∗ )
3.(色泽= ∗ )∧(根蒂= ∗ )∧(敲声=浊响)
4.(色泽=青绿)∧(根蒂=蜷缩)∧(敲声= ∗ )
5.(色泽=青绿)∧(根蒂= ∗ )∧(敲声=浊响)
6.(色泽= ∗ )∧(根蒂=蜷缩)∧(敲声=浊响)
7.(色泽=青绿)∧(根蒂=蜷缩)∧(敲声=浊响)
![](/assets/blank.gif)
import re # 正则表达式def get_all_hyp(list_attr):""""获取所有假设,其中不考虑空集的情况"""set_hyp = set()for value_attr0 in list_attr[0]:for value_attr1 in list_attr[1]:for value_attr2 in list_attr[2]:x = value_attr0 + value_attr1 + value_attr2set_hyp.add(x)set_hyp.add("#") #代表空集return set_hypdef classify(list_ins):"""划分正反例"""positive_class = []negative_class = []for instance in list_ins:ins = instance[0:3]if instance[3] == "Y":positive_class.append(ins[0:3])else:negative_class.append(ins[0:3])return positive_class, negative_classdef get_version_space(list_ins, set_hyp):"""如果某假设未能包含所有的正例,剔除如果某假设包含任何反例,剔除"""p_class, n_class = classify(list_ins)delete_items = set()for hypothesis in set_hyp:for negative in n_class:re_hyp_n = re.match(hypothesis, negative) # 判断两者是否匹配if re_hyp_n is None:for positive in p_class:re_hyp_p = re.match(hypothesis, positive)if re_hyp_p is None:delete_items.add(hypothesis)else:delete_items.add(hypothesis)version_space = set_hyp - delete_itemsreturn version_spacedef main():#正文案例# "A"->青绿 "B"->乌黑# "C"->蜷缩, ”D"->硬挺 “E"->稍蜷# “F"->浊响 ”G"->清脆 "H" ->沉闷list_attr = [["A", "B", "."], ["C", "D","E" ,"."], ["F", "G","H", "."]]list_ins = ["ACFY","BCFY", "ADGN","BDHN"]all_hypothesis = get_all_hyp(list_attr)print("假设空间:", all_hypothesis, len(all_hypothesis))version_space = get_version_space(list_ins, all_hypothesis)print("版本空间:", version_space, len(version_space))#练习题1.1list_attr = [["A", "B", "."], ["C", "D", "."], ["E", "F", "."]]"""该程序的局限:仅支持三个属性,但属性值任意,有机会再完善"""list_ins = ["ACEY", "BDFN"]all_hypothesis = get_all_hyp(list_attr)print("假设空间:",all_hypothesis, len(all_hypothesis))version_space = get_version_space(list_ins, all_hypothesis)print("版本空间:", version_space, len(version_space))if __name__ == "__main__":main()
执行结果
假设空间: {'.CF', '.EG', 'ADF', 'BDH', 'AEH', 'BCF', 'BC.', '.EH', 'AEG', 'A.G', 'ACH', 'BEG', 'BE.', '.DF', 'AE.', 'BCH', 'AC.', 'BDF', 'BD.', 'ADH', '..H', '.E.', 'A.F', '.C.', '..F', '.DH', '.EF', 'AD.', 'BCG', 'BEF', 'ACF', 'BEH', 'B.F', 'ACG', 'B.H', 'A..', 'ADG', '#', 'B..', 'B.G', '.DG', '...', '.D.', '.CG', 'AEF', '.CH', '..G', 'A.H', 'BDG'} 49
版本空间: {'.C.', '.CF', '..F'} 3
假设空间: {'.CF', 'ADF', '..E', 'BCF', 'BDE', 'BC.', 'ADE', '.DF', 'A.E', 'BDF', 'AC.', 'BD.', 'A.F', '.C.', '..F', 'AD.', 'BCE', 'ACF', 'B.F', 'A..', 'ACE', 'B..', '...', '#', 'B.E', '.D.', '.DE', '.CE'} 28
版本空间: {'A..', '.C.', 'ACE', '..E', 'A.E', 'AC.', '.CE'} 7
相关参考:
https://zhuanlan.zhihu.com/p/355235881
https://blog.csdn.net/weixin_43592261/article/details/106197907?spm=1001.2101.3001.6650.4&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-4-106197907-blog-123402713.pc_relevant_recovery_v2&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-4-106197907-blog-123402713.pc_relevant_recovery_v2&utm_relevant_index=6
https://blog.csdn.net/qq_40273675/article/details/89856447?spm=1001.2101.3001.6650.4&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EOPENSEARCH%7ERate-4-89856447-blog-128678234.pc_relevant_aa&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EOPENSEARCH%7ERate-4-89856447-blog-128678234.pc_relevant_aa&utm_relevant_index=5
西瓜书第一章课后题答案(一)相关推荐
- 西瓜书第一章课后习题答案
第1章 绪论 1.1 略 1.2 参考链接:西瓜书第一章习题 - 简书 (jianshu.com) 首先明确基本合取式有多少种,设西瓜的三个不同属性的特征分别为(A1,A2),(B1,B2,B3),( ...
- 计算机网络第一章1-28答案,北邮计算机网络 第一章 课后题答案
What are two reasons for using layered protocols? What is one possible disadvantage of using layered ...
- 概率论与数理统计第一章课后题答案及详解
- 《工程伦理》网课第一章课后习题答案
工程伦理1-13章汇总: <工程伦理>网课第一章课后习题答案_u011895157的博客-CSDN博客 <工程伦理>网课第二章课后习题答案_u011895157的博客-CSDN ...
- 《计算机网络技术》第一章课后习题答案(全)
<计算机网络技术>第一章课后习题答案(全) 1.请从资源共享的角度给出计算机网络的定义. 答:计算机网络,是指将地理位置不同的具有独立功能的多台计算机及其外部设备,通过通信线路连接起来,在 ...
- 西瓜书第一章阅读笔记
西瓜书第一章阅读笔记 第一章 绪论 1.机器学习基本术语 2.归纳偏好 3.所有学习算法一样优秀? 4.补充资料 第一章 绪论 1.机器学习基本术语 记录:对一个事件或对象的描述,也称为"示 ...
- 无机化学(第四版)(上册、下册)课后答案 宋天佑 徐家宁 程功臻 王莉版答案解析 高等教育出版社 第5章课后题答案 习题解答
无机化学(第四版)(上册.下册)课后答案 宋天佑 徐家宁 程功臻 王莉版答案解析 高等教育出版社 第5章课后题答案 完整版答案看文章末尾处 上册 第1章 化学基础知识 第2章 化学热力学基础 第3章 ...
- 操作系统第一章课后题
操作系统第一章课后题 1. 设计现代OS的主要目标是什么? 答:方便性,有效性,可扩充性和开放性 2. OS的作用可表现在哪几个方面? 答:(1) OS作为用户与计算机硬件系统之间的接口.(2) OS ...
- 是一种以计算机为工具 应用决策科学,管理信息系统第十一章课后题答案1
管理信息系统第十一章课后题答案 第十一章决策支持系统 11.1请为DSS做简要特征描述. 答:DSS是一种以计算机为工具,应用决策科学及有关学科的理论.方法与技术,以人机交互方式辅助决策者解决半结构化 ...
最新文章
- Eclipse 搭建struts2 spring3 hibernate3环境实战 待完善
- Linux--Ubuntu12.04安装NDK
- memcached全面剖析--3.memcached的删除机制和发展方向
- 《第3选择》学习笔记
- Fiddler 从安装到使用 (creation of the root certificate wasn)
- Mac os下android studio模拟器无法联网解决方法
- juyter显示决策树图形_决策树分析细分市场
- rabbitmq配置文件_RabbitMQ 负载均衡 ( 2 ) — HAProxy
- 突然!高通骁龙855 Plus公布:手机厂商们集体沸腾
- 在ubuntu16.04上搭建svn服务器
- Ghost 命令参数详解
- KNN的k该如何选择
- python中的文字怎么居中_各位大神,wxPython中,怎么让text文本居中显示?
- 上海-苏州 100公里徒步旅行心情分享(二)
- java 6面骰子_《剑指offer》 面试题43 n个骰子的点数 (java)
- java web 小学期实训小节
- 强化学习笔记3:RL agent的主要组成部分
- RPG Maker mv框架代码解析之Sprite_Button
- AcWing 2019. 拖拉机(双端队列BFS)
- Matlab学习手记——非线性方程组求解:牛顿下山法
热门文章
- 华住旗下施柏阁将与保时捷设计打造联名奢华酒店;希尔顿酒店及度假村首次亮相长沙 | 全球旅报...
- 万卷书 - 向阳而生 [The Optimistic Child]
- 【UE4 第一人称射击游戏】37-拾取副武器“M4A1”
- HTML图片img标签空白解决方法
- Jmeter设置CSV Data Set Config,未读取文件中参数的原因
- MySQL LOAD DATA INFILE 导入 CSV 格式数据
- 蚂蚁金服服务注册中心 SOFARegistry 解析 | 服务发现优化之路
- upc 个人训练赛第一场:叠罗汉+踢石头(贪心+优先队列)
- 数学和计算机 李开复
- 【附源码】Java计算机毕业设计领导干部听课评课管理系统(程序+LW+部署)