周志华机器学习(三)线性模型
文章目录
- 前言
- 3.1 基本形式
- 3.2 线性回归
- 2.读入数据
- 3.3 对数几率回归
- 1.引入库
- 3.4 线性判别回归
- 3.5 多分类学习
- 3.6 类别不平衡问题
前言
提示:这里可以添加本文要记录的大概内容:
例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。
提示:以下是本篇文章正文内容,下面案例可供参考
3.1 基本形式
f(x)=W1X1+W2X2+W3X3+...+WdXd+b
向量形式
f(x)=W(T)X+b
f好瓜(x)=0.2.X色泽+0.5.X根蒂+0.3.X敲声+1
w和b学得之后模型就可以确定
定义:线性模型试图学得一个通过属性的线性组合来进行预测的函数。说明根蒂比敲声重要,敲声比色泽重要。
3.2 线性回归
假设给出一个数据集合{(xi,yi)},线性回归希望学得一个线性模型来尽可能准确地预测实值输出标记。
小tip:对于离散有序属性,有两个属性可以取值为{1.0,0.0},对于有三个属性可以转化{1.0,0.5,0.0},如果属性间不存在有序关系可以用向量来进行表示:(0,0,1)(0,1,0),(0,0,1)
那么如何来确定W和b呢?
关键是在于如何衡量f与y之间的差别。
均方误差的几何意义?
对应了常用的欧几里距离,使得均方误差最小化的方法就是最小二乘法,最小二乘法找到一条直线,使得样本到直线上的欧式距离最小。
2.读入数据
代码如下(示例):
data = pd.read_csv('https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv')
print(data.head())
该处使用的url网络请求的数据。
3.3 对数几率回归
线性回归模型怎么做分类问题?就是将求得的结果Z和0比较,若大于0,y=1,z=0,y=0.5,z<0,y=0.
即预测值大于0就判为正例,小于0就判为反例,等于0可以任意判别。因为单位跃阶函数不可微的,对数几率函数就出现了,可以微调,对数几率函数是一种Sigmoid函数,y值在0和1之间,
1.引入库
3.4 线性判别回归
LDA:给定训练样例集,设法将样例投影到一条直线上,同类样例的投影点尽可能靠近,异类样例的投影点尽可能远离,在对新鲜本进行分类的时候,将其投影到相同的直线上,根据投影点的位置来对样本进行分类。将样本投影到d维空间,以为d 比样本的数小,所以LDA通常用来监督降维。
3.5 多分类学习
对于多分类问题,我们一般是将多分类拆解为二分类,然后循环,最后得到训练结果,拆分方式OVO(一对一),OVR(一对多),OVO训练n(n-1)/2个分类器,OVR训练N个分类器,OVO的存储和测试开销相对较大,OVO每次训练用到两个样例,OVR每次训练用到所有的样例,所以OVO的训练时间更短。
3.6 类别不平衡问题
在训练样例的时候,我们会遇到正例和反例比例不均衡的问题,这样得到的学习器对于其中不均衡的一方就不会起到很好的预测效果,例如样例中正例有998个,反例有两个,则学习器对反例测试是没用的,解决方法
1) 增加反例,使得样例总数增大,但是如果重复取得相同的反例,就会出现过拟合。
2)减少正例,样例总数减少,预测不准确
3)使用再缩放,进行阀值移动,进行决策的时候。这个是代价敏感学习基础。
周志华机器学习(三)线性模型相关推荐
- 周志华 机器学习初步 线性模型
周志华 <机器学习初步> 线性模型 还未更新完,会持续更新 文章目录 周志华 <机器学习初步> 线性模型 一.线性回归 1.线性模型 线性模型的特点和重要性 线性模型的基本形式 ...
- 【周志华机器学习】线性模型
第三章 线性模型 基本形式 线性回归 对数几率回归 线性判别分析 多分类学习 类别不平衡问题 基本形式 线性模型试图学的一个通过属性的线性组合来进行预测的函数.若x1.x2-是一个样本的的属性取值,则 ...
- 周志华-机器学习(线性模型)
- 周志华-机器学习西瓜书-第三章习题3.3 编程实现对率回归
本文为周志华机器学习西瓜书第三章课后习题3.3答案,编程实现对率回归,数据集为书本第89页的数据 使用tensorflow实现过程 # coding=utf-8 import tensorflow a ...
- 机器学习 -- 《机器学习》(周志华) 第三章
机器学习 – <机器学习>(周志华) 第三章 笔记 文章目录 机器学习 -- <机器学习>(周志华) 第三章 笔记 注 常用数学符号 正交回归 点距离线的距离是正交回归 线性回 ...
- 周志华机器学习--绪论
周志华机器学习–绪论 第一章 绪论 第二章 模型评估与选择 第三章 线性模型 第四章 决策树 第五章 支持向量机 第六章 神经网络 第七章 贝叶斯分类器 第八章 集成学习和聚类 文章目录 周志华机器学 ...
- 周志华机器学习(西瓜书)学习笔记(持续更新)
<周志华机器学习>笔记 第1章 绪论 1.1 引言 1.2 基本术语 1.3 假设空间 1.4 归纳偏好 1.5 发展历程 1.6 应用现状 第2章 模型评估与选择 2.1 经验误差与过拟 ...
- 周志华机器学习--模型评估与选择
周志华机器学习–模型评估与选择 第一章 绪论 第二章 模型评估与选择 第三章 线性模型 第四章 决策树 第五章 支持向量机 第六章 神经网络 第七章 贝叶斯分类器 第八章 集成学习和聚类 文章目录 周 ...
- 周志华机器学习-决策树
周志华机器学习-决策树 第一章 绪论 第二章 模型评估与选择 第三章 线性模型 第四章 决策树 第五章 支持向量机 第六章 神经网络 第七章 贝叶斯分类器 第八章 集成学习和聚类 文章目录 周志华机器 ...
- 周志华机器学习-支持向量机
周志华机器学习-支持向量机 第一章 绪论 第二章 模型评估与选择 第三章 线性模型 第四章 决策树 第五章 支持向量机 第六章 神经网络 第七章 贝叶斯分类器 第八章 集成学习和聚类 – 文章目录 周 ...
最新文章
- jQuery 常用的效果函数(一)
- python循环输入字典_python - 使用'for'循环迭代字典
- docker copy异常
- java quartz job_java quartz job 执行时间配置
- 随心测试_Python Se_003操作浏览器对象
- 2019游戏 f1_F1 2019
- 【线性代数】P1 行列式基本概念
- 2004-2019年分省农产品进出口额
- 一周信创舆情观察(1.11~1.17)
- thinkphp项目_简历网站
- 灰鸽子--木马、后门实验
- 数据恢复技术练习题(百道)
- AdaBoost + iris数据集实现+python
- Android OpenGl ES使用原理总结与代码示例
- Ubuntu18.04下Opencv的安装及使用实例
- Linux终端关机命令
- 知乎:什么是情绪价值?
- jdk1.8api+google翻译下载
- 泛零售企业需要的数据中台长什么样?| 「数智泛零售」干货集锦
- 手把手教你完成半结构化数据的处理