机器学习(课程笔记4)——逼近参数算法牛顿方法;
一.牛顿法(Newton's method)
上一节学习了一种二分类算法logistic regression,其中涉及到求likelihood function中的参数使$l(\theta)$maxmizing。当时用的是梯度上升(grdient ascent)方法。现在介绍一种对logistic regression收敛更快的算法。使用Newton's method 对假设函数是有要求的,假设函数要满足一系列的条件。
一.函数 f find $\theta\in\Re$ st. $f(\theta)=0$的$\theta$,
有$\theta^{(1)}=\theta^{(0)}-\Delta=\theta^{(0)}-\frac{f(\theta^{(0)})}{f'(\theta^{(0)})}$
推广为:$\theta^{(t+1)}=\theta^{(t)}-\frac{f(\theta^{(t)})}{f'(\theta^{(t)})}$
二.当 $l(\theta)$ want $\theta$ st. $l'(\theta)=0$
有$\theta^{(t+1)}=\theta^{(t)}-\frac{f'(\theta^{(t)})}{f''(\theta^{(t)})}$
三.$\theta$是向量时,推广为,
$\theta^{(t+1)}=\theta^{(t)}-H^{-1}\nabla_\theta{l(\theta)}$
,$\nabla_\theta{l(\theta)}$是l($\theta$)对$\theta_i$的导数,H为n*n的Hessian矩阵(二阶偏导),n为$\theta$的维数。当然牛顿法的计算代价因为求逆是比较大的,实际上在n不是太大时牛顿法仍是很快的。
二.指数族分布(exponential family distribution)
前面利用高斯分布(概率推导一节)导出了最小二乘,用伯努利分布导出了logistics regression。这两个分布都属于指数族分布,常见的如泊松分布,都是指数族分布。
- 在回归的例子中,经过假设随机噪声为高斯分布后,得到$y|x;\theta\sim\mathcal{N}(\mu,\sigma^2)$
$P(y^{(i)}|x^{(i)};\theta)=\frac{1}{\sqrt{2\pi}\sigma}exp(-\frac{(y^{(i)}-\theta^Tx^{(i)})^2}{2\sigma^2})$;在上一节的证明中$\sigma^2$是不影响$\theta$的最小值的。 - in classification example,二分类模型为$P(y|x;\theta)$~Bernoulli($\Phi$)
- $\mu,\Phi$是$\theta和x$的函数。
如果一种分布可以写成如下形式,就称它是指数族分布,
证明一:Bernoulli是指数族分布(近似定义$\Phi$是$\theta$的函数)
它和sigmoid函数相似
证明二:Gaussion是指数族分布(选择任意的$\sigma^2$不会改变$h_{\theta}(x)$)的值,即假设$\sigma^2=1,\mu是\theta的函数$
三.
广义线性模型(GLM-generalized linear models)
构造GLM
转载于:https://www.cnblogs.com/g6z3z/p/9268647.html
机器学习(课程笔记4)——逼近参数算法牛顿方法;相关推荐
- 吴恩达机器学习课程笔记一
吴恩达机器学习课程笔记 前言 监督学习---`Supervised learning` 无监督学习---`Unsupervised learning` 聚类 异常检测 降维 增强学习---`Reinf ...
- 李宏毅2020机器学习课程笔记(二)
相关专题: 李宏毅2020机器学习资料汇总 李宏毅2020机器学习课程笔记(一) 文章目录 4. CNN Convolutional Neural Network(P17) 5. GNN Graph ...
- 机器学习总结——机器学习课程笔记整理
机器学习笔记整理 说明 基础点整理 1. 基础数学知识 (1) 一些零七八碎的基础知识 (2) 最优化相关问题 (3) 概率论相关问题 (4) 矩阵相关问题 2. 回归(线性回归.Logistic回归 ...
- Github标星24300!吴恩达机器学习课程笔记.pdf
个人认为:吴恩达老师的机器学习课程,是初学者入门机器学习的最好的课程!我们整理了笔记(336页),复现的Python代码等资源,文末提供下载. 课程简介 课程地址:https://www.course ...
- 唐宇迪机器学习课程笔记:逻辑回归之信用卡检测任务
信用卡欺诈检测 基于信用卡交易记录数据建立分类模型来预测哪些交易记录是异常的哪些是正常的. 任务流程: 加载数据,观察问题 针对问题给出解决方案 数据集切分 评估方法对比 逻辑回归模型 建模结果分析 ...
- 干货|机器学习零基础?不要怕,吴恩达机器学习课程笔记2-多元线性回归
吴恩达Coursera机器学习课系列笔记 课程笔记|吴恩达Coursera机器学习 Week1 笔记-机器学习基础 1 Linear Regression with Multiple Variable ...
- 李弘毅机器学习课程笔记(一):机器/深度学习入门
文章目录 什么是ML ML分类 一个例子 Model(function) Loss function Error surface Optimization Conclusion 最近在Youtube上 ...
- 吴恩达机器学习课程笔记(1-10章)
第一章 1.1 什么是机器学习? 定义: 机器学习是用数据或以往的经验,以此优化计算机程序的性能标准. 解释: 计算机程序从经验E中学习,解决某一任务T,进行某一性能度量P,通过P测定在T上的表现因经 ...
- 永磁同步电机控制笔记:电机参数离线辨识方法
文章目录 概述 1.定子电阻离线辨识 1.1.定子电阻离线辨识原理 1.2.定子电阻离线辨识的误差来源及补偿方法 1.3.电阻离线辨识的具体方法 方法一 方法二 2.定子电感离线辨识 2.1.定子电感 ...
最新文章
- 面试结尾——你有什么问题?
- KMP的c语言实现和学习
- Vue跨路由触发事件,Vue监听sessionStorage
- 数学--数论--素数
- linux下无法删除文件夹,linux服务器下完美解决无法删除虚拟主机文件或文件夹...
- mysql查询删除重复数据
- 10年资深面试官直言:80%人面试Java都会止步于此!
- 关于含光 800,这里有你想要的一切答案!
- 产生am信号 matlab,基于MATLAB的AM信号的调制与解调论文.doc
- Aititi 特征点检测算法与匹配的前世今生与历史传承attilax总结v4
- 堪称最详细的支付系统设计
- 电视android降低版本,电视猫旧版本下载-电视猫视频去升级版3.1.3 安卓版下载_飞翔下载...
- 手机号码校验(手机号---座机号)
- qq企业邮箱的发送邮件服务器地址,腾讯企业邮箱注册和SMTP发件设置教程
- [转载] OpenCV—利用回调函数实现返回鼠标点击位置的坐标和灰度值
- xf0x9f java mysql_MySql导入数据报错Incorrect string value: ‘xF0x9Fx90x82’
- oracle OCP认证经验分享
- 公众号 多服务器配置_公众号发布的文章越多,涨粉越多吗?
- 努比亚手机安装linux,努比亚红魔5G电竞手机将发布;Linux版荣耀MagicBook降价促销...
- Java面试必背八股文[11]:计算机网络
热门文章
- Swift - 将DaSwift-Data数据转换为[UInt8](bytes字节数组)
- C语言实现的RSA算法程序
- 【Go语言】【13】再谈GO语言的结构体
- Android 下使用 JSON 实现 HTTP 请求,外加几个示例!
- can总线报文是固定的吗_CAN总线传输协议
- ironpython调用c dll_IronPython脚本调用C#dll示例
- 有关python的知识点_Python常见的知识点整理
- PostgreSQL 12系统表(7)pg_sequence
- 管家婆辉煌2虚拟服务器,管家婆辉煌:三步轻松完成软狗组网!
- java 图形题,20140314 java练习题-打印各种图形