吴恩达机器学习17-大规模机器学习

1.大型数据集的学习

在高方差/过拟合的情况下,训练集误差和交叉验证集误差存在差距,但是随着样本数的增加两者差距减少并且交叉训练集的误差开始降低,所以增加更多数据到训练集可能可以提高算法效果。

在高偏差/欠拟合的情况下,训练集误差和交叉验证集误差一直很大,增加数据到训练集意义不大。

2.随机梯度下降法

如果我们有一个低方差的模型,增加数据集的规模可以帮助你获得更好的结果。但我们应该怎样应对一个有 100 万条记录的训练集?以线性回归模型为例,每一次梯度下降迭代,我们都需要计算训练集的误差的平方和,其计算代价是十分巨大的:

如果我们一定需要一个大规模的训练集,我们可以尝试使用随机梯度下降法(SGD)来
代替批量梯度下降法。

其算法如下:

第一步:随机分布训练集

第二步:对每个样本分别进行梯度下降:

首先引入训练单一代价的实例:

cost⁡(θ,(x(i),y(i)))=12(hθ(x(i))−y(i))2\operatorname{cost}\left(\theta,\left(x^{(i)}, y^{(i)}\right)\right)=\frac{1}{2}\left(h_{\theta}\left(x^{(i)}\right)-y^{(i)}\right)^{2}cost(θ,(x(i),y(i)))=21​(hθ​(x(i))−y(i))2

然后对每个样本进行梯度下降:

Repeat (usually anywhere between1-10){
for i=1: m{

θ:=θj−α(hθ(x(i))−y(i))xj(i)\theta:=\theta_{j}-\alpha\left(h_{\theta}\left(x^{(i)}\right)-y^{(i)}\right) x_{j}^{(i)}θ:=θj​−α(hθ​(x(i))−y(i))xj(i)​

​ (for j=0: n )
​ }
}

随机梯度下降算法在每一次计算之后便更新参数

吴恩达机器学习17-大规模机器学习相关推荐

  1. 机器学习-吴恩达-笔记-13-大规模机器学习

    目录 大型数据集的学习 批量梯度下降 随机梯度下降 小批量梯度下降 随机梯度下降收敛 在线学习 映射化简和数据并行 [此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出!] 大型数据集的学习 如 ...

  2. 机器学习学习吴恩达逻辑回归_机器学习基础:逻辑回归

    机器学习学习吴恩达逻辑回归 In the previous stories, I had given an explanation of the program for implementation ...

  3. 机器学习-吴恩达-笔记-6-应用机器学习的建议

    目录 评估一个假设(假设函数) 模型选择和交叉验证集 诊断偏差和方差 正则化和偏差/方差 学习曲线 决定下一步做什么 [此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出!] 当我们运用训练好了 ...

  4. 推荐一个比吴恩达还优质的机器学习课程

    我们都知道AI的核心驱动力是机器学习,所以只要掌握了常见的机器学习算法以及工具,完全可以做出非常酷的AI产品.最近几年AI的发展突飞猛进,产生了大量成熟的工具,这也使得学习AI的门槛也变得越来越低.现 ...

  5. 吴恩达DeepLearningCourse3-结构化机器学习项目

    文章目录 第一周:机器学习策略1 正交化 单一数字评估指标 满足和优化指标 训练/开发/测试集 机器学习和人的表现 第二周:机器学习策略2 进行误差分析 修正标注错误的数据 使用来自不同分布的数据进行 ...

  6. (吴恩达)6.应用机器学习的建议、机器学习系统的设计

    文章目录 十.应用机器学习的建议(Advice for Applying Machine Learning) 10.1 决定下一步做什么 10.2 评估假设 10.3 模型选择和训练.验证.测试集 1 ...

  7. 完课率最高 | 带学吴恩达《机器学习》课程和作业,带打Kaggle全球顶级大赛!...

    机器学习算法入门哪家好?吴恩达! 你说我为什么知道?这个要从前两个月说起. 我参加了一场500人的话题讨论会,主题是「推荐适合入门机器学习的公开课」. 结果活动一开始,就被一群学算法的工程师和研究生刷 ...

  8. 【AI】吴恩达斯坦福机器学习中文笔记汇总

    1.吴恩达机器学习和深度学习课程的字幕翻译以及笔记整理参见: 以黄海广博士为首的一群机器学习爱好者发起的公益性质项目(http://www.ai-start.com). 2.黄海广博士公益项目介绍 h ...

  9. 吴恩达《机器学习训练秘籍》:7 条关于项目实践的实用建议

    翻译 | shawn 出品 | 人工智能头条(公众号ID:AI_Thinker) <机器学习训练秘籍>(Machine Learning Yearning)是吴恩达的新作,主要讲的是如何应 ...

  10. 从六大概念总结吴恩达机器学习书籍:如何做好工程项目实践?

    选自towardsdatascience 作者:Niklas Donges 机器之心编译 在 ML 工程实践中,很多时候都会走一些弯路,可能是模型选错了,也可能是某个超参数一直不正确.那么我们该如何根 ...

最新文章

  1. transformer bert seq2seq 深度学习 编码和解码的逻辑-重点
  2. python使用fpdf创建pdf文件包含:页眉、页脚并嵌入logo图片、设置使用中文字体
  3. ae制h5文字动画_AE动画在H5设计中的应用研究
  4. python写出的程序如何给别人使用-利用这10个工具,你可以写出更好的Python代码...
  5. k8s:Service的四种类型和三种代理模式
  6. Ubuntu16.04 修改主机名
  7. Web开发静态资源处理---SpringBoot
  8. Tyvj P1029 牛棚回声
  9. 某生鲜平台面试题:如何保证库存在高并发的场景下是安全的?
  10. 马化腾:如果今天我才创业 会做什么切入中国互联网
  11. 最新破解无线网络破解教程,一键破解wpa/wpa2密码软件下载。破解不用抓包不用跑字典。快速破解wpa/wpa2密码...
  12. python 区块链_python与区块链
  13. Oracle对索引做统计,Oracle收集索引统计信息
  14. android 分享到qq黑屏,Android 第三方登录 QQ登录Android 10系统 出现黑屏问题
  15. Orcle中Database Control - orcl打开错误或者打不开的解决办法
  16. 对话Chris Jones:机器人行业的下一步应该这样走
  17. linux系统使用命令一次显示日历,如何在Linux命令行上使用日历
  18. 基于单片机的多功能数字时钟设计
  19. SteamOS—定制个人版的游戏主机
  20. 【Security】操作系统安全

热门文章

  1. 渗透测试神器--Kali系统部署
  2. 90%的合同麻烦都源于签约“漏洞”,君子签电子签章闭坑指南来了!
  3. Lenovo G470 Yosemite 10.10.5 双系统 原版镜像安装
  4. 思科JABBER显示头像配置文件
  5. 思维导图怎么画?如何利用画图工具绘制思维导图
  6. 如何打开MDF数据库文件
  7. Linux 把内存当做硬盘来使用
  8. java微博系统源码_JAVA仿微博系统(JAVA毕业设计含源码和运行教程)
  9. NOI2020D2T2超现实树题解
  10. matlab function 矩阵,急:Simulink MATLAB function 如何实现矩阵输出