第六课:优化算法(Optimization algorithms)

6.1 Mini-batch梯度下降

上图表示了整个Mini-batcha梯度下降的过程。

首先对 X { t } X^{\{t\}} X{t}执行前项传播, X { t } X^{\{t\}} X{t}表示的是对于整个训练集之后的样本值,比如共有5000000个样本,每1000个划分一次,则 X { t } X^{\{t\}} X{t}表示第t个1000个样本的x值,维度为 ( n x , 1000 ) (n_x,1000) (nx​,1000),注意与X ( n x , m ) (n_x,m) (nx​,m)维度的区别. Y { t } Y^{\{t\}} Y{t}同理,维度为: ( 1 , 1000 ) (1,1000) (1,1000),注意与Y ( 1 , 1000 ) (1,1000) (1,1000)维度的区别。

mini-batch与batch区别:使用batch梯度下降法,一次遍历训练集只能做一次梯度下降,而mini-batch可以做5000个梯度下降(以本题为例)。正常来说需要多次遍历训练集,需要另外一层for循环,直到最后能收敛到一个合适的精度。


6.2 理解mini-batch梯度下降法

第二个图没看懂emmmm

如上图,如果考虑两种极端的情况:
1.mini-batch的大小等于

《DeepLearning.ai》第六课:优化算法(Optimization algorithms)相关推荐

  1. 吴恩达deeplearning.ai系列课程笔记+编程作业(6)第二课 改善深层神经网络-第二周:优化算法 (Optimization algorithms)

    第二门课 改善深层神经网络:超参数调试.正则化以及优化(Improving Deep Neural Networks:Hyperparameter tuning, Regularization and ...

  2. 第二周:优化算法 (Optimization algorithms)

    第二周:优化算法 (Optimization algorithms) 文章目录 第二周:优化算法 (Optimization algorithms) 2.1 Mini-batch 梯度下降(Mini- ...

  3. 吴恩达deeplearning.ai最后一课上线,下一次得等多少年?

    喜大普奔!今天,吴恩达的深度学习系列课程最后一课上线了! 去年6月,吴恩达宣布deeplearning.ai创业项目,8月,该项目揭晓:一套由5门课组成的深度学习系列课程--Deep Learning ...

  4. 温州大学《深度学习》课程课件(六、优化算法)

    这学期我上的另一门课是本科生的<深度学习>,主要用的是吴恩达老师的<深度学习>视频课的内容. 使用教材:吴恩达<深度学习>课程笔记 课外参考书:<深度学习&g ...

  5. 吴恩达深度学习deeplearning.ai——第一门课:神经网络与深度学习——第三节:浅层神经网络

    3.1 神经网络概述(Neural Network Overview) 本章你将学习如何实现一个神经网络.在我们深入学习具体技术之前,我希望快速的带你预览一下本章你将会学到的东西.如果这个视频中的某些 ...

  6. 第六课 多算法组合与模型调优

    本系列是七月算法机器学习课程笔记 文章目录 1 前序工作流程 1.1 数据处理 1.2 特征工程 1.3 模型选择 1.4 交叉验证 1.5 寻找最佳超参数 2 模型优化 2.1 模型状态 2.2 模 ...

  7. 吴恩达深度学习deeplearning.ai——第一门课:神经网络与深度学习——第二节:神经网络基础(上)

    2.1 二元分类 (Binary Classification) 这周我们将学习神经网络的基础知识,其中需要注意的是,当实现一个神经网络的时候,我们需要知道一些非常重要的技术和技巧.例如有一个包含 m ...

  8. 优化算法optimization:AdaDelta

    AdaDelta算法 提出动机 除了RMSProp算法以外,AdaDelta算法的提出也是为了解决AdaGrad算法在迭代后期较难找到有用解的问题. 算法 AdaDelta算法也像RMSProp算法一 ...

  9. 优化算法optimization:AdaGrad

    AdaGrad算法 提出动机 在SGD的每次迭代中,目标函数自变量的每一个元素在相同时间步都使用同一个学习率来进行迭代.我们考虑一个二维输入向量x=[x1,x2]Tx = [x_1,x_2]^Tx=[ ...

最新文章

  1. [置顶]一步步构建大型网站架构
  2. 边缘计算对于工业物联网的重要性
  3. python遍历目录压缩文件夹然后在发送邮件_python目录操作之python遍历文件夹后将结果存储为xml...
  4. Vuejs发送Ajax请求
  5. The used SELECT statements have a different number of columns 错误解决
  6. 表单内如何直接贴图而不用上传图片_重磅更新|偷偷告诉你,表单大师官网改版啦啦啦啦...
  7. GDI+入门(5、在GDI+中绘制带动画效果的图片)
  8. java run 方法_java线程中的run()方法能有几个啊?
  9. 个人博客网页设计_不会代码如何打造个人博客?你需要这个简单、免费的搭建工具...
  10. python中安装包出现Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))…………
  11. Together与Visual.Studio.NET的结合使用(一)
  12. 输入三个字符串,按由小到大的顺序输出
  13. yoga14s amd r7-4800h虚拟机安装黑苹果记录
  14. (一)Word中如何将表格断开,并且增加空的一行
  15. 网页抓取及信息提取(二)
  16. 1-十八烷基-3-三乙氧基丙基硅烷咪唑溴盐离子液体([ODTIm]Br)修饰Fe3O4磁性纳米颗粒
  17. Macbook Pro的Type-c接口失灵了如何解决?
  18. linux(centos) 保存退出vi编辑
  19. 30 个纯 HTML5 实现的游戏
  20. iOS10全新方法实现推送+deviceToken无法获取或无效的解决

热门文章

  1. Vue常见的钩子函数
  2. 技能梳理20@stm32+ESP8266+onenet+dht11+mq2+led+风扇+oled
  3. 疫情之下,墙布窗帘业1800万的自救之路
  4. Django CSRF验证失败. 请求被中断.
  5. 物联网NB-IoT与LoRa技术浅析
  6. windows 远程桌面的一些快捷键
  7. MATLAB回归分析(1)
  8. 哈夫曼编码实现文件的压缩和解压
  9. 用Python向您的女神表白,100%成功(附源码)
  10. 刷题常见vector类模板内部实现 看完思路清晰