跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注!

在上一篇文章中,笔者介绍了什么是等高线,并且还同时直接给出了梯度的垂直于等高线的结论,但是并没有介绍为什么。因此本篇文章就来大致介绍一下梯度为什么会垂直于等高线。

设f(x,y)=cf(x,y)=cf(x,y)=c为平面上任意一曲线,又由于曲线F(x,y)=0F(x,y)=0F(x,y)=0的法向量为n→={Fx,Fy}=ΔF\overrightarrow{n}=\{F_x,F_y\}=\Delta Fn={Fx​,Fy​}=ΔF。故,令F(x,y)=f(x,y)−c=0F(x,y)=f(x,y)-c=0F(x,y)=f(x,y)−c=0,立即有曲线F(x,y)F(x,y)F(x,y)的法向量为m→={fx,fy}\overrightarrow{m}=\{f_x,f_y\}m={fx​,fy​}。可以发现,曲线F(x,y)F(x,y)F(x,y)也就是f(x,y)=cf(x,y)=cf(x,y)=c的法向量m→\overrightarrow{m}m正好就是曲线f(x,y)=cf(x,y)=cf(x,y)=c对应的梯度,所以可以得出**梯度垂直于曲线(等高线)**的结论。

下面通过一个举例来说明:

如图所示,已知曲线f(x,y)=(x−2)2+y2−1=0f(x,y)=(x-2)^2+y^2-1=0f(x,y)=(x−2)2+y2−1=0,因此其在PPP点的梯度m→={2(x−2),2y}∣P\overrightarrow{m}=\{2(x-2),2y\}|_{P}m={2(x−2),2y}∣P​。又因为曲线y=1−(x−2)2y=\sqrt{1-(x-2)^2}y=1−(x−2)2​在PPP的斜率为:
k=2−x1−(x−2)2(1)k=\frac{2-x}{\sqrt{1-(x-2)^2}}\tag{1} k=1−(x−2)2​2−x​(1)
将y=1−(x−2)2y=\sqrt{1-(x-2)^2}y=1−(x−2)2​代入(1)(1)(1)得:
k=2−xy(2)k=\frac{2-x}{y}\tag{2} k=y2−x​(2)
故,曲线y=1−(x−2)2y=\sqrt{1-(x-2)^2}y=1−(x−2)2​过点PPP的切线的一个方向向量为n→={(y,2−x)}∣P\overrightarrow{n}=\{(y,2-x)\}|_Pn={(y,2−x)}∣P​

注:若直线斜率为kkk,则他的一个方向向量为(1,k)(1,k)(1,k)

由此可得:m→⋅n→={2(x−2),2y}∣P⋅{(y,2−x)}∣P=0\overrightarrow{m}\cdot\overrightarrow{n}=\{2(x-2),2y\}|_{P}\cdot\{(y,2-x)\}|_P=0m⋅n={2(x−2),2y}∣P​⋅{(y,2−x)}∣P​=0

所以m→⊥n→\overrightarrow{m}\bot\overrightarrow{n}m⊥n,即曲线f(x,y)=(x−2)2+y2−1=0f(x,y)=(x-2)^2+y^2-1=0f(x,y)=(x−2)2+y2−1=0在任意一点的梯度m→\overrightarrow{m}m均垂直于曲线f(x,y)f(x,y)f(x,y)。

下图左边为随机选择一点,然后以梯度的反方向进行移动;右边为(0,0)(0,0)(0,0)点附近一点,然后以梯度方向进行移动:

引用

  • 徐小湛《高等数学》第96讲 方向导数与梯度
  • 图示及示例代码:关注公众号回复“示例代码”即可直接获取!

模型的改善与泛化(梯度与等高线)相关推荐

  1. 深度学习WideDeep模型——记忆能力和泛化能力的综合

    文章目录 Wide&Deep前言 模型的记忆能力与泛化能力 Wide&Deep模型的结构 Wide&Deep前言 Wide&Deep模型的主要思路正如其名,是由单层的W ...

  2. 在深度学习模型的优化上,梯度下降并非唯一的选择

    如果你是一名机器学习从业者,一定不会对基于梯度下降的优化方法感到陌生.对于很多人来说,有了 SGD,Adam,Admm 等算法的开源实现,似乎自己并不用再过多关注优化求解的细节.然而在模型的优化上,梯 ...

  3. 方向导数、梯度、等高线、数量场与向量场

    转载自:http://blog.csdn.net/lijil168/article/details/69367531 之前用过几次梯度下降算法来求解一些优化问题,但对梯度的具体意义并不是很理解.前一段 ...

  4. 树模型为什么是不能进行梯度下降

    对于树形结构为什么不需要归一化?机器学习 ML基础 易 答:数值缩放,不影响分裂点位置.因为第一步都是按照特征值进行排序的,排序的顺序不变,那么所属的分支以及分裂点就不会有不同.对于线性模型,比如说L ...

  5. 梯度下降(梯度,等高线)

    文章目录 梯度 梯度 例1 例2 结论 梯度方向与等高线切线方向垂直 Q&A 梯度 梯度 梯度是矢量. 梯度方向就是函数值增加最快的方向. 例1 函数: z = x 2 + y 2 z=x^2 ...

  6. 隐私保护与生成模型: 差分隐私GAN的梯度脱敏方法

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 大规模数据的收集和利用大幅提升了机器学习算法的性能,但同时也令个人隐私保护面临更大的风险与挑战.为此,我们提出一种满足差分隐私(Diff ...

  7. matlab仿真关键模型模块,改善simulink仿真的性能和精确度

    一.加速仿真 1.模型包括一个MATLab Fcn模块.当执行一个包含MATLab Fcn模块的模型,Simulink在每一个仿真时间步都要调用MATLab 解释器.所以应尽可能地使用Simulink ...

  8. svm多分类代码_跟我一起机器学习系列文章知识点与代码索引目录,持续更新…...

    <跟我一起机器学习> 系列文章知识点与代码索引目录 0 环境配置 如何才能入门机器学习? 优雅的安装和使用Anaconda 使用Conda来进行环境的创建与管理 Pycharm安装与使用 ...

  9. Transformer性能被高估?DeepMind动态评估模型的时间泛化能力

    ©PaperWeekly 原创 · 作者 | 王馨月 学校 | 四川大学 研究方向 | 自然语言处理 论文标题: Mind the Gap: Assessing Temporal Generaliza ...

最新文章

  1. Servlet Mapping 中/ 和 /*的区别
  2. 区间数计算之Python实现
  3. 女朋友都能看懂,Spring如何解决循环依赖?
  4. mysql 互斥_MySql中互斥量mutex的实现
  5. 2020数字中国创新大赛-智能算法赛-冠军方案分享
  6. 大数据算法岗位面试题
  7. java多线程新特性
  8. Java Android客户端开发
  9. 论文笔记_S2D.24_2014-ECCV_LSD-SLAM: 基于直接法的大范围单目即时定位和地图构建方法
  10. wpa_supplicant 中 ISupplicant 服务代理客户端对象获取
  11. WinForm界面控件DevExpress入门指南 - Window Service
  12. FileZilla server
  13. web前端学习(二十八)——CSS3下拉菜单的相关设置
  14. linux dvd 刻录_如何将任何视频文件刻录到可播放的DVD
  15. 手机连接charles问题
  16. SharpDevelop源码分析之插件
  17. 867 · 四键键盘
  18. java发送qq邮箱验证_java代码发送邮箱验证码与qq邮箱smtp服务
  19. 解决 ajax 跨域
  20. 【模式识别】反向传播神经网络 BPNN

热门文章

  1. 表空间自动增长,导致磁盘空间不足,给数据库表空间瘦身
  2. linux修复cpu问题,Linux中存在着崩溃的CPU漏洞?这里教你使用3个步骤查找修复
  3. 专家系统是一种智能计算机软件系统,人工智能课件8之专家系统[最新].ppt
  4. 2017年第2届包装世界(上海)博览会会刊(参展商名录)
  5. 【全网最全】你绝对没见过的,Alibaba内部的18份Java技术体系教程
  6. 编译原理 运行时的存储组织及管理
  7. Baiduspider - 百度蜘蛛
  8. k2虚拟服务器功能,k2路由器 虚拟服务器设置
  9. WordPress初学者入门教程-什么是WordPress?
  10. python3中PCV库安装的方法步骤