高等数学之偏导数与梯度

接着上一篇《人工智能-高等数学之微积分篇》,来学下一篇偏导数与梯度下降,在一元函数中,导数就是函数的变化率。对于二元函数研究它的“变化率”,由于自变量多了一个,情况就要复杂的多。二元函数可以用 z = f ( x , y ) z=f(x,y) z=f(x,y)表示,如果把 f ( x , y ) f(x,y) f(x,y)中的两个变量图像化,将得到空间的某个曲面,如果分析 f ( x , y ) f(x,y) f(x,y)的变化速度,必然要用到导数,只不过这次是对含有两个变量的函数求导,但我们只对一个变量求导,只观察这一个变量的变化,所以叫做求偏导

文章目录

  • 高等数学之偏导数与梯度
    • 1. 偏导的定义
    • 2. 偏导数的意义
    • 3. 偏导的计算
    • 4. 二阶偏导和混合偏导
    • 5. 梯度与方向导数
      • 5.1 梯度
      • 5.2 方向导数
    • 6. 参考博客链接

1. 偏导的定义

下面表示函数 f ( x , y ) f(x,y) f(x,y)在 ( x 0 , y 0 ) (x_0,y_0) (x0​,y0​)处的偏导,对x的偏导: ∂ ∂ x f ( x 0 , y 0 ) \frac{∂}{∂x}f(x_0,y_0) ∂x∂​f(x0​,y0​),对y的偏导: ∂ ∂ y f ( x 0 , y 0 ) \frac{∂}{∂y}f(x_0,y_0) ∂y∂​f(x0​,y0​),也可以写成 f x ( x 0 , y 0 ) , f y ( x 0 , y 0 ) f_x(x_0,y_0),f_y(x_0,y_0) fx​(x0​,y0​),fy​(x0​,y0​),偏导数的公式:
∂ ∂ x f ( x 0 , y 0 ) = lim ⁡ Δ → 0 f ( x 0 + Δ x , y 0 ) − f ( x 0 , y 0 ) Δ x ∂ ∂ x f ( x 0 , y 0 ) = lim ⁡ Δ → 0 f ( x 0 , y 0 + Δ y ) − f ( x 0 , y 0 ) Δ y \frac{∂}{∂x}f(x_0,y_0)=\lim_{\Delta \rightarrow0}\frac{f(x_0+\Delta x,y_0)-f(x_0,y_0)}{\Delta x} \\ \frac{∂}{∂x}f(x_0,y_0)=\lim_{\Delta \rightarrow0}\frac{f(x_0,y_0+\Delta y)-f(x_0,y_0)}{\Delta y} ∂x∂​f(x0​,y0​)=Δ→0lim​Δxf(x0​+Δx,y0​)−f(x0​,y0​)​∂x∂​f(x0​,y0​)=Δ→0lim​Δyf(x0​,y0​+Δy)−f(x0​,y0​)​

2. 偏导数的意义

设想一个曲面, z = f ( x , y ) z=f(x,y) z=f(x,y)中,如果保持y不变,那么函数将依赖于x的变化,这将得到一个与 x − y x-y x−y平面平行的切面,切面与 f ( x , y ) f(x,y) f(x,y)的交线就是曲线 f ( x , y 0 ) f(x,y_0) f(x,y0​),偏导数 f x ( x 0 , y 0 ) f_x(x_0,y_0) fx​(x0​,y0​)就是交线上一点在x轴方向切线的斜率,此时的切线和y轴没什么关系。
具体如图所示,偏导数的几何意义:

  • 偏导数 f x ( x 0 , y 0 ) f_x(x_0,y_0) fx​(x0​,y0​)就是曲面被平面 y = y 0 y=y_0 y=y0​所截得的曲面在点 M 0 M_0 M0​处的切线 M 0 T x M_0T_x M0​Tx​对x轴的斜率。
  • 偏导数 f y ( x 0 , y 0 ) f_y(x_0,y_0) fy​(x0​,y0​)就是曲面被平面 x = x 0 x=x_0 x=x0​所截得的曲面在点 M 0 M_0 M0​处的切线 M 0 T y M_0T_y M0​Ty​对y轴的斜率。

3. 偏导的计算

对某一个变量求偏导的含义是固定其他变量,仅试探这个变量的扰动对函数的影响,所以对某个变量计算偏导,所以只需要把其他的变量全部看作常量,其余的计算和导数完全一致。
计算 f ( x , y ) = x 3 y + y 2 f(x,y)=x^3y+y^2 f(x,y)=x3y+y2的偏导,先对x计算偏导,这相当于把y看做是常量,
求f对x的偏导
∂ f ∂ x = d d x ( x 3 y ) + d d x y 2 = 3 x 2 y + 0 = 3 x 2 y \frac{∂f}{∂x}=\frac{d}{dx}(x^3y)+\frac{d}{dx}y^2=3x^2y+0=3x^2y ∂x∂f​=dxd​(x3y)+dxd​y2=3x2y+0=3x2y
求f对y的偏导
∂ f y = d d y ( x 3 y ) + d d y y 2 = x 3 + 2 y \frac{∂f}{y}=\frac{d}{dy}(x^3y)+\frac{d}{dy}y^2=x^3+2y y∂f​=dyd​(x3y)+dyd​y2=x3+2y

4. 二阶偏导和混合偏导

二阶偏导就是求偏导的偏导,过程和求偏导类似,将令一个变量看作常量后对另一个变量反复求导。
f x = ∂ f ∂ x = 3 x 2 y , f x x = ∂ 2 f ∂ x 2 = ∂ ( 3 x 2 y ) ∂ x = 6 x y f_x=\frac{∂f}{∂x}=3x^2y,f_{xx}=\frac{∂^2f}{∂x^2}=\frac{∂(3x^2y)}{∂x}=6xy fx​=∂x∂f​=3x2y,fxx​=∂x2∂2f​=∂x∂(3x2y)​=6xy
对x的偏导表示函数在x轴方向切线斜率的变化率,也就是斜率变化的快慢,这也和单变量函数的二阶函数的二阶导数类似。
混合偏导,混合编导就是对一个变量求偏导后再对另一个变量求偏导:
f x y = ∂ 2 f ∂ x ∂ y = ∂ f x ∂ y = ∂ 3 x 2 y ∂ y = 3 x 2 f_{xy}=\frac{∂^2f}{∂x∂y}=\frac{∂f_x}{∂y}=\frac{∂3x^2y}{∂y}=3x^2 fxy​=∂x∂y∂2f​=∂y∂fx​​=∂y∂3x2y​=3x2

5. 梯度与方向导数

5.1 梯度

梯度也叫斜度,是一个曲面沿着给定方向的倾斜程度。梯度是一个向量,一个函数在某点的梯度,表示该函数在该点处沿着梯度方向变化最快,变化率最大,即函数在这一点处沿着梯度方向的导数能够取得最大值。
数学定义是这样:设二元函数 z = f ( x , y ) z=f(x,y) z=f(x,y)在平面区域D上具有一阶连续偏导数,则对于每一个点 P ( x , y ) P(x,y) P(x,y)都可以定出一个向量
{ ∂ f ∂ x , ∂ f ∂ y } = f x ( x , y ) i ⃗ + f y ( x , y ) j ⃗ \{\frac{∂f}{∂x},\frac{∂f}{∂y}\}=f_x(x,y)\vec{i}+f_y(x,y)\vec{j} {∂x∂f​,∂y∂f​}=fx​(x,y)i +fy​(x,y)j ​
该函数 z = f ( x , y ) z=f(x,y) z=f(x,y)在点 P ( x , y ) P(x,y) P(x,y)的梯度,记作 g r a d f ( x , y ) grad f(x,y) gradf(x,y)或 ∇ f ( x , y ) \nabla f(x,y) ∇f(x,y),即有:
g r a d f ( x , y ) = ∇ f ( x , y ) = { ∂ f ∂ x , ∂ f ∂ y } = ∂ f ∂ x = f x ( x , y ) i ⃗ + f y ( x , y ) j ⃗ grad f(x,y)=\nabla f(x,y)=\{\frac{∂f}{∂x},\frac{∂f}{∂y}\}=\frac{∂f}{∂x}=f_x(x,y)\vec{i}+f_y(x,y)\vec{j} gradf(x,y)=∇f(x,y)={∂x∂f​,∂y∂f​}=∂x∂f​=fx​(x,y)i +fy​(x,y)j ​
其中 ∇ = ∂ f ∂ x i ⃗ + ∂ f ∂ x j ⃗ \nabla=\frac{∂f}{∂x}\vec{i}+\frac{∂f}{∂x}\vec{j} ∇=∂x∂f​i +∂x∂f​j ​称为(二维的)向量微分算子或Nabla算子。
类似还可以推广到三元函数 u = f ( x , y , z ) u=f(x,y,z) u=f(x,y,z)在空间区域G内具有一阶连续偏导数,点 P ( x , y , z ) ∈ G P(x,y,z)\in G P(x,y,z)∈G,称为向量
{ ∂ f ∂ x , ∂ f ∂ x , ∂ f ∂ z } = ∂ f ∂ x i ⃗ + ∂ f ∂ y j ⃗ + ∂ f ∂ z k ⃗ \{\frac{∂f}{∂x},\frac{∂f}{∂x},\frac{∂f}{∂z}\}=\frac{∂f}{∂x}\vec{i}+\frac{∂f}{∂y}\vec{j}+\frac{∂f}{∂z}\vec{k} {∂x∂f​,∂x∂f​,∂z∂f​}=∂x∂f​i +∂y∂f​j ​+∂z∂f​k
为函数 u = f ( x , y , z ) u=f(x,y,z) u=f(x,y,z)在点P的梯度,记为 g r a d f ( x , y , z ) 或 ∇ f ( x , y , z ) grad f(x,y,z)或\nabla f(x,y,z) gradf(x,y,z)或∇f(x,y,z)

5.2 方向导数

偏导数只能表示多元函数沿某个坐标轴方向的导数,除开沿坐标轴方向上的导数,多元函数在非坐标轴方向上也可以求导数,这种导数称为方向导数。很容易发现,多元函数在特定点的方向导数有无穷多个,表示函数值在各个方向上的增长速度。那么问题来了,哪个方向上的增长速度最大呢?由此引出了上一节中梯度的概念,梯度:是一个矢量,其方向上的方向导数最大,其大小正好是此最大方向导数。这个最大值的方向我们就取名为梯度方向。
由此我们简单的总结一下:

  • 方向导数是各个方向上的导数
  • 偏导数连续才有梯度存在
  • 梯度的方向是方向导数中取到最大值的方向,梯度的值是方向导数的最大值

6. 参考博客链接

  1. 直观理解 梯度(gradient)
  2. 如何直观形象的理解方向导数与梯度以及它们之间的关系?
  3. 对梯度概念的直观理解

人工智能-高等数学之偏导数与梯度相关推荐

  1. 高等数学--导数、偏导数、梯度简介

    目录 一元函数微积分 一阶导数 定义 数值微分的代码实现 上述代码中存在的问题 数值微分代码改进 导数的意义 多元函数微积分 偏导数 定义 偏导数代码实现 偏导数的意义 梯度 梯度的代码实现 求梯度的 ...

  2. 人工智能-高等数学之微积分篇

    高等数学之微积分篇 接着上一篇<人工智能-高等数学之导数篇>,继续学习汇总微积分的知识,微分和导数外形很相似,导致有时候傻傻的分不清楚,在查找无数资料之后我找到了一个能够被理解的说法,导数 ...

  3. 人工智能安全(五)—梯度攻击

    这个章节主要记载一些梯度攻击的方法 1.<Explaining and Harnessing Adversarial Examples> 概述:利用 Fast Gradient Sign ...

  4. 机器学习入门(09)— 偏导数、梯度概念、梯度下降法理论和实现

    1. 偏导数概念 对于式 4-6 而言 式(4.6)有两个变量,求导数时有必要区分对哪个变量求导数,即对 x0 和 x1 两个变量中的哪一个求导数.另外,我们把这里讨论的有多个变量的函数的导数称为偏导 ...

  5. 梯度下降算法的细节补充(凸函数, 导数, 偏导数,梯度, 方向导数以及负梯度下降最快背后的泰勒身影)

    1. 写在前面 这篇文章, 再来对梯度下降算法进行一个小的回顾, 梯度下降算法是求解无约束多元函数极值最常用的数值方法, 很多机器学习常用算法和神经网络都是以它作为算法框架进行优化参数. 所以这个算法 ...

  6. 理解偏导数、梯度、方向导数

    偏导数 我们都知道导数是一元函数的变化率,衡量每个x位置处的瞬间变化率. 偏导数是针对多变量函数而言的,它通过将多变量函数退化成一元函数分别求各自的导数.以二元函数为例: Z = F(x,y) 求x的 ...

  7. 导数、偏导数以及梯度

    导数 导数的概念和运用可以说是贯穿了我们自初中以来的所有数学知识.当自变量x和因变量y都是一维且定义域和值域都为实数域的情况下,因变量y导数的定义如下: 可以这么理解,对于某一点(自变量),当它改变d ...

  8. 人工智能学习笔记 python实现梯度下降法对多元函数求解

    学习来自 梯度下降基本步骤如下图所示 我们以一个二元函数为例计算 设一个二元函数为 y=0.5*(x1+x2)^2-x1*x2 一.则生成原函数图像代码如下 #一.构建一个函数为 y=0.5*(x1+ ...

  9. 人工智能高等数学--微积分_导数意义_求导公式_绝对值函数_relu函数_导数物理意义_几何意义---人工智能工作笔记0025

    实际上这里看了看,这些数学的概念,有一定作用,但是综合来看,也可以先把人工智能课程都看一遍,大概知道怎么回事, 带着目的再来看人工智能的高等数学部分,这里,这些内容很花时间... 首先看人工智能用到的 ...

最新文章

  1. php简单创建多级目录
  2. a_10在C语言的,在C语言中,能正确表示逻辑关系:a≥10或a≤-10的C语言表达式是...
  3. 一个完整的Web应用程序部署示例
  4. 白话详细解读(四)-----FCN
  5. 【译】 Sparky: A Lightning Network in Two Pages of Solidity
  6. idea编译工程时出现Error:java: 无效的目标发行版: 1.8
  7. bal插口_播放器上的这个“昂贵”的插口,是噱头还是真有用
  8. 数据测试风控中的几类应用场景
  9. 首届全国信创大赛圆满收官,信创新势力载誉而归!
  10. Linux 末路,Kubernetes 崛起!
  11. Codeblocks中搭建Qt环境遇到个问题
  12. 后端小白的VUE入门笔记, 前端高能慎入
  13. oracleXE简易版---使用基础
  14. 秋名山直播php源码,【斗鱼直播源】浏览器抓取真实直播源地址(纯前端JS PHP解析源码)...
  15. 不同比例尺地形图上,典型地物的表示方法
  16. Google Chrome浏览器字体模糊,字体锯齿 的解决方法
  17. 电商项目—会员体系、等级、折扣营销解析
  18. IC设计行业都有哪些不错的公司(外企篇)
  19. CentOS 7的安装配置图形界面
  20. opencv3.1.0 计算机中丢失 opencv_world310d.dll _vs2017解决方法

热门文章

  1. Java架构师学习路线-脑图
  2. Win10安装SQL2012或SQL2014报错
  3. 软考系统架构设计师概念点总结
  4. Torque中文版(车况监控)
  5. PPT目录页怎么设计才高大上?告诉你一个万能排版法!
  6. FZU 1055 赋值问题
  7. Eclipse搭建C++\C开发环境
  8. 计算机毕业设计之 [含论文+源码等]基于java+ssh+mysql实现的共享自行车租赁|出租管理系统
  9. 第1章第19节:如何将完成的幻灯片打印到纸张上 [PowerPoint精美幻灯片实战教程]
  10. 【蓝桥杯2018Java】哪天返回、猴子分香蕉