凹凸性和Jensen不等式
参照:
- 凹凸性:https://blog.csdn.net/hqh131360239/article/details/82751791
- Jensen不等式:https://blog.csdn.net/phoenix198425/article/details/78388597
1、凹凸性
1.1、同济大学高等数学定义
\qquad凹凸函数在同济大学高等数学中的定义符合人们的思维定式。在国际上的定义恰好与同济大学高等数学中的定义相反。
1.2、国际上的定义:
\qquad国际上的定义刚好与国内的凹凸函数的定义相反。二阶导数大于0,则为凸函数,有极小值;二阶导数小于0,则为凹函数,有极大值(后面涉及到的凹凸函数,均为国际上的定义);
\qquad例如:exe^xex的二阶导数大于0,为凸函数;logxlog\ xlog x的二阶导数小于0,为凹函数;
\qquad一元函数可以很容易的判断凹凸性,二元函数如何判断凹凸性?用到了海塞矩阵,根据海塞矩阵的正定性,判断凹凸性。
\qquad a)海塞矩阵
A=[∂2Z∂x2∂2Z∂x∂y∂2Z∂y∂x∂2Z∂y2]A=\left[\begin{matrix} \dfrac{\partial^2Z}{\partial x^2} & \dfrac{\partial^2Z}{\partial x\partial y}\\ \\ \dfrac{\partial^2Z}{\partial y\partial x} & \dfrac{\partial^2Z}{\partial y^2} \end{matrix}\right] A=⎣⎢⎢⎢⎢⎡∂x2∂2Z∂y∂x∂2Z∂x∂y∂2Z∂y2∂2Z⎦⎥⎥⎥⎥⎤
\qquad b)正定矩阵
\qquad判断海塞矩阵是否为正定矩阵;若所有特征值均不小于零,则称为半正定。 若所有特征值均大于零,则称为正定。特征值怎么求?∣λE−A∣=0|\lambda E-A|=0∣λE−A∣=0,可以求出特征值。若除主对角线上的元素都为0,则主对角线上的值为特征值。detA=∣A∣=detA=|A|=detA=∣A∣=对角线元素积。
\qquad c)凹凸性判断(正定矩阵为凸函数):
\qquad例题1:f(x,y)=x2+5y2−6x+10y+6f(x,y)=x^2+5y^2-6x+10y+6f(x,y)=x2+5y2−6x+10y+6
\qquad海塞矩阵A:
A=[20010]A=\left[\begin{matrix} 2 & 0 \\ \\ 0 & 10 \end{matrix}\right] A=⎣⎡20010⎦⎤
\qquad所有的特征值均大于0,海塞矩阵为正定矩阵,函数为凸函数。
\qquad例题2:f(x,y)=10(y2+4x)2+(1−4y)2f(x,y)=10(y^2+4x)^2+(1-4y)^2f(x,y)=10(y2+4x)2+(1−4y)2
\qquad海塞矩阵A:
A=[320−160y−160y120y2−160x+32]A=\left[\begin{matrix} 320 & -160y \\ \\ -160y & 120y^2-160x+32 \end{matrix}\right] A=⎣⎡320−160y−160y120y2−160x+32⎦⎤
\qquad根据特征值,决定函数的凹凸性。
2、Jensen不等式
2.1、特殊形式
\qquad针对于上述的凸函数,直观意义上的凸函数,有特殊形式:
f(a+b2)≥12(f(a)+f(b))=12f(a)+12f(b)f(\dfrac{a+b}{2}) \ge \dfrac{1}{2}(f(a) + f(b)) = \dfrac{1}{2} f(a) + \dfrac{1}{2} f(b) f(2a+b)≥21(f(a)+f(b))=21f(a)+21f(b)
2.2、简单引申
\qquad针对于上述的凸函数,λ\lambdaλ相当于x1x_1x1的概率,1−λ1-\lambda1−λ相当于x2x_2x2的概率,则有:
f(λx1+(1−λ)x2)≥λf(x1)+(1−λ)f(x2)f(\lambda x_1 + (1-\lambda) x_2) \ge \lambda f(x_1) + (1-\lambda)f(x_2) f(λx1+(1−λ)x2)≥λf(x1)+(1−λ)f(x2)
2.3、延申拓展
\qquad针对于上述的凸函数,λj\lambda_jλj为yjy_jyj概率,且有∑jλj=1,λj≥0\sum\limits_j\lambda_j=1,\lambda_j \ge 0j∑λj=1,λj≥0,则有:
f(∑jλjyj)≥∑jλjf(yj)f(\sum_j \lambda_jy_j) \ge \sum_j\lambda_jf(y_j) f(j∑λjyj)≥j∑λjf(yj)
2.4、推论
\qquad若 f(x)f(x)f(x) 为区间RRR上的凸函数,g(x):R→Rg(x):R→Rg(x):R→R 为一任意函数,XXX 为一取值范围有限的离散变量, E[f(g(X))]E[f(g(X))]E[f(g(X))] 与 E[g(X)]E[g(X)]E[g(X)] 都存在,则:
f(E[g(X)])≥E[f(g(X))]f(E[g(X)]) \ge E[f(g(X))] f(E[g(X)])≥E[f(g(X))]
\qquad证明:
f(E[g(X)])=f(∑i=1npig(xi))≥∑i=1npif(g(xi))=E[f(g(X))]f(E[g(X)]) =f(\sum_{i=1}^np_ig(x_i))\ge \sum_{i=1}^np_if(g(x_i)) = E[f(g(X))] f(E[g(X)])=f(i=1∑npig(xi))≥i=1∑npif(g(xi))=E[f(g(X))]
凹凸性和Jensen不等式相关推荐
- 最优化之凸集、凸函数、上确界、Jensen不等式、共轭函数、Fenchel不等式、拉格朗日乘子法、KKT条件
最优化之凸集.凸函数.上确界.Jensen不等式.共轭函数.Fenchel不等式.拉格朗日乘子法.KKT条件.拉格朗日对偶 1.直线的向量表达 1.1 共线定理 对于任意两个向量a⃗,b⃗\vec{a ...
- 微积分中几个重要的不等式:Jensen不等式、平均值不等式、Holder不等式、Schwarz不等式、Minkovski不等式 及其证明
目录 一:几个重要不等式的形式 1,Jensen不等式 2,平均值不等式 3,一个重要的不等式 4,Holder不等式 5,Schwarz不等式 和 Minkovski不等式 二:不等式的证明 1 ...
- Jensen不等式(琴生不等式)
每次用的时候都得查,所以索性之际记录一下 注意凸函数的定义,上凸.下凸.凹.凸的含义是不同的 1.定义 Jensen不等式,又名琴森不等式或詹森不等式(均为音译).它是一个在描述积分的凸函数值和凸函数 ...
- 3.4 函数的增减性与凹凸性
增减性 引子 这个引子直接就奔着结论去,从图像上理解,一阶导数表示斜率嘛 给个图 增函数过一点做切线斜率是正的,减函数是负的 定义 f(x)∈c[a,b],(a,b)内可导,对于任意的x1,x2∈(a ...
- 如何1秒内快速判断一个函数的凹凸性?还看不懂我给你赔钱
我今天的文章,不贴出具体的函数图像,就来给大家提供一种快速判断图像凹凸性的思路. 当每个同学在学习数据结构与算法的时候,始终有一个幽灵在伴随着每个同学,就是时间复杂度,据说是高纳德发明的东西,这个东西 ...
- 深度学习/机器学习入门基础数学知识整理(五):Jensen不等式简单理解,共轭函数
Jensen不等式及其延伸 凸函数最基本的不等式性质,又称Jensen不等式[1] f(θx+(1−θ)y)≤θ f(x)+(1−θ) f(y)f(θx+(1−θ)y)≤θf(x)+(1−θ)f(y) ...
- 判断平面多边形的凹凸性
对于平面多边形的三角化处理也是计算机图形学里面的一个领域,最近由于项目的需要,需要对平面多边形进行剖分,特此对其作了些研究. 在对平面多边形进行处理的时候,很多时候需要知道多边形的凹凸性,本文介绍两种 ...
- 3.4 函数的单调性和曲线的凹凸性
学习目标: 如果我要学习函数的单调性和曲线的凹凸性,我会采取以下几个步骤: 理解概念和定义:首先,我会学习单调性和凹凸性的定义和概念.单调性是指函数的增减性质,可以分为单调递增和单调递减:凹凸性是指函 ...
- 导数用于判断函数的单调性,凹凸性,极值
导数用于判断函数的单调性,凹凸性,极值 单调性 凹凸性 拐点 驻点 极大值,极限值 函数的最大值,最小值 单调性 设函数f(x)在闭区间 [a,b]上连续,在开区间(a,b)内可导. (1)如果在(a ...
- 2022刘仲文程聪孙迎迎--用Jensen不等式证明相对熵的非负性
学习内容:利用Jensen不等式证明相对熵的非负性,即: 相对熵的定义 Jensen不等式的内容 第一次证明: 第一次证明是无效的,首先是因为Jensen不等式的公式构造有误,不等号右边应为,其次使用 ...
最新文章
- MQ 消息中间件梳理
- Android零基础入门第77节:Activity任务栈和启动模式
- 笔记本出现此windows无线服务器,笔记本win7系统提示windows无法配置此无线连接怎么办...
- 百度商业大规模微服务分布式监控系统-凤睛
- Maven---学习心得---maven的Dependency Mechanism(依赖关系机制)
- 【LeetCode - 1047】删除字符串中的所有相邻重复项(栈)
- mysql 默认时间字段 1067,mysql替datetime类型字段设置默认值default
- nginx https 配置
- 20165226 实验四 Android程序设计
- Qt 应用程序图标设置
- 计算机网络技术该考什么证,计算机网络工程师证书
- 获评优秀案例!IMG光线追踪技术实现卓越云游戏体验
- JavaWeb之Request与Response详解
- 解决MySQL远程过程调用失败
- 餐馆点餐系统(Java GUI + mysql)
- 京东如何处理数据中心网络对于应用性能的影响
- Linux 线程优先级设置(内含C语言版线程创建、绑定CPU和优先级设置代码)
- COMSOL三维动网格步骤!!!
- 如何绘制业务流程图(二)
- 王者荣耀S29赛季是什么时候开始更新及王者荣耀S29赛季幻海映的新英雄皮肤是谁?