文章目录

  • 策略一 消除等式约束
  • 策略二 Newton方向
    • 另外一种解释
    • Newton减量——停止准则
    • 可行下降方法的算法
    • Newton方法和消除法

《Convex Optimization》

之前,讲的下降方法以及Newton方法都是在无约束条件的前提下的。这里讨论的是在等式约束(线性方程)的前提下讨论的。我们研究的是下面的凸优化问题:
minimizef(x)s.t.Ax=b\begin{array}{ll} minimize & f(x) \\ s.t. & Ax=b \end{array} minimizes.t.​f(x)Ax=b​
其中f:Rn→R,A∈Rp×n,rankA=p&lt;nf:\mathbb{R}^n \rightarrow \mathbb{R}, A \in \mathbb{R}^{p\times n}, rank A = p&lt;nf:Rn→R,A∈Rp×n,rankA=p<n
请不要怀疑rankA=p&lt;nrank A = p&lt;nrankA=p<n条件的可靠性,否则,只需找出其线性无关组即可。而且,显然,如果Ax=bAx=bAx=b如果无解,那么优化问题同样无解。
通过对对偶问题,及KKT条件的分析,可以知道,该优化问题存在最优解的充要条件是,存在v∗∈Rpv^* \in \mathbb{R}^pv∗∈Rp满足:
Ax∗=b,∇f(x∗)+ATv∗=0Ax^*=b, \quad \nabla f(x^*) + A^Tv^*=0 Ax∗=b,∇f(x∗)+ATv∗=0

策略一 消除等式约束

我们首先确定矩阵F∈Rn×(n−p)F \in \mathbb{R}^{n \times (n-p)}F∈Rn×(n−p)和向量x^∈Rn\hat{x} \in \mathbb{R}^nx^∈Rn,用以参数化可行集:
{x∣Ax=b}={Fz+x^∣z∈Rn−p}\{x|Ax=b\} = \{Fz+\hat{x}|z \in \mathbb{R}^{n-p} \} {x∣Ax=b}={Fz+x^∣z∈Rn−p}
只需,x^\hat{x}x^为Ax=bAx=bAx=b的一个特解即可。FFF是值域为AAA的零空间的任何矩阵(满足A(Fz)=0A(Fz)=0A(Fz)=0,即FzFzFz可以取得所有Ax=0Ax=0Ax=0的解)。于是等式约束问题就可以变为无约束问题:
minimizef~(z)=f(Fz+x^)minimize \quad \widetilde{f}(z) = f(Fz+\hat{x}) minimizef​(z)=f(Fz+x^)
我们也可以为等式约束构造一个最优的对偶变量v∗v^*v∗:
v∗=−(AAT)−1A∇f(x∗)v^*=-(AA^T)^{-1}A\nabla f(x^*) v∗=−(AAT)−1A∇f(x∗)

另外需要注意的是,如果FFF是一个消除矩阵,那么任意的FTFTFT同样也是合适的消除矩阵,其中T∈R(n−p)×(n−p)T \in \mathbb{R}^{(n-p) \times (n-p)}T∈R(n−p)×(n−p)是非奇异的。

策略二 Newton方向

我们希望导出等式约束问题:
minimizef(x)s.t.Ax=b\begin{array}{ll} minimize &amp; f(x) \\ s.t. &amp; Ax=b \end{array} minimizes.t.​f(x)Ax=b​
在可行点xxx处䣌Newton方向Δxnt\Delta x_{nt}Δxnt​,将目标函数换成在x附近的二阶泰勒近似:
minimizef^(x+v)=f(x)+∇f(x)Tv+12vT∇2f(x)vs.t.A(x+v)=b\begin{array}{ll} minimize &amp; \hat{f}(x+v)=f(x)+\nabla f(x)^{T}v + \frac{1}{2}v^T\nabla^2 f(x) v \\ s.t. &amp; A(x+v)=b \end{array} minimizes.t.​f^​(x+v)=f(x)+∇f(x)Tv+21​vT∇2f(x)vA(x+v)=b​
注意上述问题时关于vvv的优化问题。
根据我们在文章开头提到的最优性条件,可以得到:

其中Δxnt\Delta x_{nt}Δxnt​表示Newton方向,www是该二次问题的最优对偶变量。

另外一种解释

我们可以将Newton方向Δxnt\Delta x_{nt}Δxnt​及其相关向量www解释为最优性条件
Ax∗=b,∇f(x∗)+ATv∗=0Ax^*=b, \quad \nabla f(x^*) + A^Tv^*=0 Ax∗=b,∇f(x∗)+ATv∗=0
的线性近似方程组的解。
我们用x+Δxntx + \Delta x_{nt}x+Δxnt​代替x∗x^*x∗,用www代替v∗v^*v∗,并将第二个方程中的梯度项换成其在xxx附近的线性近似,从而得到:
A(x+Δxnt)=b,∇f(x+Δxnt)+ATw≈∇f(x)+∇2f(x)Δxnt+ATw=0A(x + \Delta x_{nt})=b, \quad \nabla f(x+\Delta x_{nt})+A^Tw\approx \nabla f(x) + \nabla^2 f(x) \Delta x_{nt} + A^Tw = 0 A(x+Δxnt​)=b,∇f(x+Δxnt​)+ATw≈∇f(x)+∇2f(x)Δxnt​+ATw=0
利用Ax=bAx = bAx=b,以上方程变成:
AΔxnt=0,∇2f(x)Δxnt+ATw=−∇f(x)A\Delta x_{nt}=0, \quad \nabla^2 f(x) \Delta x_{nt} + A^Tw = -\nabla f(x) AΔxnt​=0,∇2f(x)Δxnt​+ATw=−∇f(x)
这上面定义的一样。

Newton减量——停止准则

我们将等式约束问题的Newton减量定义为:
λ(x)=(ΔxntT∇2f(x)Δxnt)1/2\lambda (x) = (\Delta x_{nt}^T \nabla^2 f(x) \Delta x_{nt})^{1/2} λ(x)=(ΔxntT​∇2f(x)Δxnt​)1/2
这和无约束情况表示的是一样的,因此也可以进行同样的解释。
fff在xxx处的二阶泰勒近似为:
f^(x+v)=f(x)+∇f(x)Tv+(1/2)vT∇2f(x)v\hat{f}(x+v) = f(x) + \nabla f(x)^T v + (1/2) v^T \nabla^2 f(x) v f^​(x+v)=f(x)+∇f(x)Tv+(1/2)vT∇2f(x)v
f(x)f(x)f(x)与二次模型之间的差值满足:
f(x)−inf⁡{f^(x+v)∣A(x+v)=b}=λ(x)2/2f(x) - \inf \{\hat{f}(x+v) | A(x+v) = b\} = \lambda (x)^2/2 f(x)−inf{f^​(x+v)∣A(x+v)=b}=λ(x)2/2
从上面可以看出,λ2(x)/2\lambda^2(x)/2λ2(x)/2对xxx处的f(x)−p∗f(x) - p^*f(x)−p∗给出了基于二次模型的一个估计,这可以作为设计好的停止准则的基础。

可行下降方法的算法

注意,下面的算法初始点为可行点。

Newton方法和消除法

对原始问题采用Newton方法的迭代过程和对利用消除法简化后采用Newton方法过程完全一致,证明翻阅《凸优化》。

等式约束优化(可行点)相关推荐

  1. 最优化方法(学习笔记)-第十一章等式约束优化问题

    等式约束优化问题 等式约束的基本定义 消除等式约束 基于feasible初值的牛顿法 基于infeasible初值的牛顿法 通过解原对偶问题解释原理 求解KKT系统 实例 总结 等式约束的基本定义 等 ...

  2. 约束优化方法之拉格朗日乘子法与KKT条件

    来源:https://www.cnblogs.com/ooon/p/5721119.html 引言 本篇文章将详解带有约束条件的最优化问题,约束条件分为等式约束与不等式约束,对于等式约束的优化问题,可 ...

  3. 约束优化:约束优化的三种序列无约束优化方法

    文章目录 约束优化:约束优化的三种序列无约束优化方法 外点罚函数法 L2-罚函数法:非精确算法 对于等式约束 对于不等式约束 L1-罚函数法:精确算法 内点罚函数法:障碍函数法 等式约束优化问题的拉格 ...

  4. 一文详解从拉格朗日乘子法、KKT条件、对偶上升法到罚函数与增广Lagrangian乘子法再到ADMM算法(交替方向乘子法)

    最近看了ADMM算法,发现这个算法需要用到许多不少前备知识,在搜索补齐这些知识的过程中感觉网上的资料与总结在零散的同时又不够清晰,在此本文对这一块的内容进行汇总,同时表达自己的一些理解. 目录 拉格朗 ...

  5. 重构广义应用数学:人工智能,数学发展的重大机遇

    2020 北京智源大会 本文属于2020北京智源大会嘉宾演讲的整理报道系列.北京智源大会是北京智源人工智能研究院主办的年度国际性人工智能高端学术交流活动,以国际性.权威性.专业性和前瞻性的" ...

  6. 凸优化 [Convex Optimization] — [美] 鲍德(Stephen Boyd),Lieven Vandenberghe 著,王书宁,许鋆,黄晓霖 译

    <信息技术和电气工程学科国际知名教材中译本系列:凸优化>从理论.应用和算法三个方面系统地介绍凸优化内容. 凸优化在数学规划领域具有非常重要的地位.从应用角度看,现有算法和常规计算能力已足以 ...

  7. 数学知识笔记:拉格朗日乘子

    1 中心思想 极值点处,函数和约束条件一定相切,梯度一定共线(同向or反向) 2 无约束优化问题 比如我们希望求解 min/max F(x),那么我们可以直接对所有m个变量求偏导,令偏导等于0. 这时 ...

  8. 大于小于优化_工程优化设计与Matlab实现——优化设计的数学基础

    一切问题都可以转化为数学问题.--笛卡尔 世界上任何一门学科,如果没有发展到能与数学紧密联系在一起的程度,就说明该学科还未发展成熟. --马克思 是的,无论是哪种优化设计问题,其本质都可以归结为多元非 ...

  9. 首发:吴恩达的 CS229的数学基础(线性代数),有人把它做成了在线翻译版本!...

    本文是斯坦福大学 CS 229 机器学习课程的基础材料,是斯坦福各大人工智能课程的数学基础,本文为线性代数部分,原始文件下载[1] 原文作者:Zico Kolter,修改:Chuong Do, Ten ...

最新文章

  1. 检查压缩包是否损坏_修复损坏的gzip压缩文件之原理篇
  2. Oracle 数据库linux下sql命令行按回退键变成^H字符输入问题解决方法
  3. RCNN SPP-net Fast-RCNN Faster-RCNN
  4. 哈工大计算机系女生的宿舍,哈工大的硕博士们,这次被学校折腾惨了!
  5. 如何让PHP运行更高效
  6. java范型_Java知识点总结(Java泛型)
  7. Qt3D学习之键盘交互
  8. 南阳理工ACM111
  9. btsync 分享资源
  10. ps制作计算机考试证件照,如何通过PS制作一寸证件照(超详细流程)?
  11. 视频教程-手把手教你掌握区块链技术视频教程-区块链
  12. 《宽带与接入网技术》接入网的基本概念
  13. 大学毕业4年-回顾和总结(9)-股权投资1年,给自己一个答卷(好狗狗、皇包车、职业梦、比呀比、易途8)(创业有风险,投资需谨慎)...
  14. 易经三原则:变易、简易、不易[转]
  15. 闭关修炼(二十二)session和cookie原理
  16. Vue中为对象添加字段
  17. 五,JavaScript数组·上
  18. QT使用QMovie播放Gif动画
  19. 国内终端安全防护市场报告发布 360网神排行第一
  20. Django连接MySQL对数据进行网页展示

热门文章

  1. 局域网环境下的直播平台(校园电视台)搭建之路
  2. Vue3 + PDF.js 实现 PDF 预览
  3. 类比C++ 学习Python的class
  4. js屏蔽鼠标左右键和键盘按键功能
  5. before和after怎么区分_before和after区别
  6. 网络安全态势感知研究综述、MD5C#实现
  7. 跳槽一次能涨多少,今天带你见识到跳槽天花板,涨薪80%
  8. 创业低谷期时怎么度过?
  9. 使用jdbc创建一张员工表 员工表字段:编号,姓名,性别,年龄,职位,邮箱,电话
  10. 【渝粤题库】国家开放大学2021春2114人体解剖生理学题目