《矩阵理论》笔记 4 — 矩阵分析及其应用
矩阵分析及其应用
文章目录
- 矩阵分析及其应用
- 一、矩阵序列
- 1、矩阵序列收敛的概念
- 2、矩阵序列收敛的性质
- 2.1 收敛的性质
- 2.2 有界
- 3、收敛矩阵
- 3.1 概念
- 3.2 性质
- 二、矩阵级数
- 1、矩阵级数的收敛性
- 1.1 概念
- 1.2 性质
- 2、矩阵的幂级数的收敛性
- 2.1 概念
- 2.2 性质
- 3 谱半径
- 三、 矩阵函数
- 1、矩阵函数的基本概念
- 2、利用 C a y l e y − H a m i l t o n Cayley - Hamilton Cayley−Hamilton 定理的降幂方法
- 3、利用$Jordan $标准型的相似变换方法
- 4、利用矩阵谱的待定系数方法
- 4.1 概念
- 4.2 性质
- 4.3 计算步骤
- 四、矩阵的微分和积分
- 1、单变量函数矩阵的微分与积分
- 1.1 微分
- 1.2 积分
- 2、矩阵函数的微分与积分
- 2.1 微分
- 2.2 K r o n e c k e r Kronecker Kronecker 积
- 2.3 n a b l a nabla nabla 算子
- 3、矩阵指数函数
- 五、矩阵分析的应用
- 1、常系数线性微分方程组
一、矩阵序列
1、矩阵序列收敛的概念
- 设有矩阵序列 A k = ( a i j ( k ) ) ∈ C m × n , k = 1 , 2 , . . . A_k=(a_{ij}^{(k)}) \in C^{m\times n} , k= 1, 2, ... Ak=(aij(k))∈Cm×n,k=1,2,... 。序列的每个矩阵中,处于相同位置的元素构成的数列都收敛, lim k → ∞ a i j ( k ) = a i j , i = 1 , . . , m ; j = 1 , . . , n \lim\limits_{k\rightarrow \infty }a_{ij}^{(k)} = a_{ij} ,i=1,..,m;j=1,..,n k→∞limaij(k)=aij,i=1,..,m;j=1,..,n。若当 k → ∞ k \rightarrow \infty k→∞ 时, ∣ ∣ A k − A ∣ ∣ → 0 ||A_k-A|| \rightarrow 0 ∣∣Ak−A∣∣→0,则称矩阵序列 { A k } \{ A_k\} {Ak} 收敛于极限 A = ( a i j ) ∈ C n × n A = (a_{ij}) \in C^{\ n \times n} A=(aij)∈C n×n ,记作 A k → A A_k \rightarrow A Ak→A 。
- 不收敛的矩阵序列称为发散的。
- 充要条件 : A k → 0 ⇔ a i j ( k ) → a i j A_k \rightarrow 0 \Leftrightarrow a_{ij}^{(k)} \rightarrow a_{ij} Ak→0⇔aij(k)→aij ,即按元素位置收敛。
- 存在某矩阵范数 ∣ ∣ ⋅ ∣ ∣ ||·|| ∣∣⋅∣∣,使得 k → ∞ k \rightarrow \infty k→∞ 时, ∣ ∣ A k − A ∣ ∣ → 0 ||A_k -A|| \rightarrow 0 ∣∣Ak−A∣∣→0
- 充要条件 : A k → 0 ⇔ a i j ( k ) → 0 A_k \rightarrow 0 \Leftrightarrow a_{ij}^{(k)} \rightarrow 0 Ak→0⇔aij(k)→0
2、矩阵序列收敛的性质
2.1 收敛的性质
设 A k → A , B k → B A_k \rightarrow A , B_k \rightarrow B Ak→A,Bk→B ,则有
- ∀ α , β ∈ C , α A k + β B k → α A + β B \forall \alpha ,\beta \in C, \alpha A_k+\beta B_k \rightarrow \alpha A+\beta B ∀α,β∈C,αAk+βBk→αA+βB
- A k B k → A B A_kB_k \rightarrow AB AkBk→AB
- A k − 1 → A − 1 A_k^{-1} \rightarrow A^{-1} Ak−1→A−1(假设 A − 1 A^{-1} A−1存在)
2.2 有界
如果存在常数 $M> 0 $ ,使得对一切 k k k 都 ∣ a i j ( k ) ∣ < M |a_{ij}^{(k)}| < M ∣aij(k)∣<M ,则称矩阵序列 { A k } \{ A_k\} {Ak}有界。
- 收敛的矩阵序列必有界。
- 有界矩阵序列 { A k } \{ A_k\} {Ak} 必有收敛的子序列 { A k s } \{ A_{k_s}\} {Aks}
- 充要条件: 矩阵序列 { A k } \{A_k\} {Ak} 有界 ⇔ \Leftrightarrow ⇔ 存在常数 M > 0 M >0 M>0 ,使得 ∣ ∣ A k ∣ ∣ ≤ M ||A_k|| \leq M ∣∣Ak∣∣≤M 。
3、收敛矩阵
3.1 概念
设 A A A 为方阵且当 k → ∞ k \rightarrow \infty k→∞ 时, 有 A k → 0 A^k \rightarrow 0 Ak→0 ,则称 A A A 为收敛矩阵。
3.2 性质
- A k → 0 ( k → ∞ ) A^k \rightarrow 0(k \rightarrow \infty) Ak→0(k→∞) 的充要条件是 A A A 的谱半径 ρ ( A ) = max ∣ λ ∣ < 1 \rho(A) = \max|\lambda| <1 ρ(A)=max∣λ∣<1,即所有特征值的模小于 1 。
- 若存在一种矩阵范数 ∣ ∣ ⋅ ∣ ∣ ||·|| ∣∣⋅∣∣,使得$||A||<1 $ ,则 A k → 0 ( k → ∞ ) A_k\rightarrow 0 ( k\rightarrow \infty ) Ak→0(k→∞) 。反之亦然。
二、矩阵级数
1、矩阵级数的收敛性
1.1 概念
矩阵序列 { A k s } \{ A_{k_s}\} {Aks} 形成的无穷和 $A_0+A_1+…+A_k+… $ 称为矩阵级数,记作 ∑ k = 0 ∞ A k \sum\limits_{k=0}^{\infty}A_k k=0∑∞Ak。
若矩阵序列 { A k s } \{ A_{k_s}\} {Aks} 的部分和 ∑ k = 0 ∞ A k \sum\limits_{k=0}^{\infty}A_k k=0∑∞Ak 收敛于 S S S ,则称矩阵级数 ∑ k = 0 ∞ A k \sum\limits_{k=0}^{\infty}A_k k=0∑∞Ak 收敛于 $S $,记作 ∑ k = 0 ∞ A k = S \sum\limits_{k=0}^{\infty}A_k = S k=0∑∞Ak=S。
若正项级数 ∑ k = 0 ∞ ∣ ∣ A k ∣ ∣ \sum\limits_{k=0}^{\infty}||A_k|| k=0∑∞∣∣Ak∣∣ 收敛级数 ,则称 ∑ k = 0 ∞ A k \sum\limits_{k=0}^{\infty}A_k k=0∑∞Ak 绝对收敛。
1.2 性质
(定理)设 A k = ( a i j ( k ) ) ∈ C n × n , k = 1 , 2 , . . . A_k=(a_{ij}^{(k)}) \in C^{ \ n\times n} ,k=1,2,... Ak=(aij(k))∈C n×n,k=1,2,... ,则
- (充要条件) 矩阵级数 ∑ k = 0 ∞ A k \sum\limits_{k=0}^{\infty} A_k k=0∑∞Ak 收敛 ⇔ \Leftrightarrow ⇔ ∑ k = 0 ∞ a i j ( k ) \sum\limits_{k=0}^{\infty} a_{ij}^{(k)} k=0∑∞aij(k)收敛
- (充要条件) 矩阵级数 ∑ k = 0 ∞ A k \sum\limits_{k=0}^{\infty} A_k k=0∑∞Ak 绝对收敛 ⇔ \Leftrightarrow ⇔ ∑ k = 0 ∞ a i j ( k ) \sum\limits_{k=0}^{\infty} a_{ij}^{(k)} k=0∑∞aij(k) 绝对收敛
(定理)设 $P,Q\in C^{ \ n\times n} $ ,并且 ∑ k = 0 ∞ A k \sum\limits_{k=0}^{\infty} A_k k=0∑∞Ak 收敛(或绝对收敛),则 ∑ k = 0 ∞ P A k Q \sum\limits_{k=0}^{\infty} PA_kQ k=0∑∞PAkQ 收敛(或绝对收敛),并且 ∑ k = 0 ∞ P A k Q = P ( ∑ k = 0 ∞ A k ) Q \sum\limits_{k=0}^{\infty} PA_kQ = P(\sum\limits_{k=0}^{\infty} A_k)Q k=0∑∞PAkQ=P(k=0∑∞Ak)Q
若矩阵级数绝对收敛,则它也一定收敛,并且任意调换其项的顺序所得的级数还是收敛的、且其和不变.
矩阵级数绝对收敛的充要条件是正项级数收敛。
如果矩阵级数绝对收敛,则也收敛。
设 $C^{\ n\times n} $ 中的两个矩阵级数 S 1 : A 1 + A 2 + . . . + A k + . . . S_1 :A_1 + A_2+...+A_k +... S1:A1+A2+...+Ak+... 和 S 2 : B 1 + B 2 + . . + B k + . . S_2 :B_1 + B_2 +..+ B_k +.. S2:B1+B2+..+Bk+.. 都绝对收敛,其和分别为 A A A 与 B B B .则级数 S 1 S_1 S1 与 S 2 S_2 S2 按项相乘所得的矩阵级数绝对收敛,且有和 A B AB AB 。
2、矩阵的幂级数的收敛性
2.1 概念
- 对于 A ∈ C n × n A \in C^{n \times n} A∈Cn×n 和 { c k } ∈ C n \left\{c_k\right\} \in C^n {ck}∈Cn , 称 ∑ k = 0 ∞ c k A k = c 0 E + c 1 A + ⋯ + c k A k + ⋯ \sum\limits_{k=0}^{\infty} c_k A^k=c_0 E+c_1 A+\cdots+c_k A^k+\cdots k=0∑∞ckAk=c0E+c1A+⋯+ckAk+⋯ 为 A A A 的幂级数。
- 设幂级数 ∑ k = 0 ∞ c k z k \sum\limits_{k=0}^{\infty} c_k z^k k=0∑∞ckzk 的收敛半径为 R = lim k → ∞ ∣ c k ∣ ∣ c k + 1 ∣ = 1 lim k → ∞ ∣ c k ∣ k R=\lim\limits_{k \rightarrow \infty} \frac{\left|c_k\right|}{\left|c_{k+1}\right|}=\frac{1}{\lim\limits_{k \rightarrow \infty} \sqrt[k]{ |c_k |}} R=k→∞lim∣ck+1∣∣ck∣=k→∞limk∣ck∣ 1 , A A A 的某范数 ∥ A ∥ \|A\| ∥A∥ 小于 R R R,则 ∑ k = 0 ∞ c k A k \sum\limits_{k=0}^{\infty} c_k A^k k=0∑∞ckAk 绝对收敛 , 即正项级数 ∑ k = 0 ∞ ∥ c k A k ∥ \sum\limits_{k=0}^{\infty}\left\|c_k A^k\right\| k=0∑∞ ckAk 收敛。
- 若幂级数 ∑ k = 0 ∞ c k z k \sum\limits_{k=0}^{\infty} c_k z^k k=0∑∞ckzk 的收敛半径为 R R R, 则 ρ ( A ) < R \rho(A)<R ρ(A)<R 时 ∑ k = 0 ∞ c k A k \sum\limits_{k=0}^{\infty} c_k A^k k=0∑∞ckAk 绝对收敛; ρ ( A ) > R \rho(A)>R ρ(A)>R 时 ∑ k = 0 ∞ c k A k \sum\limits_{k=0}^{\infty} c_k A^k k=0∑∞ckAk 发散。
2.2 性质
- 对于任何矩阵范数 ∥ ⋅ ∥ \|·\| ∥⋅∥ , { A ∣ ∥ A ∥ < R } ⊂ { A ∣ ρ ( A ) < R } \{A \ | \ \|A\|<R\} \subset\{A \mid \rho(A)<R\} {A ∣ ∥A∥<R}⊂{A∣ρ(A)<R} 。
- 如果幂级数 f ( z ) = ∑ k = 0 ∞ c k z k f(z)=\sum\limits_{k=0}^{\infty} c_k z^k f(z)=k=0∑∞ckzk 在整个复平面上是收敛的, 那么不论 A A A 是什么矩阵, 矩阵幂级数 ∑ k = 0 ∞ c k A k \sum\limits_{k=0}^{\infty} c_k A^k k=0∑∞ckAk 总是绝对收敛的。
判断收敛三种,一种是所有特征值全小于收敛半径,一种是随便找到一种范数比收敛半径小,一种是谱半径比收敛半径小
3 谱半径
设 A ∈ C n × n A \in C^{n \times n} A∈Cn×n , λ 1 , . . . , λ n \lambda_1 , ... , \lambda_n λ1,...,λn为 A A A的全部特征值,则称 ρ ( A ) = max 1 ≤ k ≤ n ∣ λ k ∣ \rho(A) = \max\limits_{1\leq k\leq n}|\lambda_k| ρ(A)=1≤k≤nmax∣λk∣ 为 A A A的谱半径。
- 若 A A A为 n n n阶正规矩阵(指 A A T = A T A AA^T=A^TA AAT=ATA),则 ρ ( A ) = ∣ ∣ A ∣ ∣ 2 \rho(A) = ||A||_2 ρ(A)=∣∣A∣∣2
- 设 A A A 为给定的方阵,则对任何正数 ϵ \epsilon ϵ,都存在某方阵范数 ∣ ∣ ⋅ ∣ ∣ ||·|| ∣∣⋅∣∣,使得 ∣ ∣ A ∣ ∣ ≤ ρ ( A ) + ϵ ||A|| \leq \rho(A) + \epsilon ∣∣A∣∣≤ρ(A)+ϵ
- 若幂级数 ∑ k = 0 ∞ c k z k \sum\limits_{k=0}^{\infty} c_k z^k k=0∑∞ckzk 的收敛半径为 R , A ∈ C n × n R ,A\in C^{n\times n} R,A∈Cn×n ,则
当 ρ ( A ) < R \rho(A)<R ρ(A)<R时, ∑ k = 0 ∞ c k A k \sum\limits_{k=0}^{\infty} c_k A^k k=0∑∞ckAk绝对收敛
当 ρ ( A ) > R \rho(A)>R ρ(A)>R时, ∑ k = 0 ∞ c k A k \sum\limits_{k=0}^{\infty} c_k A^k k=0∑∞ckAk发散
三、 矩阵函数
1、矩阵函数的基本概念
- 设函数 f ( λ ) f(\lambda) f(λ) 能展开成幂级数 ∑ k = 0 ∞ a k λ k \sum\limits_{k=0}^{\infty} a_k \lambda^k k=0∑∞akλk ,其收敛半径为 R R R 。当 n n n 阶矩阵 A A A 的谱半径 ρ ( A ) < R \rho(A)<R ρ(A)<R 时, 称矩阵幂级数的和 ∑ k = 0 ∞ a k A k \sum\limits_{k=0}^{\infty} a_k A^k k=0∑∞akAk 为 A A A 的矩阵函数值, 记为 f ( A ) f(A) f(A) 。
- f ( λ ) = ∑ k = 0 ∞ a k λ k f(\lambda)=\sum\limits_{k=0}^{\infty} a_k \lambda^k f(λ)=k=0∑∞akλk 时, a k = f ( k ) ( 0 ) , k = 0 , 1 , 2 , ⋯ a_k=f^{(k)}(0), k=0,1,2, \cdots ak=f(k)(0),k=0,1,2,⋯ 。
- f ( O ) = f ( 0 ) E , f ( E ) = f ( 1 ) E , f ( λ E ) = f ( λ ) E f(O)=f(0) E, f(E)=f(1) E, f(\lambda E)=f(\lambda) E f(O)=f(0)E,f(E)=f(1)E,f(λE)=f(λ)E 。
- 泰勒展开式对应矩阵函数
- e A = E + A + A 2 2 ! + . . . + A n n ! + . . . e^A = E +A + \frac{A^2}{2!} + ... + \frac{A^n}{n!} + ... eA=E+A+2!A2+...+n!An+...
- 1 E − A = E + A + A 2 + . . . + A n + . . . \frac{1}{E-A} = E + A + A^2 + ... + A^n +... E−A1=E+A+A2+...+An+...
- s i n A = A − A 3 3 ! + A 5 5 ! + . . . + ( − 1 ) n A 2 n + 1 ( 2 n + 1 ) ! + . . . sinA= A - \frac{A^3}{3!} + \frac{A^5}{5!} + ...+ \frac{(-1)^n A^{2n+1}}{(2n+1)!} +... sinA=A−3!A3+5!A5+...+(2n+1)!(−1)nA2n+1+...
2、利用 C a y l e y − H a m i l t o n Cayley - Hamilton Cayley−Hamilton 定理的降幂方法
由$ Cayley-Hamilton$ 定理可知, n n n 阶矩阵 A A A 的幂级数的和 ∑ k = 0 ∞ a k A k \sum\limits_{k=0}^{\infty} a_k A^k k=0∑∞akAk 可表示为矩阵 A A A 的至多 n − 1 n-1 n−1 次矩阵多项式, 因此可通过数项级数求和的方法计算矩阵幂级数。这为矩阵函数的计算提供了基本方法。
Hamilton-Cayley定理: 设 A A A 是数域 F F F 上的 n n n 阶矩阵, f ( λ ) = ∣ λ E − A ∣ = λ n + d 1 s n − 1 + . . . + d n f(λ)=|λE-A|=\lambda^n + d_1s^{n-1} + ... + d_n f(λ)=∣λE−A∣=λn+d1sn−1+...+dn 是 A A A 的特征多项式,则 f ( A ) = A n + d 1 A n − 1 + . . . + d n − 1 A + d n E f(A) = A^n + d_1A^{n-1}+ ... + d_{n-1}A + d_nE f(A)=An+d1An−1+...+dn−1A+dnE
3、利用$Jordan $标准型的相似变换方法
设 A A A 的 J o r d a n Jordan Jordan 标准型为 J = ( J 1 J 2 ⋱ J s ) J=\left(\begin{array}{llll}J_1 & & & \\ & J_2 & & \\ & & \ddots & \\ & & & J_s\end{array}\right) J= J1J2⋱Js , 其中 J k = ( λ k 1 λ k ⋱ ⋱ 1 λ k ) m k J_k=\left(\begin{array}{llll}\lambda_k & 1 & & \\ & \lambda_k & \ddots & \\ & & \ddots & 1 \\ & & & \lambda_k\end{array}\right)_{m_k} Jk= λk1λk⋱⋱1λk mk, k = 1 , 2 , ⋯ , s k=1,2, \cdots, s k=1,2,⋯,s, 则存在可逆矩阵 P P P, 使得 A = P J P − 1 A=P J P^{-1} A=PJP−1 。
由此可得, 对于函数 f ( λ ) = ∑ i = 0 ∞ a i λ i , f ( A ) = P f ( J ) P − 1 f(\lambda)=\sum\limits_{i=0}^{\infty} a_i \lambda^i, f(A)=P f(J) P^{-1} f(λ)=i=0∑∞aiλi,f(A)=Pf(J)P−1, 其中
f ( J ) = ( f ( J 1 ) f ( J 2 ) ⋱ f ( J s ) ) , f(J)=\left(\begin{array}{llll} f\left(J_1\right) & & & \\ & f\left(J_2\right) & & \\ & & \ddots & \\ & & & f\left(J_s\right) \end{array}\right), f(J)= f(J1)f(J2)⋱f(Js) ,
f ( J k ) = ( f ( λ k ) f ′ ( λ k ) 1 ( m k − 1 ) ! f ( m k − 1 ) ( λ k ) f ( λ k ) ⋱ ⋱ f ′ ( λ k ) f ( λ k ) ) m k f\left(J_k\right)=\left(\begin{array}{cccc} f\left(\lambda_k\right) & f^{\prime}\left(\lambda_k\right) & & \frac{1}{\left(m_k-1\right) !} f^{\left(m_k-1\right)}\left(\lambda_k\right) \\ & f\left(\lambda_k\right) & \ddots & \\ & & \ddots & f^{\prime}\left(\lambda_k\right) \\ & & & f\left(\lambda_k\right) \end{array}\right)_{m_k} f(Jk)= f(λk)f′(λk)f(λk)⋱⋱(mk−1)!1f(mk−1)(λk)f′(λk)f(λk) mk
- 计算步聚:
1、计算 A A A 的初等因子, 得 Jordan 标准型 J J J, 并计算相似变换矩阵 P P P 。
2、计算 f ( J k ) f\left(J_{k}\right) f(Jk), 得到 f ( J ) f(J) f(J) 。
3、计算 f ( A ) = P f ( J ) P − 1 f(A)=P f(J) P^{-1} f(A)=Pf(J)P−1 。
4、利用矩阵谱的待定系数方法
4.1 概念
设矩阵 A A A 的最小多项式为 g ( λ ) = ( λ − λ 1 ) m 1 ( λ − λ 2 ) m 2 ⋯ ( λ − λ s ) m s g(\lambda)=\left(\lambda-\lambda_{1}\right)^{m_{1}}\left(\lambda-\lambda_{2}\right)^{m_{2}} \cdots\left(\lambda-\lambda_{s}\right)^{m_{s}} g(λ)=(λ−λ1)m1(λ−λ2)m2⋯(λ−λs)ms, 则称 { ( λ k , m k ) } \left\{\left(\lambda_{k}, m_{k}\right)\right\} {(λk,mk)} 为 A A A 的谱, 记为 Λ A \Lambda_{A} ΛA 。
- 对于多项式 f ( λ ) , { f ( i ) ( λ k ) , k = 1 , 2 , ⋯ , s ; i = 0 , 1 , ⋯ , m k − 1 } f(\lambda),\left\{f^{(i)}\left(\lambda_{k}\right), k=1,2, \cdots, s ; i=0,1, \cdots, m_{k}-1\right\} f(λ),{f(i)(λk),k=1,2,⋯,s;i=0,1,⋯,mk−1} 记为 f ( Λ A ) f\left(\Lambda_{A}\right) f(ΛA), 称为 f ( λ ) f(\lambda) f(λ) 在 A A A 的谱 Λ A \Lambda_{A} ΛA 上的值。
4.2 性质
对于矩阵 A A A 和多项式 f ( λ ) f(\lambda) f(λ)、 h ( λ ) h(\lambda) h(λ) :
(充要条件:) f ( A ) = h ( A ) ⇔ f ( Λ A ) = h ( Λ A ) f(A)=h(A) \Leftrightarrow f\left(\Lambda_{A}\right)=h\left(\Lambda_{A}\right) f(A)=h(A)⇔f(ΛA)=h(ΛA)(其中 Λ A \Lambda_{A} ΛA 为 A A A 的谱。)
- 对于同底的两个初等因子 ( λ − λ i ) m i \left(\lambda-\lambda_{i}\right)^{m_{i}} (λ−λi)mi、 ( λ − λ i ) m j ( m i < m j ) \left(\lambda-\lambda_{i}\right)^{m_{j}}\left(m_{i}<m_{j}\right) (λ−λi)mj(mi<mj), 前者所对应的 J o r d a n Jordan Jordan 块 J i J_{i} Ji 的函数矩阵 f ( J i ) f\left(J_{i}\right) f(Ji) 中的元素含在后者所对应的 J o r d a n Jordan Jordan 块 J ~ i \tilde{J}_{i} J~i 的函数矩阵 f ( J ~ i ) f\left(\tilde{J}_{i}\right) f(J~i) 之中。
4.3 计算步骤
- 1、 求出矩阵 A A A 的谱为 Λ A = { ( λ k , m k ) , k = 1 , 2 , ⋯ , s } \Lambda_{A}=\left\{\left(\lambda_{k}, m_{k}\right), k=1,2, \cdots, s\right\} ΛA={(λk,mk),k=1,2,⋯,s}, 并且 m 1 + m 2 + ⋯ + m s = l m_{1}+m_{2}+\cdots+m_{s}=l m1+m2+⋯+ms=l 。
- 2、 设 h ( λ ) = a 1 λ l − 1 + a 2 λ l − 2 + ⋯ + a l − 1 λ + a l h(\lambda)=a_{1} \lambda^{l-1}+a_{2} \lambda^{l-2}+\cdots+a_{l-1} \lambda+a_{l} h(λ)=a1λl−1+a2λl−2+⋯+al−1λ+al, 由 h ( λ k ) = f ( λ k ) , h ′ ( λ k ) = f ′ ( λ k ) , ⋯ h\left(\lambda_{k}\right)=f\left(\lambda_{k}\right), h{\prime}\left(\lambda_{k}\right)=f{\prime}\left(\lambda_{k}\right), \cdots h(λk)=f(λk),h′(λk)=f′(λk),⋯ , h ( m k − 1 ) ( λ k ) = f ( m k − 1 ) ( λ k ) , k = 1 , 2 , ⋯ , s h^{\left(m_{k}-1\right)}\left(\lambda_{k}\right)=f^{\left(m_{k}-1\right)}\left(\lambda_{k}\right), k=1,2, \cdots, s h(mk−1)(λk)=f(mk−1)(λk),k=1,2,⋯,s ,解得 a 1 , a 2 , ⋯ , a l − 1 , a l a_{1}, a_{2}, \cdots, a_{l-1}, a_{l} a1,a2,⋯,al−1,al 。
- 3、 f ( A ) = a 1 A l − 1 + a 2 A l − 2 + ⋯ + a l − 1 A + a l E f(A)=a_{1} A^{l-1}+a_{2} A^{l-2}+\cdots+a_{l-1} A+a_{l} E f(A)=a1Al−1+a2Al−2+⋯+al−1A+alE
四、矩阵的微分和积分
1、单变量函数矩阵的微分与积分
1.1 微分
- 对于函数矩阵 A ( t ) = ( a i j ( t ) ) A(t)=\left(a_{i j}(t)\right) A(t)=(aij(t)), 若每个 a i j ( t ) a_{i j}(t) aij(t) 都在区间 ( a , b ) (a, b) (a,b) 内可导, 则称 A ( t ) A(t) A(t) 在区间 ( a , b ) (a, b) (a,b) 内可导, 矩阵 ( a i j ′ ( t ) ) \left(a_{i j}'(t)\right) (aij′(t)) 称为其导数, 记为 A ′ ( t ) A' (t) A′(t) 。
- A ( t ) A(t) A(t) 的高阶导数可定义为 A ( k ) ( t ) = ( a i j ( k ) ( t ) ) A^{(k)}(t)=\left(a_{i j}^{(k)}(t)\right) A(k)(t)=(aij(k)(t)) 。
- 常数矩阵的导数为 0 ;
- [ α A ( t ) + β B ( t ) ] ′ = α A ′ ( t ) + β B ′ ( t ) [\alpha A(t)+\beta B(t)]{\prime}=\alpha A{\prime}(t)+\beta B{\prime}(t) [αA(t)+βB(t)]′=αA′(t)+βB′(t);
- [ A ( t ) B ( t ) ] ′ = A ′ ( t ) B ( t ) + A ( t ) B ′ ( t ) [A(t) B(t)]{\prime}=A{\prime}(t) B(t)+A(t) B{\prime}(t) [A(t)B(t)]′=A′(t)B(t)+A(t)B′(t);
- 设 A ( t ) A(t) A(t) 可导, s = f ( t ) s=f(t) s=f(t) 为可微函数, 则 A ( f ( t ) ) A(f(t)) A(f(t)) 可导, 并且 [ A ( f ( t ) ) ] ′ = A ′ ( u ) ∣ u = f ( t ) f ′ ( t ) ; [A(f(t))]'=\left.A '(u)\right|_{u=f(t)} f '(t) ; [A(f(t))]′=A′(u)∣u=f(t)f′(t);
- [ A T ( t ) ] ′ = [ A ′ ( t ) ] T \left[A^{T}(t)\right] '=\left[A '(t)\right]^{T} [AT(t)]′=[A′(t)]T;
- 若 A ( t ) A(t) A(t) 及其逆矩阵都可导, 则 [ A − 1 ( t ) ] ′ = A − 1 ( t ) A ′ ( t ) A − 1 ( t ) \left[A^{-1}(t)\right] '=A^{-1}(t) A '(t) A^{-1}(t) [A−1(t)]′=A−1(t)A′(t)A−1(t) 。
1.2 积分
对于函数矩阵 A ( t ) = ( a i j ( t ) ) A(t)=\left(a_{i j}(t)\right) A(t)=(aij(t)), 若每个 a i j ( t ) a_{i j}(t) aij(t) 都在区间 ( a , b ) (a, b) (a,b) 内都有原函数 ∫ a i j ( t ) d t \int a_{i j}(t) d t ∫aij(t)dt, 则称 ( ∫ a i j ( t ) d t ) \left(\int a_{i j}(t) d t\right) (∫aij(t)dt) 为 A ( t ) A(t) A(t) 在 ( a , b ) (a, b) (a,b) 内的不定积分, 记为 ∫ A ( t ) d t \int A(t) d t ∫A(t)dt 。若每个 a i j ( t ) a_{i j}(t) aij(t) 都在区间 [ a , b ] [a, b] [a,b] 上可积, 则称 ( ∫ a b a i j ( t ) d t ) \left(\int_{a}^{b} a_{i j}(t) d t\right) (∫abaij(t)dt) 为 A ( t ) A(t) A(t) 在 [ a , b ] [a, b] [a,b] 上的定积分, 记为 ∫ a b A ( t ) d t \int_{a}^{b} A(t) d t ∫abA(t)dt 。
- d d x ∫ a x A ( t ) d t = A ( x ) \frac{d}{d x} \int_{a}^{x} A(t) d t=A(x) dxd∫axA(t)dt=A(x) 。
2、矩阵函数的微分与积分
2.1 微分
设 A = ( a i j ) m × n A=\left(a_{i j}\right)_{m \times n} A=(aij)m×n 中元素 a i j a_{i j} aij 都是 B = ( b k l ) p × q B=\left(b_{k l}\right)_{p \times q} B=(bkl)p×q 中元素 b k l b_{k l} bkl 的函数: a i j = f i j ( B ) , k = 1 , ⋯ , p ; l = 1 , . . . , q a_{i j}=f_{i j}(B), k=1, \cdots, p ; l=1,...,q aij=fij(B),k=1,⋯,p;l=1,...,q,即 a i j = f i j ( b k l ; k = 1 , . . , p ; l = 1 , . . . , q ) a_{ij} = f_{ij}(b_{kl};k=1,..,p ; l=1,...,q) aij=fij(bkl;k=1,..,p;l=1,...,q),则 p × q p \times q p×q阶分块矩阵 ( ∂ A ∂ b 11 ⋯ ∂ A ∂ b 1 q ⋯ ⋯ ⋯ ∂ A ∂ b p 1 ⋯ ∂ A ∂ b p l ) \left(\begin{array}{ccc}\frac{\partial A}{\partial b_{11}} & \cdots & \frac{\partial A}{\partial b_{1 q}} \\ \cdots & \cdots & \cdots \\ \frac{\partial A}{\partial b_{p 1}} & \cdots & \frac{\partial A}{\partial b_{p l}}\end{array}\right) ∂b11∂A⋯∂bp1∂A⋯⋯⋯∂b1q∂A⋯∂bpl∂A 称为 A A A 对 B B B 的导数 ,记为 d A d B \frac{dA}{dB} dBdA或 ( ∂ A ∂ b k l ) (\frac{\partial A}{\partial b_{kl}}) (∂bkl∂A) ,其中 ( ∂ A ∂ b k l ) = ( ∂ a 11 ∂ b k l ⋯ ∂ a 1 n ∂ b k l ⋯ ⋯ ⋯ ∂ a m 1 ∂ b k l ⋯ ∂ a m n ∂ b k l ) , k = 1 , ⋯ , p ; l = 1 , . . . , q (\frac{\partial A}{\partial b_{kl}}) = \left(\begin{array}{ccc}\frac{\partial a_{11}}{\partial b_{kl}} & \cdots & \frac{\partial a_{1n}}{\partial b_{kl}} \\ \cdots & \cdots & \cdots \\ \frac{\partial a_{m1}}{\partial b_{kl}} & \cdots & \frac{\partial a_{mn}}{\partial b_{kl}}\end{array}\right) ,k=1, \cdots, p ; l=1,...,q (∂bkl∂A)= ∂bkl∂a11⋯∂bkl∂am1⋯⋯⋯∂bkl∂a1n⋯∂bkl∂amn ,k=1,⋯,p;l=1,...,q
- 向量的函数 f ( x ) f(x) f(x) 对向量 x = ( ξ 1 , ξ 2 , ⋯ , ξ n ) T x=\left(\xi_{1}, \xi_{2}, \cdots, \xi_{n}\right)^{T} x=(ξ1,ξ2,⋯,ξn)T 的导数为 d f d x = ( ∂ f ∂ x i ) T \frac{d f}{d x}=\left(\frac{\partial f}{\partial x_{i}}\right)^{T} dxdf=(∂xi∂f)T, 即为 f ( x ) f(x) f(x) 的梯度向量, d 2 f d x d x T = d d x T ( d f d x ) T = ( ∂ 2 f ∂ x i ∂ x j ) \frac{d^{2} f}{d x d x^{T}}=\frac{d}{d x^{T}}\left(\frac{d f}{d x}\right)^{T}=\left(\frac{\partial^{2} f}{\partial x_{i} \partial x_{j}}\right) dxdxTd2f=dxTd(dxdf)T=(∂xi∂xj∂2f) 即为 f ( x ) f(x) f(x) 的 H e s s i a n Hessian Hessian矩阵; 矩阵的函数 f ( X ) f(X) f(X) 对矩 阵 X = ( x i j ) X=\left(x_{i j}\right) X=(xij) 的导数为 d f d X = ( ∂ f ∂ x i j ) \frac{d f}{d X}=\left(\frac{\partial f}{\partial x_{i j}}\right) dXdf=(∂xij∂f) 。
- 对于 f ( x ) = x T A x , d f d x = ( A T + A ) x = 2 A x f(x)=x^{T} A x, \frac{d f}{d x}=\left(A^{T}+A\right) x=2 A x f(x)=xTAx,dxdf=(AT+A)x=2Ax 。
2.2 K r o n e c k e r Kronecker Kronecker 积
设 A ∈ C m × n , B ∈ C p × q A \in C^{m \times n}, B \in C^{p \times q} A∈Cm×n,B∈Cp×q, 则矩阵 ( a 11 B ⋯ a 1 n B ⋯ ⋯ ⋯ a m 1 B ⋯ a m n B ) \left(\begin{array}{ccc}a_{11} B & \cdots & a_{1 n} B \\ \cdots & \cdots & \cdots \\ a_{m 1} B & \cdots & a_{m n} B\end{array}\right) a11B⋯am1B⋯⋯⋯a1nB⋯amnB 称为 A A A 与 B 的 K r o n e c k e r Kronecker Kronecker 积, 记为 A ⊗ B A \otimes B A⊗B 或简记为 ( a i j B ) \left(a_{i j} B\right) (aijB) 。
- A ⊗ B A \otimes B A⊗B 的行数为 A , B A, B A,B 行数之积 ; A ⊗ B A \otimes B A⊗B 的列数为 A , B A, B A,B 列数之积。
- ( a A ) ⊗ B = A ⊗ ( a B ) = a ( A ⊗ B ) (a A) \otimes B=A \otimes(a B)=a(A \otimes B) (aA)⊗B=A⊗(aB)=a(A⊗B) 。
- ( A ⊗ B ) ⊗ C = A ⊗ ( B ⊗ C ) (A \otimes B) \otimes C=A \otimes(B \otimes C) (A⊗B)⊗C=A⊗(B⊗C) 。
- ( A + B ) ⊗ C = A ⊗ C + B ⊗ C , A ⊗ ( B + C ) = A ⊗ B + A ⊗ C (A+B) \otimes C=A \otimes C+B \otimes C, A \otimes(B+C)=A \otimes B+A \otimes C (A+B)⊗C=A⊗C+B⊗C,A⊗(B+C)=A⊗B+A⊗C 。
- ( A ⊗ B ) H = A H ⊗ B H (A \otimes B)^H=A^H \otimes B^H (A⊗B)H=AH⊗BH 。
- ( A ⊗ B ) ( C ⊗ D ) = ( A C ) ⊗ ( B D ) (A \otimes B)(C \otimes D)=(A C) \otimes(B D) (A⊗B)(C⊗D)=(AC)⊗(BD) 。
- 若 A , B A, B A,B 可逆, 则 ( A ⊗ B ) − 1 = A − 1 ⊗ B − 1 (A \otimes B)^{-1}=A^{-1} \otimes B^{-1} (A⊗B)−1=A−1⊗B−1 。
2.3 n a b l a nabla nabla 算子
对于矩阵 A A A, 定义算子矩阵为 ∇ A = ( ∂ ∂ a i j ) = ( ∂ ∂ a 11 ⋯ ∂ ∂ a 1 n ⋯ ⋯ ⋯ ∂ ∂ a m 1 ⋯ ∂ ∂ a m n ) \nabla_A=\left(\frac{\partial}{\partial a_{i j}}\right)=\left(\begin{array}{ccc}\frac{\partial}{\partial a_{11}} & \cdots & \frac{\partial}{\partial a_{1 n}} \\ \cdots & \cdots & \cdots \\ \frac{\partial}{\partial a_{m 1}} & \cdots & \frac{\partial}{\partial a_{m n}}\end{array}\right) ∇A=(∂aij∂)= ∂a11∂⋯∂am1∂⋯⋯⋯∂a1n∂⋯∂amn∂ , 称为 n a b l a nabla nabla 算子。
- d A d B = ( ∂ A ∂ b k l ) = ∇ B ⊗ A \frac{d A}{d B}=\left(\frac{\partial A}{\partial b_{k l}}\right)=\nabla B \otimes A dBdA=(∂bkl∂A)=∇B⊗A 。
- d ( α A 1 + β A 2 ) d B = α d A 1 d B + β d A 2 d B \frac{d\left(\alpha A_1+\beta A_2\right)}{d B}=\alpha \frac{d A_1}{d B}+\beta \frac{d A_2}{d B} dBd(αA1+βA2)=αdBdA1+βdBdA2 。
- d ( A 1 A 2 ) d B = d A 1 d B ( E q ⊗ A 2 ) + ( E p ⊗ A 1 ) d A 2 d B \frac{d\left(A_1 A_2\right)}{d B}=\frac{d A_1}{d B}\left(E_q \otimes A_2\right)+\left(E_p \otimes A_1\right) \frac{d A_2}{d B} dBd(A1A2)=dBdA1(Eq⊗A2)+(Ep⊗A1)dBdA2 。
3、矩阵指数函数
- e 0 = E e^0=E e0=E
- 对于任何 A ∈ C n × n A\in C^{ \ n\times n} A∈C n×n , d d t e A t = A e A t = e A t A \frac{d}{dt} e^{At}= Ae^{At}= e^{At} A dtdeAt=AeAt=eAtA
- 设 $A, B \in C^{ \ n\times n} $,并且 A B = B A AB = BA AB=BA ,则 e A t B = B e A t e^{At} B= Be^{At} eAtB=BeAt。
- 设 $A, B \in C^{ \ n\times n} $,并且 A B = B A AB = BA AB=BA ,则 e A + B = e A e B = e B e A e^{A+B} =e^Ae^B= e^Be^{A} eA+B=eAeB=eBeA。
- 对于任何 A ∈ C n × n A\in C^{ \ n\times n} A∈C n×n:
- e i A = c o s A + i s i n A e^{iA} = cosA +i sinA eiA=cosA+isinA
- c o s A = 1 2 ( e i A + e − i A ) cosA = \frac{1}{2}(e^{iA}+e^{-iA}) cosA=21(eiA+e−iA)
- s i n A = 1 2 i ( e i A − e − i A ) sinA = \frac{1}{2i}(e^{iA} -e^{-iA}) sinA=2i1(eiA−e−iA)
- s i n 2 A + c o s 2 A = E sin^2A + cos^2A = E sin2A+cos2A=E
- c o s ( − A ) = c o s A cos(-A) = cosA cos(−A)=cosA
- s i n ( − A ) = − s i n A sin(-A) = -sinA sin(−A)=−sinA
五、矩阵分析的应用
1、常系数线性微分方程组
对于一阶常系数齐次微分方程组的定解问题: { d x 1 d t = a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n d x 2 d t = a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n d x n d t = a n 1 x 1 + a n 2 x 2 + ⋯ + a n n x n \left\{\begin{array}{l}\frac{d x_1}{d t}=a_{11} x_1+a_{12} x_2+\cdots+a_{1 n} x_n \\ \\ \frac{d x_2}{d t}=a_{21} x_1+a_{22} x_2+\cdots+a_{2 n} x_n \\ \\ \frac{d x_n}{d t}=a_{n 1} x_1+a_{n 2} x_2+\cdots+ a_{n n} x_n \end{array}\right. ⎩ ⎨ ⎧dtdx1=a11x1+a12x2+⋯+a1nxndtdx2=a21x1+a22x2+⋯+a2nxndtdxn=an1x1+an2x2+⋯+annxn
其中,可微函数 x i = x i ( t ) ( i = 1 , 2 , ⋯ , n ) x_i=x_i(t)(i=1,2, \cdots, n) xi=xi(t)(i=1,2,⋯,n) 满足初始条件: x 1 ( 0 ) = x 1 0 , x 2 ( 0 ) = x 2 0 , ⋯ , x n ( 0 ) = x n 0 x_1(0)=x_1^0, x_2(0)=x_2^0, \cdots, x_n(0)=x_n^0 x1(0)=x10,x2(0)=x20,⋯,xn(0)=xn0 , 若 令 x ( t ) = ( x 1 ( t ) , x 2 ( t ) , ⋯ , x n ( t ) ) T , x 0 = ( x 1 0 , x 2 0 , ⋯ , x n 0 ) , A = ( a i j ) n x(t)=\left(x_1(t), x_2(t), \cdots, x_n(t)\right)^T, x^0=\left(x_1^0, x_2^0, \cdots, x_n^0\right), A=\left(a_{i j}\right)_n x(t)=(x1(t),x2(t),⋯,xn(t))T,x0=(x10,x20,⋯,xn0),A=(aij)n , 则上述定解问题可表 示为 { x ′ ( t ) = A x ( t ) x ( 0 ) = x 0 \left\{\begin{array}{c}x^{\prime}(t)=A x(t) \\ x(0)=x^0\end{array}\right. {x′(t)=Ax(t)x(0)=x0 。
- 定解问题 { x ′ ( t ) = A x ( t ) x ( 0 ) = x 0 \left\{\begin{array}{l} x'(t)= Ax(t)\\ \\ x(0)= x^0 \\ \end{array}\right. ⎩ ⎨ ⎧x′(t)=Ax(t)x(0)=x0 具有唯一解 x ( t ) = e A t x 0 x(t)=e^{At}x^0 x(t)=eAtx0
- 定解问题 { x ′ ( t ) = A x ( t ) x ( t 0 ) = x 0 \left\{\begin{array}{l} x'(t)= Ax(t)\\ \\ x(t_0)= x^0 \\ \end{array}\right. ⎩ ⎨ ⎧x′(t)=Ax(t)x(t0)=x0 具有唯一解 x ( t ) = e A ( t − t 0 ) x 0 x(t)=e^{A(t-t_0)}x^0 x(t)=eA(t−t0)x0
- 设 A ∈ C n × n , B ∈ C n × m , u ( t ) A\in C^{n\times n },B \in C^{n\times m } ,u(t) A∈Cn×n,B∈Cn×m,u(t)为 m m m 维的函数列向量,则线性常系数非齐次微分方程组的定解问题 { x ′ ( t ) = A x ( t ) + B u ( t ) x ( 0 ) = x 0 \left\{\begin{array}{l} x'(t)= Ax(t) + Bu(t)\\ \\ x(0)= x^0 \\ \end{array}\right. ⎩ ⎨ ⎧x′(t)=Ax(t)+Bu(t)x(0)=x0 有唯一解 x ( t ) = e A t x 0 + ∫ 0 t e A ( t − τ ) B u ( τ ) d τ x(t)=e^{At}x^0 + \int_{0}^{t} e^{A(t-\tau)} Bu(\tau) d \tau x(t)=eAtx0+∫0teA(t−τ)Bu(τ)dτ
《矩阵理论》笔记 4 — 矩阵分析及其应用相关推荐
- 矩阵笔记1:矩阵分析(第三版)-史荣昌-第一章:线性空间和线性变换
文章目录 0 笔记说明 1 书本内容 1.1 线性空间 1.2 基与坐标.坐标变换 1.3 线性子空间 1.4 线性映射 1.5 线性映射的值域.核 1.6 线性变换的矩阵与线性变换的运算 1.7 n ...
- 矩阵笔记4:矩阵分析(第三版)-史荣昌-第四章:矩阵分解
文章目录 0 笔记说明 1 书本内容 1.1 矩阵的满秩分解 1.2 矩阵的正交三角分解(UR.QR分解) 1.3 矩阵的奇异值分解 1.4 矩阵的极分解 1.5 矩阵的谱分解 2 听课笔记 2.1 ...
- 矩阵笔记3:矩阵分析(第三版)-史荣昌-第三章:内积空间、正规矩阵、Hermite矩阵
文章目录 0 笔记说明 1 书本内容 1.1 欧氏空间.酉空间 1.2 标准正交基.Schmidt方法 1.3 酉变换.正交变换 1.4 幂等矩阵.正交投影 1.5 对称与反对称变换 1.6 Schu ...
- 矩阵笔记2:矩阵分析(第三版)-史荣昌-第二章:λ-矩阵与矩阵的Jordan标准型
文章目录 0 笔记说明 1 书本内容 1.1 λ-矩阵及标准型 1.2 初等因子与相似条件 1.3 矩阵的Jordan标准型 1.4 矩阵的有理标准型 2 听课笔记 2.1 λ-矩阵及标准型 2.2 ...
- java代码:双色球号随机生成(极其简洁!)
https://blog.csdn.net/qq_40677004/article/details/79699270 原 java代码:双色球号随机生成(极其简洁!) 2018年03月26日 15:5 ...
- 《矩阵理论》大萌课程笔记 - 线性空间与子空间
<矩阵理论>大萌课程笔记 - 线性空间与子空间 总目录 章节名称与链接 线性空间与线性变换 线性空间与子空间 有限维线性空间.基.维数 线性变换 内积空间 特征值与特征向量 特殊矩阵 矩阵 ...
- 奇异矩阵能lu分解条件_矩阵分析-期末复习笔记(上)
(复习笔记,可能有点乱.夹杂着乱七八糟的英文,因为要用英文考试.) (如果有误请一定要和我说!祝我final考个好成绩-) 目录: 特征值,特征向量,相似 (Eigenvalues, eigenvec ...
- 《矩阵理论》大萌课程笔记 - 特殊矩阵
<矩阵理论>大萌课程笔记 - 特殊矩阵 总目录 章节名称与链接 线性空间与线性变换 线性空间与子空间 有限维线性空间.基.维数 线性变换 内积空间 特征值与特征向量 特殊矩阵 矩阵分解 矩 ...
- Hadamard积 学习笔记(张贤达《矩阵分析与应用》)
Hadamard积 学习笔记(张贤达<矩阵分析与应用>) 定义 与正定性有关的性质 正定性的传递性 正定性的反推(Fejer定理) 与矩阵迹有关的性质 定理1 定理2 一般性质 Hadam ...
最新文章
- android 比较两个list,比较两个List的内容是否相等
- vs2015编译tensorflow v1.5
- 第二十篇:定义一个整形变量
- Php基础正则表达式篇
- Spark天堂之门解密
- android 判断 string 是否是字母数字,Android中判断字符串中必须包含字母或者数字...
- Spring核心系列之ApplicationContext
- sleep方法和wait方法的区别?
- vss 2005 配置服务器端的时候提示IIS没有安装
- ADC0808ad转换实验程序c语言,模数转换器ADC0808的应用
- (转)《C++ Qt 编程视频教程》(C++ Qt Programming)[MP4]
- 关于spring boot的web.xml
- 单片机 TDA8023 读 ic 卡 smrat card sync_card
- 软件测试面试必考题:自我介绍
- android file assets,关于Android Assets读取文件为File对象
- pix2pixHD: High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs
- AI读懂说话人情绪,语音情感识别数据等你Pick!
- 英语美文-不做有才华的穷人
- 海伦公式(附一种证明方法)
- win10计算机本地连接属性在哪里,Win10系统打开本地连接属性的方法