矩阵分析及其应用

文章目录

矩阵分析及其应用
- 一、矩阵序列
- - 1、矩阵序列收敛的概念
  - 2、矩阵序列收敛的性质
  - - 2.1 收敛的性质
    - 2.2 有界
  - 3、收敛矩阵
  - - 3.1 概念
    - 3.2 性质
- 二、矩阵级数
- - 1、矩阵级数的收敛性
  - - 1.1 概念
    - 1.2 性质
  - 2、矩阵的幂级数的收敛性
  - - 2.1 概念
    - 2.2 性质
  - 3 谱半径
- 三、矩阵函数
- - 1、矩阵函数的基本概念
  - 2、利用 C a y l e y − H a m i l t o n Cayley - Hamilton Cayley−Hamilton 定理的降幂方法
  - 3、利用$Jordan $标准型的相似变换方法
  - 4、利用矩阵谱的待定系数方法
  - - 4.1 概念
    - 4.2 性质
    - 4.3 计算步骤
- 四、矩阵的微分和积分
- - 1、单变量函数矩阵的微分与积分
  - - 1.1 微分
    - 1.2 积分
  - 2、矩阵函数的微分与积分
  - - 2.1 微分
    - 2.2 K r o n e c k e r Kronecker Kronecker 积
    - 2.3 n a b l a nabla nabla 算子
  - 3、矩阵指数函数
- 五、矩阵分析的应用
- - 1、常系数线性微分方程组

一、矩阵序列

1、矩阵序列收敛的概念

设有矩阵序列 A k = ( a i j ( k ) ) ∈ C m × n , k = 1 , 2 , . . . A_k=(a_{ij}^{(k)}) \in C^{m\times n} , k= 1, 2, ... Ak=(aij(k))∈Cm×n,k=1,2,... 。序列的每个矩阵中，处于相同位置的元素构成的数列都收敛, lim ⁡ k → ∞ a i j ( k ) = a i j , i = 1 , . . , m ; j = 1 , . . , n \lim\limits_{k\rightarrow \infty }a_{ij}^{(k)} = a_{ij} ,i=1,..,m;j=1,..,n k→∞limaij(k)=aij,i=1,..,m;j=1,..,n。若当 k → ∞ k \rightarrow \infty k→∞ 时， ∣ ∣ A k − A ∣ ∣ → 0 ||A_k-A|| \rightarrow 0 ∣∣Ak−A∣∣→0，则称矩阵序列 { A k } \{ A_k\} {Ak} 收敛于极限 A = ( a i j ) ∈ C n × n A = (a_{ij}) \in C^{\ n \times n} A=(aij)∈C n×n ，记作 A k → A A_k \rightarrow A Ak→A 。
- 不收敛的矩阵序列称为发散的。
- 充要条件 : A k → 0 ⇔ a i j ( k ) → a i j A_k \rightarrow 0 \Leftrightarrow a_{ij}^{(k)} \rightarrow a_{ij} Ak→0⇔aij(k)→aij ，即按元素位置收敛。
- 存在某矩阵范数 ∣ ∣ ⋅ ∣ ∣ ||·|| ∣∣⋅∣∣，使得 k → ∞ k \rightarrow \infty k→∞ 时， ∣ ∣ A k − A ∣ ∣ → 0 ||A_k -A|| \rightarrow 0 ∣∣Ak−A∣∣→0
- 充要条件 : A k → 0 ⇔ a i j ( k ) → 0 A_k \rightarrow 0 \Leftrightarrow a_{ij}^{(k)} \rightarrow 0 Ak→0⇔aij(k)→0

2、矩阵序列收敛的性质

2.1 收敛的性质

设 A k → A , B k → B A_k \rightarrow A , B_k \rightarrow B Ak→A,Bk→B ,则有

∀ α , β ∈ C , α A k + β B k → α A + β B \forall \alpha ,\beta \in C, \alpha A_k+\beta B_k \rightarrow \alpha A+\beta B ∀α,β∈C,αAk+βBk→αA+βB
A k B k → A B A_kB_k \rightarrow AB AkBk→AB
A k − 1 → A − 1 A_k^{-1} \rightarrow A^{-1} Ak−1→A−1（假设 A − 1 A^{-1} A−1存在）

2.2 有界

如果存在常数 $M> 0 $ ，使得对一切 k k k 都 ∣ a i j ( k ) ∣ < M |a_{ij}^{(k)}| < M ∣aij(k)∣<M ，则称矩阵序列 { A k } \{ A_k\} {Ak}有界。

收敛的矩阵序列必有界。
有界矩阵序列 { A k } \{ A_k\} {Ak} 必有收敛的子序列 { A k s } \{ A_{k_s}\} {Aks}
充要条件： 矩阵序列 { A k } \{A_k\} {Ak} 有界 ⇔ \Leftrightarrow ⇔ 存在常数 M > 0 M >0 M>0 ，使得 ∣ ∣ A k ∣ ∣ ≤ M ||A_k|| \leq M ∣∣Ak∣∣≤M 。

3、收敛矩阵

3.1 概念

设 A A A 为方阵且当 k → ∞ k \rightarrow \infty k→∞ 时，有 A k → 0 A^k \rightarrow 0 Ak→0 ，则称 A A A 为收敛矩阵。

3.2 性质

A k → 0 ( k → ∞ ) A^k \rightarrow 0(k \rightarrow \infty) Ak→0(k→∞) 的充要条件是 A A A 的谱半径 ρ ( A ) = max ⁡ ∣ λ ∣ < 1 \rho(A) = \max|\lambda| <1 ρ(A)=max∣λ∣<1，即所有特征值的模小于 1 。
若存在一种矩阵范数 ∣ ∣ ⋅ ∣ ∣ ||·|| ∣∣⋅∣∣，使得$||A||<1 $ ，则 A k → 0 ( k → ∞ ) A_k\rightarrow 0 ( k\rightarrow \infty ) Ak→0(k→∞) 。反之亦然。

二、矩阵级数

1、矩阵级数的收敛性

1.1 概念

矩阵序列 { A k s } \{ A_{k_s}\} {Aks} 形成的无穷和 $A_0+A_1+…+A_k+… $ 称为矩阵级数，记作 ∑ k = 0 ∞ A k \sum\limits_{k=0}^{\infty}A_k k=0∑∞Ak。
若矩阵序列 { A k s } \{ A_{k_s}\} {Aks} 的部分和 ∑ k = 0 ∞ A k \sum\limits_{k=0}^{\infty}A_k k=0∑∞Ak 收敛于 S S S ，则称矩阵级数 ∑ k = 0 ∞ A k \sum\limits_{k=0}^{\infty}A_k k=0∑∞Ak 收敛于 $S $，记作 ∑ k = 0 ∞ A k = S \sum\limits_{k=0}^{\infty}A_k = S k=0∑∞Ak=S。
若正项级数 ∑ k = 0 ∞ ∣ ∣ A k ∣ ∣ \sum\limits_{k=0}^{\infty}||A_k|| k=0∑∞∣∣Ak∣∣ 收敛级数，则称 ∑ k = 0 ∞ A k \sum\limits_{k=0}^{\infty}A_k k=0∑∞Ak 绝对收敛。

1.2 性质

（定理）设 A k = ( a i j ( k ) ) ∈ C n × n , k = 1 , 2 , . . . A_k=(a_{ij}^{(k)}) \in C^{ \ n\times n} ,k=1,2,... Ak=(aij(k))∈C n×n,k=1,2,... ，则
- (充要条件) 矩阵级数 ∑ k = 0 ∞ A k \sum\limits_{k=0}^{\infty} A_k k=0∑∞Ak 收敛 ⇔ \Leftrightarrow ⇔ ∑ k = 0 ∞ a i j ( k ) \sum\limits_{k=0}^{\infty} a_{ij}^{(k)} k=0∑∞aij(k)收敛
- (充要条件) 矩阵级数 ∑ k = 0 ∞ A k \sum\limits_{k=0}^{\infty} A_k k=0∑∞Ak 绝对收敛 ⇔ \Leftrightarrow ⇔ ∑ k = 0 ∞ a i j ( k ) \sum\limits_{k=0}^{\infty} a_{ij}^{(k)} k=0∑∞aij(k) 绝对收敛
（定理）设 $P，Q\in C^{ \ n\times n} $ ，并且 ∑ k = 0 ∞ A k \sum\limits_{k=0}^{\infty} A_k k=0∑∞Ak 收敛（或绝对收敛），则 ∑ k = 0 ∞ P A k Q \sum\limits_{k=0}^{\infty} PA_kQ k=0∑∞PAkQ 收敛（或绝对收敛），并且 ∑ k = 0 ∞ P A k Q = P ( ∑ k = 0 ∞ A k ) Q \sum\limits_{k=0}^{\infty} PA_kQ = P(\sum\limits_{k=0}^{\infty} A_k)Q k=0∑∞PAkQ=P(k=0∑∞Ak)Q
若矩阵级数绝对收敛，则它也一定收敛，并且任意调换其项的顺序所得的级数还是收敛的、且其和不变．
矩阵级数绝对收敛的充要条件是正项级数收敛。
如果矩阵级数绝对收敛，则也收敛。
设 $C^{\ n\times n} $ 中的两个矩阵级数 S 1 ： A 1 + A 2 + . . . + A k + . . . S_1 ：A_1 + A_2+...+A_k +... S1：A1+A2+...+Ak+... 和 S 2 ： B 1 + B 2 + . . + B k + . . S_2 ：B_1 + B_2 +..+ B_k +.. S2：B1+B2+..+Bk+.. 都绝对收敛，其和分别为 A A A 与 B B B ．则级数 S 1 S_1 S1 与 S 2 S_2 S2 按项相乘所得的矩阵级数绝对收敛，且有和 A B AB AB 。

2、矩阵的幂级数的收敛性

2.1 概念

对于 A ∈ C n × n A \in C^{n \times n} A∈Cn×n 和 { c k } ∈ C n \left\{c_k\right\} \in C^n {ck}∈Cn ，称 ∑ k = 0 ∞ c k A k = c 0 E + c 1 A + ⋯ + c k A k + ⋯ \sum\limits_{k=0}^{\infty} c_k A^k=c_0 E+c_1 A+\cdots+c_k A^k+\cdots k=0∑∞ckAk=c0E+c1A+⋯+ckAk+⋯ 为 A A A 的幂级数。
设幂级数 ∑ k = 0 ∞ c k z k \sum\limits_{k=0}^{\infty} c_k z^k k=0∑∞ckzk 的收敛半径为 R = lim ⁡ k → ∞ ∣ c k ∣ ∣ c k + 1 ∣ = 1 lim ⁡ k → ∞ ∣ c k ∣ k R=\lim\limits_{k \rightarrow \infty} \frac{\left|c_k\right|}{\left|c_{k+1}\right|}=\frac{1}{\lim\limits_{k \rightarrow \infty} \sqrt[k]{ |c_k |}} R=k→∞lim∣ck+1∣∣ck∣=k→∞limk∣ck∣ 1 ， A A A 的某范数 ∥ A ∥ \|A\| ∥A∥ 小于 R R R,则 ∑ k = 0 ∞ c k A k \sum\limits_{k=0}^{\infty} c_k A^k k=0∑∞ckAk 绝对收敛 ，即正项级数 ∑ k = 0 ∞ ∥ c k A k ∥ \sum\limits_{k=0}^{\infty}\left\|c_k A^k\right\| k=0∑∞ ckAk 收敛。
若幂级数 ∑ k = 0 ∞ c k z k \sum\limits_{k=0}^{\infty} c_k z^k k=0∑∞ckzk 的收敛半径为 R R R，则 ρ ( A ) < R \rho(A)<R ρ(A)<R 时 ∑ k = 0 ∞ c k A k \sum\limits_{k=0}^{\infty} c_k A^k k=0∑∞ckAk 绝对收敛； ρ ( A ) > R \rho(A)>R ρ(A)>R 时 ∑ k = 0 ∞ c k A k \sum\limits_{k=0}^{\infty} c_k A^k k=0∑∞ckAk 发散。

2.2 性质

对于任何矩阵范数 ∥ ⋅ ∥ \|·\| ∥⋅∥ ， { A ∣ ∥ A ∥ < R } ⊂ { A ∣ ρ ( A ) < R } \{A \ | \ \|A\|<R\} \subset\{A \mid \rho(A)<R\} {A ∣ ∥A∥<R}⊂{A∣ρ(A)<R} 。
如果幂级数 f ( z ) = ∑ k = 0 ∞ c k z k f(z)=\sum\limits_{k=0}^{\infty} c_k z^k f(z)=k=0∑∞ckzk 在整个复平面上是收敛的，那么不论 A A A 是什么矩阵，矩阵幂级数 ∑ k = 0 ∞ c k A k \sum\limits_{k=0}^{\infty} c_k A^k k=0∑∞ckAk 总是绝对收敛的。

判断收敛三种，一种是所有特征值全小于收敛半径，一种是随便找到一种范数比收敛半径小，一种是谱半径比收敛半径小

3 谱半径

设 A ∈ C n × n A \in C^{n \times n} A∈Cn×n ， λ 1 , . . . , λ n \lambda_1 , ... , \lambda_n λ1,...,λn为 A A A的全部特征值，则称 ρ ( A ) = max ⁡ 1 ≤ k ≤ n ∣ λ k ∣ \rho(A) = \max\limits_{1\leq k\leq n}|\lambda_k| ρ(A)=1≤k≤nmax∣λk∣ 为 A A A的谱半径。

若 A A A为 n n n阶正规矩阵(指 A A T = A T A AA^T=A^TA AAT=ATA)，则 ρ ( A ) = ∣ ∣ A ∣ ∣ 2 \rho(A) = ||A||_2 ρ(A)=∣∣A∣∣2
设 A A A 为给定的方阵，则对任何正数 ϵ \epsilon ϵ，都存在某方阵范数 ∣ ∣ ⋅ ∣ ∣ ||·|| ∣∣⋅∣∣，使得 ∣ ∣ A ∣ ∣ ≤ ρ ( A ) + ϵ ||A|| \leq \rho(A) + \epsilon ∣∣A∣∣≤ρ(A)+ϵ
若幂级数 ∑ k = 0 ∞ c k z k \sum\limits_{k=0}^{\infty} c_k z^k k=0∑∞ckzk 的收敛半径为 R ， A ∈ C n × n R ，A\in C^{n\times n} R，A∈Cn×n ，则
当 ρ ( A ) < R \rho(A)<R ρ(A)<R时， ∑ k = 0 ∞ c k A k \sum\limits_{k=0}^{\infty} c_k A^k k=0∑∞ckAk绝对收敛
当 ρ ( A ) > R \rho(A)>R ρ(A)>R时， ∑ k = 0 ∞ c k A k \sum\limits_{k=0}^{\infty} c_k A^k k=0∑∞ckAk发散

三、矩阵函数

1、矩阵函数的基本概念

设函数 f ( λ ) f(\lambda) f(λ) 能展开成幂级数 ∑ k = 0 ∞ a k λ k \sum\limits_{k=0}^{\infty} a_k \lambda^k k=0∑∞akλk ，其收敛半径为 R R R 。当 n n n 阶矩阵 A A A 的谱半径 ρ ( A ) < R \rho(A)<R ρ(A)<R 时，称矩阵幂级数的和 ∑ k = 0 ∞ a k A k \sum\limits_{k=0}^{\infty} a_k A^k k=0∑∞akAk 为 A A A 的矩阵函数值，记为 f ( A ) f(A) f(A) 。
- f ( λ ) = ∑ k = 0 ∞ a k λ k f(\lambda)=\sum\limits_{k=0}^{\infty} a_k \lambda^k f(λ)=k=0∑∞akλk 时, a k = f ( k ) ( 0 ) , k = 0 , 1 , 2 , ⋯ a_k=f^{(k)}(0), k=0,1,2, \cdots ak=f(k)(0),k=0,1,2,⋯ 。
- f ( O ) = f ( 0 ) E , f ( E ) = f ( 1 ) E , f ( λ E ) = f ( λ ) E f(O)=f(0) E, f(E)=f(1) E, f(\lambda E)=f(\lambda) E f(O)=f(0)E,f(E)=f(1)E,f(λE)=f(λ)E 。
- 泰勒展开式对应矩阵函数
  - e A = E + A + A 2 2 ! + . . . + A n n ! + . . . e^A = E +A + \frac{A^2}{2!} + ... + \frac{A^n}{n!} + ... eA=E+A+2!A2+...+n!An+...
  - 1 E − A = E + A + A 2 + . . . + A n + . . . \frac{1}{E-A} = E + A + A^2 + ... + A^n +... E−A1=E+A+A2+...+An+...
  - s i n A = A − A 3 3 ! + A 5 5 ! + . . . + ( − 1 ) n A 2 n + 1 ( 2 n + 1 ) ! + . . . sinA= A - \frac{A^3}{3!} + \frac{A^5}{5!} + ...+ \frac{(-1)^n A^{2n+1}}{(2n+1)!} +... sinA=A−3!A3+5!A5+...+(2n+1)!(−1)nA2n+1+...

2、利用 C a y l e y − H a m i l t o n Cayley - Hamilton Cayley−Hamilton 定理的降幂方法

由$ Cayley-Hamilton$ 定理可知, n n n 阶矩阵 A A A 的幂级数的和 ∑ k = 0 ∞ a k A k \sum\limits_{k=0}^{\infty} a_k A^k k=0∑∞akAk 可表示为矩阵 A A A 的至多 n − 1 n-1 n−1 次矩阵多项式, 因此可通过数项级数求和的方法计算矩阵幂级数。这为矩阵函数的计算提供了基本方法。

Hamilton-Cayley定理： 设 A A A 是数域 F F F 上的 n n n 阶矩阵， f ( λ ) = ∣ λ E − A ∣ = λ n + d 1 s n − 1 + . . . + d n f(λ)=|λE-A|=\lambda^n + d_1s^{n-1} + ... + d_n f(λ)=∣λE−A∣=λn+d1sn−1+...+dn 是 A A A 的特征多项式，则 f ( A ) = A n + d 1 A n − 1 + . . . + d n − 1 A + d n E f(A) = A^n + d_1A^{n-1}+ ... + d_{n-1}A + d_nE f(A)=An+d1An−1+...+dn−1A+dnE

3、利用$Jordan $标准型的相似变换方法

设 A A A 的 J o r d a n Jordan Jordan 标准型为 J = ( J 1 J 2 ⋱ J s ) J=\left(\begin{array}{llll}J_1 & & & \\ & J_2 & & \\ & & \ddots & \\ & & & J_s\end{array}\right) J= J1J2⋱Js , 其中 J k = ( λ k 1 λ k ⋱ ⋱ 1 λ k ) m k J_k=\left(\begin{array}{llll}\lambda_k & 1 & & \\ & \lambda_k & \ddots & \\ & & \ddots & 1 \\ & & & \lambda_k\end{array}\right)_{m_k} Jk= λk1λk⋱⋱1λk mk, k = 1 , 2 , ⋯ , s k=1,2, \cdots, s k=1,2,⋯,s, 则存在可逆矩阵 P P P, 使得 A = P J P − 1 A=P J P^{-1} A=PJP−1 。
由此可得, 对于函数 f ( λ ) = ∑ i = 0 ∞ a i λ i , f ( A ) = P f ( J ) P − 1 f(\lambda)=\sum\limits_{i=0}^{\infty} a_i \lambda^i, f(A)=P f(J) P^{-1} f(λ)=i=0∑∞aiλi,f(A)=Pf(J)P−1，其中
f ( J ) = ( f ( J 1 ) f ( J 2 ) ⋱ f ( J s ) ) , f(J)=\left(\begin{array}{llll} f\left(J_1\right) & & & \\ & f\left(J_2\right) & & \\ & & \ddots & \\ & & & f\left(J_s\right) \end{array}\right), f(J)= f(J1)f(J2)⋱f(Js) ,
f ( J k ) = ( f ( λ k ) f ′ ( λ k ) 1 ( m k − 1 ) ! f ( m k − 1 ) ( λ k ) f ( λ k ) ⋱ ⋱ f ′ ( λ k ) f ( λ k ) ) m k f\left(J_k\right)=\left(\begin{array}{cccc} f\left(\lambda_k\right) & f^{\prime}\left(\lambda_k\right) & & \frac{1}{\left(m_k-1\right) !} f^{\left(m_k-1\right)}\left(\lambda_k\right) \\ & f\left(\lambda_k\right) & \ddots & \\ & & \ddots & f^{\prime}\left(\lambda_k\right) \\ & & & f\left(\lambda_k\right) \end{array}\right)_{m_k} f(Jk)= f(λk)f′(λk)f(λk)⋱⋱(mk−1)!1f(mk−1)(λk)f′(λk)f(λk) mk

计算步聚:
1、计算 A A A 的初等因子, 得 Jordan 标准型 J J J, 并计算相似变换矩阵 P P P 。
2、计算 f ( J k ) f\left(J_{k}\right) f(Jk), 得到 f ( J ) f(J) f(J) 。
3、计算 f ( A ) = P f ( J ) P − 1 f(A)=P f(J) P^{-1} f(A)=Pf(J)P−1 。

4、利用矩阵谱的待定系数方法

4.1 概念

设矩阵 A A A 的最小多项式为 g ( λ ) = ( λ − λ 1 ) m 1 ( λ − λ 2 ) m 2 ⋯ ( λ − λ s ) m s g(\lambda)=\left(\lambda-\lambda_{1}\right)^{m_{1}}\left(\lambda-\lambda_{2}\right)^{m_{2}} \cdots\left(\lambda-\lambda_{s}\right)^{m_{s}} g(λ)=(λ−λ1)m1(λ−λ2)m2⋯(λ−λs)ms, 则称 { ( λ k , m k ) } \left\{\left(\lambda_{k}, m_{k}\right)\right\} {(λk,mk)} 为 A A A 的谱, 记为 Λ A \Lambda_{A} ΛA 。

对于多项式 f ( λ ) , { f ( i ) ( λ k ) , k = 1 , 2 , ⋯ , s ; i = 0 , 1 , ⋯ , m k − 1 } f(\lambda),\left\{f^{(i)}\left(\lambda_{k}\right), k=1,2, \cdots, s ; i=0,1, \cdots, m_{k}-1\right\} f(λ),{f(i)(λk),k=1,2,⋯,s;i=0,1,⋯,mk−1} 记为 f ( Λ A ) f\left(\Lambda_{A}\right) f(ΛA), 称为 f ( λ ) f(\lambda) f(λ) 在 A A A 的谱 Λ A \Lambda_{A} ΛA 上的值。

4.2 性质

对于矩阵 A A A 和多项式 f ( λ ) f(\lambda) f(λ)、 h ( λ ) h(\lambda) h(λ) ：
（充要条件:） f ( A ) = h ( A ) ⇔ f ( Λ A ) = h ( Λ A ) f(A)=h(A) \Leftrightarrow f\left(\Lambda_{A}\right)=h\left(\Lambda_{A}\right) f(A)=h(A)⇔f(ΛA)=h(ΛA)（其中 Λ A \Lambda_{A} ΛA 为 A A A 的谱。）

对于同底的两个初等因子 ( λ − λ i ) m i \left(\lambda-\lambda_{i}\right)^{m_{i}} (λ−λi)mi、 ( λ − λ i ) m j ( m i < m j ) \left(\lambda-\lambda_{i}\right)^{m_{j}}\left(m_{i}<m_{j}\right) (λ−λi)mj(mi<mj)，前者所对应的 J o r d a n Jordan Jordan 块 J i J_{i} Ji 的函数矩阵 f ( J i ) f\left(J_{i}\right) f(Ji) 中的元素含在后者所对应的 J o r d a n Jordan Jordan 块 J ~ i \tilde{J}_{i} J~i 的函数矩阵 f ( J ~ i ) f\left(\tilde{J}_{i}\right) f(J~i) 之中。

4.3 计算步骤

1、求出矩阵 A A A 的谱为 Λ A = { ( λ k , m k ) , k = 1 , 2 , ⋯ , s } \Lambda_{A}=\left\{\left(\lambda_{k}, m_{k}\right), k=1,2, \cdots, s\right\} ΛA={(λk,mk),k=1,2,⋯,s}, 并且 m 1 + m 2 + ⋯ + m s = l m_{1}+m_{2}+\cdots+m_{s}=l m1+m2+⋯+ms=l 。
2、设 h ( λ ) = a 1 λ l − 1 + a 2 λ l − 2 + ⋯ + a l − 1 λ + a l h(\lambda)=a_{1} \lambda^{l-1}+a_{2} \lambda^{l-2}+\cdots+a_{l-1} \lambda+a_{l} h(λ)=a1λl−1+a2λl−2+⋯+al−1λ+al，由 h ( λ k ) = f ( λ k ) , h ′ ( λ k ) = f ′ ( λ k ) , ⋯ h\left(\lambda_{k}\right)=f\left(\lambda_{k}\right), h{\prime}\left(\lambda_{k}\right)=f{\prime}\left(\lambda_{k}\right), \cdots h(λk)=f(λk),h′(λk)=f′(λk),⋯ ， h ( m k − 1 ) ( λ k ) = f ( m k − 1 ) ( λ k ) , k = 1 , 2 , ⋯ , s h^{\left(m_{k}-1\right)}\left(\lambda_{k}\right)=f^{\left(m_{k}-1\right)}\left(\lambda_{k}\right), k=1,2, \cdots, s h(mk−1)(λk)=f(mk−1)(λk),k=1,2,⋯,s ，解得 a 1 , a 2 , ⋯ , a l − 1 , a l a_{1}, a_{2}, \cdots, a_{l-1}, a_{l} a1,a2,⋯,al−1,al 。
3、 f ( A ) = a 1 A l − 1 + a 2 A l − 2 + ⋯ + a l − 1 A + a l E f(A)=a_{1} A^{l-1}+a_{2} A^{l-2}+\cdots+a_{l-1} A+a_{l} E f(A)=a1Al−1+a2Al−2+⋯+al−1A+alE

四、矩阵的微分和积分

1、单变量函数矩阵的微分与积分

1.1 微分

对于函数矩阵 A ( t ) = ( a i j ( t ) ) A(t)=\left(a_{i j}(t)\right) A(t)=(aij(t)), 若每个 a i j ( t ) a_{i j}(t) aij(t) 都在区间 ( a , b ) (a, b) (a,b) 内可导, 则称 A ( t ) A(t) A(t) 在区间 ( a , b ) (a, b) (a,b) 内可导, 矩阵 ( a i j ′ ( t ) ) \left(a_{i j}'(t)\right) (aij′(t)) 称为其导数, 记为 A ′ ( t ) A' (t) A′(t) 。
- A ( t ) A(t) A(t) 的高阶导数可定义为 A ( k ) ( t ) = ( a i j ( k ) ( t ) ) A^{(k)}(t)=\left(a_{i j}^{(k)}(t)\right) A(k)(t)=(aij(k)(t)) 。
- 常数矩阵的导数为 0 ;
- [ α A ( t ) + β B ( t ) ] ′ = α A ′ ( t ) + β B ′ ( t ) [\alpha A(t)+\beta B(t)]{\prime}=\alpha A{\prime}(t)+\beta B{\prime}(t) [αA(t)+βB(t)]′=αA′(t)+βB′(t);
- [ A ( t ) B ( t ) ] ′ = A ′ ( t ) B ( t ) + A ( t ) B ′ ( t ) [A(t) B(t)]{\prime}=A{\prime}(t) B(t)+A(t) B{\prime}(t) [A(t)B(t)]′=A′(t)B(t)+A(t)B′(t);
- 设 A ( t ) A(t) A(t) 可导, s = f ( t ) s=f(t) s=f(t) 为可微函数, 则 A ( f ( t ) ) A(f(t)) A(f(t)) 可导, 并且 [ A ( f ( t ) ) ] ′ = A ′ ( u ) ∣ u = f ( t ) f ′ ( t ) ; [A(f(t))]'=\left.A '(u)\right|_{u=f(t)} f '(t) ; [A(f(t))]′=A′(u)∣u=f(t)f′(t);
- [ A T ( t ) ] ′ = [ A ′ ( t ) ] T \left[A^{T}(t)\right] '=\left[A '(t)\right]^{T} [AT(t)]′=[A′(t)]T;
- 若 A ( t ) A(t) A(t) 及其逆矩阵都可导, 则 [ A − 1 ( t ) ] ′ = A − 1 ( t ) A ′ ( t ) A − 1 ( t ) \left[A^{-1}(t)\right] '=A^{-1}(t) A '(t) A^{-1}(t) [A−1(t)]′=A−1(t)A′(t)A−1(t) 。

1.2 积分

对于函数矩阵 A ( t ) = ( a i j ( t ) ) A(t)=\left(a_{i j}(t)\right) A(t)=(aij(t)), 若每个 a i j ( t ) a_{i j}(t) aij(t) 都在区间 ( a , b ) (a, b) (a,b) 内都有原函数 ∫ a i j ( t ) d t \int a_{i j}(t) d t ∫aij(t)dt, 则称 ( ∫ a i j ( t ) d t ) \left(\int a_{i j}(t) d t\right) (∫aij(t)dt) 为 A ( t ) A(t) A(t) 在 ( a , b ) (a, b) (a,b) 内的不定积分, 记为 ∫ A ( t ) d t \int A(t) d t ∫A(t)dt 。若每个 a i j ( t ) a_{i j}(t) aij(t) 都在区间 [ a , b ] [a, b] [a,b] 上可积, 则称 ( ∫ a b a i j ( t ) d t ) \left(\int_{a}^{b} a_{i j}(t) d t\right) (∫abaij(t)dt) 为 A ( t ) A(t) A(t) 在 [ a , b ] [a, b] [a,b] 上的定积分, 记为 ∫ a b A ( t ) d t \int_{a}^{b} A(t) d t ∫abA(t)dt 。
- d d x ∫ a x A ( t ) d t = A ( x ) \frac{d}{d x} \int_{a}^{x} A(t) d t=A(x) dxd∫axA(t)dt=A(x) 。

2、矩阵函数的微分与积分

2.1 微分

设 A = ( a i j ) m × n A=\left(a_{i j}\right)_{m \times n} A=(aij)m×n 中元素 a i j a_{i j} aij 都是 B = ( b k l ) p × q B=\left(b_{k l}\right)_{p \times q} B=(bkl)p×q 中元素 b k l b_{k l} bkl 的函数: a i j = f i j ( B ) , k = 1 , ⋯ , p ; l = 1 , . . . , q a_{i j}=f_{i j}(B), k=1, \cdots, p ; l=1,...,q aij=fij(B),k=1,⋯,p;l=1,...,q，即 a i j = f i j ( b k l ; k = 1 , . . , p ; l = 1 , . . . , q ) a_{ij} = f_{ij}(b_{kl};k=1,..,p ; l=1,...,q) aij=fij(bkl;k=1,..,p;l=1,...,q)，则 p × q p \times q p×q阶分块矩阵 ( ∂ A ∂ b 11 ⋯ ∂ A ∂ b 1 q ⋯ ⋯ ⋯ ∂ A ∂ b p 1 ⋯ ∂ A ∂ b p l ) \left(\begin{array}{ccc}\frac{\partial A}{\partial b_{11}} & \cdots & \frac{\partial A}{\partial b_{1 q}} \\ \cdots & \cdots & \cdots \\ \frac{\partial A}{\partial b_{p 1}} & \cdots & \frac{\partial A}{\partial b_{p l}}\end{array}\right) ∂b11∂A⋯∂bp1∂A⋯⋯⋯∂b1q∂A⋯∂bpl∂A 称为 A A A 对 B B B 的导数 ，记为 d A d B \frac{dA}{dB} dBdA或 ( ∂ A ∂ b k l ) (\frac{\partial A}{\partial b_{kl}}) (∂bkl∂A) ，其中 ( ∂ A ∂ b k l ) = ( ∂ a 11 ∂ b k l ⋯ ∂ a 1 n ∂ b k l ⋯ ⋯ ⋯ ∂ a m 1 ∂ b k l ⋯ ∂ a m n ∂ b k l ) , k = 1 , ⋯ , p ; l = 1 , . . . , q (\frac{\partial A}{\partial b_{kl}}) = \left(\begin{array}{ccc}\frac{\partial a_{11}}{\partial b_{kl}} & \cdots & \frac{\partial a_{1n}}{\partial b_{kl}} \\ \cdots & \cdots & \cdots \\ \frac{\partial a_{m1}}{\partial b_{kl}} & \cdots & \frac{\partial a_{mn}}{\partial b_{kl}}\end{array}\right) ,k=1, \cdots, p ; l=1,...,q (∂bkl∂A)= ∂bkl∂a11⋯∂bkl∂am1⋯⋯⋯∂bkl∂a1n⋯∂bkl∂amn ,k=1,⋯,p;l=1,...,q

向量的函数 f ( x ) f(x) f(x) 对向量 x = ( ξ 1 , ξ 2 , ⋯ , ξ n ) T x=\left(\xi_{1}, \xi_{2}, \cdots, \xi_{n}\right)^{T} x=(ξ1,ξ2,⋯,ξn)T 的导数为 d f d x = ( ∂ f ∂ x i ) T \frac{d f}{d x}=\left(\frac{\partial f}{\partial x_{i}}\right)^{T} dxdf=(∂xi∂f)T, 即为 f ( x ) f(x) f(x) 的梯度向量, d 2 f d x d x T = d d x T ( d f d x ) T = ( ∂ 2 f ∂ x i ∂ x j ) \frac{d^{2} f}{d x d x^{T}}=\frac{d}{d x^{T}}\left(\frac{d f}{d x}\right)^{T}=\left(\frac{\partial^{2} f}{\partial x_{i} \partial x_{j}}\right) dxdxTd2f=dxTd(dxdf)T=(∂xi∂xj∂2f) 即为 f ( x ) f(x) f(x) 的 H e s s i a n Hessian Hessian矩阵; 矩阵的函数 f ( X ) f(X) f(X) 对矩阵 X = ( x i j ) X=\left(x_{i j}\right) X=(xij) 的导数为 d f d X = ( ∂ f ∂ x i j ) \frac{d f}{d X}=\left(\frac{\partial f}{\partial x_{i j}}\right) dXdf=(∂xij∂f) 。
对于 f ( x ) = x T A x , d f d x = ( A T + A ) x = 2 A x f(x)=x^{T} A x, \frac{d f}{d x}=\left(A^{T}+A\right) x=2 A x f(x)=xTAx,dxdf=(AT+A)x=2Ax 。

2.2 K r o n e c k e r Kronecker Kronecker 积

设 A ∈ C m × n , B ∈ C p × q A \in C^{m \times n}, B \in C^{p \times q} A∈Cm×n,B∈Cp×q, 则矩阵 ( a 11 B ⋯ a 1 n B ⋯ ⋯ ⋯ a m 1 B ⋯ a m n B ) \left(\begin{array}{ccc}a_{11} B & \cdots & a_{1 n} B \\ \cdots & \cdots & \cdots \\ a_{m 1} B & \cdots & a_{m n} B\end{array}\right) a11B⋯am1B⋯⋯⋯a1nB⋯amnB 称为 A A A 与 B 的 K r o n e c k e r Kronecker Kronecker 积, 记为 A ⊗ B A \otimes B A⊗B 或简记为 ( a i j B ) \left(a_{i j} B\right) (aijB) 。

A ⊗ B A \otimes B A⊗B 的行数为 A , B A, B A,B 行数之积 ; A ⊗ B A \otimes B A⊗B 的列数为 A , B A, B A,B 列数之积。
( a A ) ⊗ B = A ⊗ ( a B ) = a ( A ⊗ B ) (a A) \otimes B=A \otimes(a B)=a(A \otimes B) (aA)⊗B=A⊗(aB)=a(A⊗B) 。
( A ⊗ B ) ⊗ C = A ⊗ ( B ⊗ C ) (A \otimes B) \otimes C=A \otimes(B \otimes C) (A⊗B)⊗C=A⊗(B⊗C) 。
( A + B ) ⊗ C = A ⊗ C + B ⊗ C , A ⊗ ( B + C ) = A ⊗ B + A ⊗ C (A+B) \otimes C=A \otimes C+B \otimes C, A \otimes(B+C)=A \otimes B+A \otimes C (A+B)⊗C=A⊗C+B⊗C,A⊗(B+C)=A⊗B+A⊗C 。
( A ⊗ B ) H = A H ⊗ B H (A \otimes B)^H=A^H \otimes B^H (A⊗B)H=AH⊗BH 。
( A ⊗ B ) ( C ⊗ D ) = ( A C ) ⊗ ( B D ) (A \otimes B)(C \otimes D)=(A C) \otimes(B D) (A⊗B)(C⊗D)=(AC)⊗(BD) 。
若 A , B A, B A,B 可逆, 则 ( A ⊗ B ) − 1 = A − 1 ⊗ B − 1 (A \otimes B)^{-1}=A^{-1} \otimes B^{-1} (A⊗B)−1=A−1⊗B−1 。

2.3 n a b l a nabla nabla 算子

对于矩阵 A A A, 定义算子矩阵为 ∇ A = ( ∂ ∂ a i j ) = ( ∂ ∂ a 11 ⋯ ∂ ∂ a 1 n ⋯ ⋯ ⋯ ∂ ∂ a m 1 ⋯ ∂ ∂ a m n ) \nabla_A=\left(\frac{\partial}{\partial a_{i j}}\right)=\left(\begin{array}{ccc}\frac{\partial}{\partial a_{11}} & \cdots & \frac{\partial}{\partial a_{1 n}} \\ \cdots & \cdots & \cdots \\ \frac{\partial}{\partial a_{m 1}} & \cdots & \frac{\partial}{\partial a_{m n}}\end{array}\right) ∇A=(∂aij∂)= ∂a11∂⋯∂am1∂⋯⋯⋯∂a1n∂⋯∂amn∂ , 称为 n a b l a nabla nabla 算子。

d A d B = ( ∂ A ∂ b k l ) = ∇ B ⊗ A \frac{d A}{d B}=\left(\frac{\partial A}{\partial b_{k l}}\right)=\nabla B \otimes A dBdA=(∂bkl∂A)=∇B⊗A 。
d ( α A 1 + β A 2 ) d B = α d A 1 d B + β d A 2 d B \frac{d\left(\alpha A_1+\beta A_2\right)}{d B}=\alpha \frac{d A_1}{d B}+\beta \frac{d A_2}{d B} dBd(αA1+βA2)=αdBdA1+βdBdA2 。
d ( A 1 A 2 ) d B = d A 1 d B ( E q ⊗ A 2 ) + ( E p ⊗ A 1 ) d A 2 d B \frac{d\left(A_1 A_2\right)}{d B}=\frac{d A_1}{d B}\left(E_q \otimes A_2\right)+\left(E_p \otimes A_1\right) \frac{d A_2}{d B} dBd(A1A2)=dBdA1(Eq⊗A2)+(Ep⊗A1)dBdA2 。

3、矩阵指数函数

e 0 = E e^0=E e0=E
对于任何 A ∈ C n × n A\in C^{ \ n\times n} A∈C n×n ， d d t e A t = A e A t = e A t A \frac{d}{dt} e^{At}= Ae^{At}= e^{At} A dtdeAt=AeAt=eAtA
设 $A, B \in C^{ \ n\times n} $，并且 A B = B A AB = BA AB=BA ，则 e A t B = B e A t e^{At} B= Be^{At} eAtB=BeAt。
设 $A, B \in C^{ \ n\times n} $，并且 A B = B A AB = BA AB=BA ，则 e A + B = e A e B = e B e A e^{A+B} =e^Ae^B= e^Be^{A} eA+B=eAeB=eBeA。
对于任何 A ∈ C n × n A\in C^{ \ n\times n} A∈C n×n:
- e i A = c o s A + i s i n A e^{iA} = cosA +i sinA eiA=cosA+isinA
- c o s A = 1 2 ( e i A + e − i A ) cosA = \frac{1}{2}(e^{iA}+e^{-iA}) cosA=21(eiA+e−iA)
- s i n A = 1 2 i ( e i A − e − i A ) sinA = \frac{1}{2i}(e^{iA} -e^{-iA}) sinA=2i1(eiA−e−iA)
- s i n 2 A + c o s 2 A = E sin^2A + cos^2A = E sin2A+cos2A=E
- c o s ( − A ) = c o s A cos(-A) = cosA cos(−A)=cosA
- s i n ( − A ) = − s i n A sin(-A) = -sinA sin(−A)=−sinA

五、矩阵分析的应用

1、常系数线性微分方程组

对于一阶常系数齐次微分方程组的定解问题: { d x 1 d t = a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n d x 2 d t = a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n d x n d t = a n 1 x 1 + a n 2 x 2 + ⋯ + a n n x n \left\{\begin{array}{l}\frac{d x_1}{d t}=a_{11} x_1+a_{12} x_2+\cdots+a_{1 n} x_n \\ \\ \frac{d x_2}{d t}=a_{21} x_1+a_{22} x_2+\cdots+a_{2 n} x_n \\ \\ \frac{d x_n}{d t}=a_{n 1} x_1+a_{n 2} x_2+\cdots+ a_{n n} x_n \end{array}\right. ⎩ ⎨ ⎧dtdx1=a11x1+a12x2+⋯+a1nxndtdx2=a21x1+a22x2+⋯+a2nxndtdxn=an1x1+an2x2+⋯+annxn

其中，可微函数 x i = x i ( t ) ( i = 1 , 2 , ⋯ , n ) x_i=x_i(t)(i=1,2, \cdots, n) xi=xi(t)(i=1,2,⋯,n) 满足初始条件: x 1 ( 0 ) = x 1 0 , x 2 ( 0 ) = x 2 0 , ⋯ , x n ( 0 ) = x n 0 x_1(0)=x_1^0, x_2(0)=x_2^0, \cdots, x_n(0)=x_n^0 x1(0)=x10,x2(0)=x20,⋯,xn(0)=xn0 ，若令 x ( t ) = ( x 1 ( t ) , x 2 ( t ) , ⋯ , x n ( t ) ) T , x 0 = ( x 1 0 , x 2 0 , ⋯ , x n 0 ) , A = ( a i j ) n x(t)=\left(x_1(t), x_2(t), \cdots, x_n(t)\right)^T, x^0=\left(x_1^0, x_2^0, \cdots, x_n^0\right), A=\left(a_{i j}\right)_n x(t)=(x1(t),x2(t),⋯,xn(t))T,x0=(x10,x20,⋯,xn0),A=(aij)n ，则上述定解问题可表示为 { x ′ ( t ) = A x ( t ) x ( 0 ) = x 0 \left\{\begin{array}{c}x^{\prime}(t)=A x(t) \\ x(0)=x^0\end{array}\right. {x′(t)=Ax(t)x(0)=x0 。

定解问题 { x ′ ( t ) = A x ( t ) x ( 0 ) = x 0 \left\{\begin{array}{l} x'(t)= Ax(t)\\ \\ x(0)= x^0 \\ \end{array}\right. ⎩ ⎨ ⎧x′(t)=Ax(t)x(0)=x0 具有唯一解 x ( t ) = e A t x 0 x(t)=e^{At}x^0 x(t)=eAtx0
定解问题 { x ′ ( t ) = A x ( t ) x ( t 0 ) = x 0 \left\{\begin{array}{l} x'(t)= Ax(t)\\ \\ x(t_0)= x^0 \\ \end{array}\right. ⎩ ⎨ ⎧x′(t)=Ax(t)x(t0)=x0 具有唯一解 x ( t ) = e A ( t − t 0 ) x 0 x(t)=e^{A(t-t_0)}x^0 x(t)=eA(t−t0)x0
设 A ∈ C n × n ， B ∈ C n × m ， u ( t ) A\in C^{n\times n }，B \in C^{n\times m } ，u(t) A∈Cn×n，B∈Cn×m，u(t)为 m m m 维的函数列向量，则线性常系数非齐次微分方程组的定解问题 { x ′ ( t ) = A x ( t ) + B u ( t ) x ( 0 ) = x 0 \left\{\begin{array}{l} x'(t)= Ax(t) + Bu(t)\\ \\ x(0)= x^0 \\ \end{array}\right. ⎩ ⎨ ⎧x′(t)=Ax(t)+Bu(t)x(0)=x0 有唯一解 x ( t ) = e A t x 0 + ∫ 0 t e A ( t − τ ) B u ( τ ) d τ x(t)=e^{At}x^0 + \int_{0}^{t} e^{A(t-\tau)} Bu(\tau) d \tau x(t)=eAtx0+∫0teA(t−τ)Bu(τ)dτ

《矩阵理论》笔记 4 — 矩阵分析及其应用相关推荐

矩阵笔记1:矩阵分析(第三版)-史荣昌-第一章:线性空间和线性变换
文章目录 0 笔记说明 1 书本内容 1.1 线性空间 1.2 基与坐标.坐标变换 1.3 线性子空间 1.4 线性映射 1.5 线性映射的值域.核 1.6 线性变换的矩阵与线性变换的运算 1.7 n ...
矩阵笔记4:矩阵分析(第三版)-史荣昌-第四章:矩阵分解
文章目录 0 笔记说明 1 书本内容 1.1 矩阵的满秩分解 1.2 矩阵的正交三角分解(UR.QR分解) 1.3 矩阵的奇异值分解 1.4 矩阵的极分解 1.5 矩阵的谱分解 2 听课笔记 2.1 ...
矩阵笔记3:矩阵分析(第三版)-史荣昌-第三章:内积空间、正规矩阵、Hermite矩阵
文章目录 0 笔记说明 1 书本内容 1.1 欧氏空间.酉空间 1.2 标准正交基.Schmidt方法 1.3 酉变换.正交变换 1.4 幂等矩阵.正交投影 1.5 对称与反对称变换 1.6 Schu ...
矩阵笔记2:矩阵分析(第三版)-史荣昌-第二章:λ-矩阵与矩阵的Jordan标准型
文章目录 0 笔记说明 1 书本内容 1.1 λ-矩阵及标准型 1.2 初等因子与相似条件 1.3 矩阵的Jordan标准型 1.4 矩阵的有理标准型 2 听课笔记 2.1 λ-矩阵及标准型 2.2 ...
java代码：双色球号随机生成(极其简洁！)
https://blog.csdn.net/qq_40677004/article/details/79699270 原 java代码:双色球号随机生成(极其简洁!) 2018年03月26日 15:5 ...
《矩阵理论》大萌课程笔记 - 线性空间与子空间
<矩阵理论>大萌课程笔记 - 线性空间与子空间总目录章节名称与链接线性空间与线性变换线性空间与子空间有限维线性空间.基.维数线性变换内积空间特征值与特征向量特殊矩阵矩阵 ...
奇异矩阵能lu分解条件_矩阵分析-期末复习笔记（上）
(复习笔记,可能有点乱.夹杂着乱七八糟的英文,因为要用英文考试.) (如果有误请一定要和我说!祝我final考个好成绩-) 目录: 特征值,特征向量,相似 (Eigenvalues, eigenvec ...
《矩阵理论》大萌课程笔记 - 特殊矩阵
<矩阵理论>大萌课程笔记 - 特殊矩阵总目录章节名称与链接线性空间与线性变换线性空间与子空间有限维线性空间.基.维数线性变换内积空间特征值与特征向量特殊矩阵矩阵分解矩 ...
Hadamard积学习笔记（张贤达《矩阵分析与应用》）
Hadamard积学习笔记(张贤达<矩阵分析与应用>) 定义与正定性有关的性质正定性的传递性正定性的反推(Fejer定理) 与矩阵迹有关的性质定理1 定理2 一般性质 Hadam ...

《矩阵理论》笔记 4 — 矩阵分析及其应用