对称正定矩阵的分解
Decomposition of Symmetric Positive Definite Matrices

作者: 朱佳政 :杭州师范大学经亨颐学院,浙江 杭州; 柏志林 :南京师范大学教师教育学院,江苏 南京;

关键词: 对称正定矩阵的分解谱分解拉格朗日插值矩阵的交换性Symmetric Positive Definite Matrices of Split Spectral Decomposition Lagrange Interpolation Commutativity of Matrices

摘要:
基于对称正定矩阵的特殊性质,利用谱分解、拉格朗日插值、矩阵的交换性三种不同的思想将对称正定矩阵的分解进行延拓,并将其运用于解决更多的数学问题。

Abstract: Based on the special properties of symmetric positive definite matrix, the decomposition of symmetric positive definite matrix is extended by using three different ideas: spectral decomposi-tion, Lagrange interpolation and commutativity of matrix, and it is applied to solve more mathe-matical problems.

1. 引言

在高等代数中,对称正定矩阵是一类特殊矩阵。

A R n × n ,若

A = A T

对任意的

0 X R n

都有

X T A X > 0

则称A为对称正定矩阵。

在具体应用中我们经常对其进行拆分使用。

实对称矩阵A正定当且仅当A与单位阵合同,即存在实可逆矩阵C,使

(1)

下面通过一个例子,简单说明,利用对称正定矩阵分解可证明相关矩阵的特征值的性质。

例 [1] :设A,B都是n阶实对称矩阵,证明:

1) 若A正定或B正定,则AB的特征值全是实数;

2) 若A正定,则B正定的充要条件是AB的特征值全是正实数;

3) 若A,B都半正定,则AB的特征值都是非负实数。

这道题中,出现了正定矩阵以及与之相关的矩阵之间特征值的关系。事实上两个矩阵间的特征值的关联一般通过相似矩阵的特征值不变性建立的,所以这里需要考虑对对称正定矩阵A进行(*1)分解。

先考虑第一问,由于A为正定矩阵,必合同于单位矩阵 E n

由(1),不妨设存在可逆矩阵C,使得

A = C C .

所以

. (2)

注意到 C , C 在B的同一侧,想要利用类似相似的结构则在 C C B 两侧同时左乘 ( C ) 1 与右乘 C 。得到

. (3)

这说明,AB相似于 C B C 。注意到仍为实对称阵,所以其特征值全为实数,所以AB的特征值也全是实数。

(2)与(3)用于与(1)类似的思想解决,唯一不同的是(3)中的半正定矩阵矩阵只能分解为两个实矩阵的乘积,但不能确保是可逆矩阵,但是对任意正实数t, A + t E n 是正定矩阵,所以利用多项式对t的连续性,则可以较容易得到结论。∎

受上例中矩阵分解的启发,我们先考虑对称正定矩阵是否能分解两个相同对称正定矩阵的乘积。更进一步,思考对称正定矩阵能否表示为某个对称正定矩阵的乘幂形式。

2. 命题的证明与推广

命题1:一个实对称正定阵可以分解为两个相同实对称正定矩阵的乘积。

证明:设A为正定矩阵,则由内积空间的理论存在正交矩阵T,使得

T A T = ( λ 1 λ 2 λ n )

其中 λ i , i = 1 , , n 是矩阵A的n个特征值。

由于A为正定矩阵,所以

λ i > 0 , i = 1 , , n .

即:

A = T ( λ 1 λ 2 λ n ) T = T ( λ 1 λ 2 λ n ) T T ( λ 1 λ 2 λ n ) T ,

C = T ( λ 1 λ 2 λ n ) T

,且C是一个对称正定矩阵。

下面我们将命题1进行推广。

命题2:设A是n阶正定实对称矩阵,则对任意的正整数 k > 1 ,必存在唯一的n阶正定实对称矩阵B,使 A = B k ,这样的正定矩阵B称为正定阵A的k次方根,记为 B = A 1 k

证明1 [2] :利用谱分解思想

设V是有限维空间, φ 是V上的线性算子,当V是酉空间时, φ 为正规算子;当V是欧式空间时, φ 为自伴随算子。

λ 1 , λ 2 , , λ k φ 的全体不同的特征值, W i φ 属于 λ i 的特征子空间,则V是 W i ( i = 1 , , k ) 的正交直和。

E i 是V到 W i 上的正交投影,则 φ 有下列分解式:

φ = λ 1 E 1 + λ 2 E 2 + + λ m E m

由正交投影的性质

不难得到:

φ k = λ 1 k E 1 + λ 2 k E 2 + + λ m k E m

鉴于 φ φ k 结构上极为相似并且巧妙地把特征值的幂次方和算子的幂次方结合起来,所以我们的第一种证法从谱分解入手证明。

我们可以将A看作欧氏空间R上正定自伴随算子 φ 在某一组标准正交基下的表示矩阵;设 λ i ( i = 1 , 2 , 3 , , m ) φ 全体不同的特征值, W i ( i = 1 , 2 , 3 , , m ) φ 属于 λ i 的特征子空间,则V为 W i ( i = 1 , 2 , 3 , , m ) 的正交直和。

这时若设 E i 为V到 W i 上的正交投影,则 φ 有下列分解式:

φ = λ 1 E 1 + λ 2 E 2 + + λ m E m

d i = λ i 1 / k ( i = 1 , 2 , 3 , , m )

ψ = d 1 E 1 + d 2 E 2 + + d m E m

适合 ψ 也为正交自伴随算子。

若存在 θ 为R上的正定自伴随算子

θ k = φ

θ = b 1 F 1 + b 2 F 2 + + b r F r

θ 的谱分解式,其中 F i 为正交投影算子,且 b i 为正实数。

θ k = φ φ = i = 1 r b i K F i

故由 b i K φ 的特征值且 b i 互不相同,可以得到

r = m b i = d i

这里允许差一个次序。 而 E i ( R ) F i ( R ) 都是 φ 关于特征值 λ i 的特征子空间,则

F i = E i ψ = θ

证明2:利用拉格朗日插值法的思想

在证明一般情形时,我们发现A与 A k 的关系最后转化到了特征值的幂次方,如果我们换一个角度看待 λ i k ,我们可以将其看作是由

λ i k ( i = 1 , , m )

唯一确定的多项式,所以我们借助Lagrange插值多项式分两步进行证明。

Step 1

设A为正定矩阵,则存在正交矩阵r,使得

A = P ( λ 1 λ n ) P (*)

我们先给出一个命题 [3] :设A为n阶正定阵, λ 1 , λ 2 , , λ n 为A的所有特征值,则对任何满足(*)的正交矩阵P,恒有

P ( λ 1 1 k λ n 1 k ) P = f (A)

证明:简便起见,不妨设 λ 1 , λ 2 , , λ s 为A的所有不同特征值,则 λ 1 1 k , λ 2 1 k , , λ n 1 k 中有且仅有s个不同的特征值,且 λ i λ i 1 k 重数也相同( i = 1 , , s ),做拉格朗日插值多项式:

f ( λ ) s 1 次多项式,且 λ i 1 k = f ( λ i ) ;( i = 1 , , s ),故得:

( λ 1 1 k λ n 1 k ) = ( f ( λ 1 ) f ( λ n ) ) = f ( ( λ 1 λ n ) )

于是对任何满足(*)的正交阵P,恒有

P ( λ 1 1 k λ n 1 k ) P = P f ( ( λ 1 λ n ) ) P = f ( P ( λ 1 λ n ) P ) = f ( A )

Step 2

由和一般情况一致的方法,题目要求的正定阵的存在性是显然的。

下对唯一性进行证明。设B是满足 B k = A 的n阶正定阵,且 μ 1 , , μ n 是B的特征值,则 μ 1 k , , μ n k 就是 B k = A 的全部特征值,但假设 λ 1 , λ 2 , , λ n 为A的所有特征值,故不妨设 λ i = μ i k ,于是 λ i 1 k = μ i ( i = 1 , , n )。因为B正定,所以存在正交阵P,使成立

B = P ( λ 1 1 k λ n 1 k ) P

而由假设 B k = A ,故得到

应用Step 1,则有 B = f ( A ) ,这就证明了,满足 B k = A 的任何正定阵B都等于 f ( A ) ,所以B是唯一的。∎

证明3:利用矩阵的交换性

注意到了实对称矩阵的正交相似标准型优美的分块对角结构,尝试利用矩阵的交换性进行唯一性的证明。

不妨设 A = B k = C k ,设A不同的特征值为,其重数分别为 r 1 , r 2 , , r t ,则 λ 1 1 k , , λ t 1 k 为B,C的公共特征值,则存在正交矩阵 P 1 , P 2 ,使得

P 1 B P 1 = ( λ 1 1 k E r 1 λ t 1 k E r t ) , P 2 C P 2 = ( λ 1 1 k E r 1 λ t 1 k E r t )

B k = C k ,且

B k = P 1 ( λ 1 E r 1 λ t E r t ) P 1 , C k = P 2 ( λ 1 E r 1 λ t E r t ) P 2

所以

P 2 P 1 ( λ 1 E r 1 λ t E r t ) = ( λ 1 E r 1 λ t E r t ) P 2 P 1

( λ 1 E r 1 λ t E r t )

可交换,所以 P 2 P 1 必为分块对角矩阵,则不妨设

P 2 P 1 = ( B 1 B t )

B i 为分块对角矩阵, i = 1 , 2 , , t ,则 P 2 P 1 与分块对角矩阵 ( λ 1 1 k E r 1 λ t 1 k E r t ) 也可交换。

即:

P 2 P 1 ( λ 1 1 k E r 1 λ t 1 k E r t ) = ( λ 1 1 k E r 1 λ t 1 k E r t ) P 2 P 1

P 1 ( λ 1 1 k E r 1 λ t 1 k E r t ) P 1 = P 2 ( λ 1 1 k E r 1 λ t 1 k E r t ) P 2

B = C 。∎

3. 命题的应用

首先我们介绍求解线性方程组的Jacobi迭代法 [4] 。

设线性方程组

A x = b

其中 A M n × n b I R n ,A非奇异,且主对角元素 a i i 满足

a i i 0 , i = 1 , 2 , , n .

将A分解为

A = D L U

其中

D = ( a 11 a 22 a n 1 n 1 a n n )

L = ( 0 a 21 0 a 31 a 32 0 a n 1 a n 2 a n , n 1 0 )

U = ( 0 a 12 a 13 a 21 0 a 23 a 21 0 a n 1 , n 0 )

则线性方程等价于

D X = ( L + U ) X + b

由假设可知 D = d i a g ( A ) 非奇异。若记

J = D 1 ( L + U ) , f = D 1 b

则可得

x ( k + 1 ) = J x ( k ) + f , k = 0 , 1 ,

称之为Jacobi迭代格式,矩阵J称为Jacobi矩阵。

例1、设矩阵A对称正定

D = d i a g ( a 11 , a 22 , , a n n )

试证明,若 2 D A 正定,则Jacobi迭代法求解线性方程组

A X = b (其中 A M n × n b I R n )

必收敛。

证明:因为

又A为正定阵

a i i > 0

所以 x 0 ,有

D 1 / 2 x 0

所以

( D 1 / 2 x ) T A ( D 1 / 2 x ) > 0 , x T ( D 1 / 2 ) T A D 1 / 2 x > 0

D 1 / 2 A D 1 / 2 为正定阵,所以 E n D 1 / 2 A D 1 / 2 特征值均小于1。

如果 2 D A 也为正定矩阵,则 D 1 / 2 ( 2 D A ) D 1 / 2 正定,即

E n D 1 / 2 ( 2 D A ) D 1 / 2 = ( E n D 1 / 2 A D 1 / 2 )

特征值均小于1, E n D 1 / 2 A D 1 / 2 特征值均大于−1。因为J与 E n D 1 / 2 A D 1 / 2 相似,所以

| ρ ( J ) | < 1

则线性方程组 A X = b (其中 A M n × n b I R n )必收敛。

事实上,在解决以上与对称正定阵有关的迭代法收敛证明问题中,采用了与常规应用正定阵性质,即 α A α > 0 不同的做法。其核心为将对角元大于零的对角矩阵D分解为 D 1 / 2 D 1 / 2 从而将J的特征值转化为 E n D 1 / 2 A D 1 / 2 的特征值,接下来论证 E n D 1 / 2 A D 1 / 2 的特征值即可。∎

例2、若存在对称正定矩阵P,使

B = P H T P H

为对称正定矩阵,试证明下列迭代格式收敛

x ( k + 1 ) = H x ( k ) + b , k = 0 , 1 , .

证明:

因为任意对称正定矩阵P可以拆分成两个相同对称正定矩阵的乘积,所以

P = L 1 / 2 L 1 / 2 ,

得:

L 1 / 2 B L 1 / 2 = L 1 / 2 ( P H T P H ) L 1 / 2 = E n L 1 / 2 H T P H L 1 / 2 = E n L 1 / 2 H T L 1 / 2 L 1 / 2 H L 1 / 2

因为B为对称正定矩阵,所以 正定。令

C = L 1 / 2 H T L 1 / 2

C T = ( L 1 / 2 ) T H ( L 1 / 2 ) T

因为 L 1 / 2 为对称矩阵,则

C T = C

E n C C T 的特征值均大于0,即C特征值的平方小于1,迭代格式收敛。∎

例3 [5] 、设A为实正规矩阵(即A满足 A A = A A ),B也是实正规矩阵,P为非异阵,且 B = P 1 A P ,证明:

( P P ) 1 2 A = A ( P P ) 1 2 .

证明:

首先我们注意到A和B相似,则它们的特征值也相同,且A,B均为实正规矩阵。由于实正规矩阵的特征值为正交相似关系的全系不变量,所以A,B正交相似。即∃正交矩阵 P 1 ,使得

P 1 B P 1 = A .

由引理 [6] :设V为n维欧式空间, φ 为V上的线性变换,则 φ 为正规算子的充要条件是存在某个实系数多项式 g ( x ) ,使得

φ * = g (φ)

我们可以把矩阵B看作V上某正规算子 φ 在一组标准正交基下的矩阵,且在欧式空间中, φ * 对应的表示矩阵就是 B 。所以,存在实系数多项式 f ( x ) ,使得 B = f ( B ) 。自然猜想, A 是否等于 f ( A ) 。因为

f ( A ) = f ( P 1 B P 1 ) = P 1 f ( B ) P 1 = P 1 B P 1 = ( P 1 B P 1 ) = A

所以得到

A = f ( A ) .

又P为非异阵,所以 P P 为正定矩阵, ( P P 1 2 ) 也为正定矩阵。

由命题的推广证法2中的步骤我们知道存在 g ( x ) ,使得

( P P 1 2 ) = g ( P P )

所要证明的式子变为

g ( P P ) A = A g ( P P )

则若能证明

P P A = A P P

那么

( P P ) 1 2 A = A ( P P ) 1 2

于是我们继续分析:

要证

P P A = A P P

即证

P P A = A P P

即证

P P f ( A ) = f ( A ) P P

而:

P 1 f ( A ) P = f ( P 1 A P ) = f ( B ) = B = P A ( P 1 ) = P f ( A ) ( P 1 )

也就是

P 1 f ( A ) P = P f ( A ) ( P 1 )

即:

P P f ( A ) = f ( A ) P P

再由之前的讨论,题目得证。∎

4. 结语

对称正定矩阵的分解思想在许多领域有广泛的运用,本文受对称正定矩阵 A = C C (其中C为实可逆阵)的启发,研究了更一般的分解 A = C C 和它的推广 A = C k ,并给出了一些应用的例子,如在求解线性方程组的迭代法时,利用迭代矩阵的分解思想讨论迭代格式的敛散性等。希望我们能够在更多的数学领域中更好地应用对称正定矩阵分解的思想。

NOTES

*并列第一作者。

文章引用: 朱佳政 , 柏志林 (2019) 对称正定矩阵的分解。 理论数学, 9, 503-513. doi: 10.12677/PM.2019.94067

参考文献

[1] 姚慕生, 谢启鸿. 高等代数[M]. 第三版. 上海: 复旦大学出版社, 2015: 458-459.

[2] 姚慕生, 吴泉水, 谢启鸿. 高等代数学[M]. 第三版. 上海: 复旦大学出版社, 2014: 408-410.

[3] 屠伯埙. 线性代数——方法导引[M]. 上海: 复旦大学出版社, 1986: 184-186.

[4] 孙文瑜, 杜其奎. 计算方法[M]. 北京: 科学出版社, 2007: 53-74.

[5] 屠伯埙. 线性代数——方法导引[M]. 上海: 复旦大学出版社, 1986: 194.

[6] 姚慕生, 谢启鸿. 高等代数[M]. 第三版. 上海: 复旦大学出版社, 2015: 480.

分享
Top