Skip to content

线性代数公式与性质汇总

本章系统整理线性代数中的核心公式与性质,主要参考 The Matrix Cookbook(Petersen & Pedersen, 2012)并补充经典结论。矩阵微积分内容见专项章节,本章不涉及。


1. 符号约定

符号含义
A,B,C矩阵(大写粗体或大写斜体)
a,b列向量(小写加粗)
aij[A]ij矩阵 Ai 行第 j 列元素
A转置
AAH共轭转置(Hermitian 伴随)
A1逆矩阵
A+Moore-Penrose 伪逆
det(A)|A|行列式
tr(A)
rank(A)
A矩阵范数
Inn×n 单位矩阵
0零矩阵或零向量
Kronecker 积
Hadamard 积(逐元素乘)
vec(A)矩阵向量化(按列堆叠)

2. 迹(Trace)

2.1 定义

tr(A)=i=1nAii

仅对方阵定义。

2.2 基本性质

性质公式
线性tr(A+B)=tr(A)+tr(B)
数乘tr(cA)=ctr(A)
转置不变tr(A)=tr(A)
相似不变tr(P1AP)=tr(A)
循环置换tr(ABC)=tr(BCA)=tr(CAB)
交换tr(AB)=tr(BA)(即使 ABBA
与特征值tr(A)=i=1nλi

2.3 迹与内积

tr(AB)=i,jAijBij

这是矩阵空间上的 Frobenius 内积:A,BF=tr(AB)

2.4 二次型中的迹

aAa=tr(aAa)=tr(Aaa)

3. 行列式(Determinant)

3.1 基本性质

性质公式
乘积det(AB)=det(A)det(B)
数乘det(cA)=cndet(A)ARn×n
转置det(A)=det(A)
逆矩阵det(A1)=1det(A)
幂次det(Ak)=det(A)k
行交换交换两行(列),行列式变号
行缩放某行乘以 k,行列式乘以 k
行倍加一行加上另一行的倍数,行列式不变
块对角det(A00D)=det(A)det(D)
特征值det(A)=i=1nλi

3.2 与秩的关系

A 可逆det(A)0rank(A)=n

3.3 块矩阵行列式

A,D 均为方阵:

det(ABCD)=det(A)det(DCA1B)(A 可逆)det(ABCD)=det(D)det(ABD1C)(D 可逆)

3.4 矩阵行列式引理

det(A+uv)=(1+vA1u)det(A)

推广:

det(A+UCV)=det(C1+VA1U)det(C)det(A)

3.5 Sylvester 行列式恒等式

det(Im+AB)=det(In+BA)

其中 ARm×nBRn×m

3.6 计算方法

  • 2×2det[abcd]=adbc
  • 余子式展开(按第 i 行):det(A)=j=1n(1)i+jAijMij
  • 三角矩阵det=iAii
  • 高斯消元:化为上三角后 det(A)=(1)siUiis 为行交换次数

4. 矩阵的秩(Rank)

4.1 基本性质

性质结论
上界rank(A)min(m,n)ARm×n
转置不变rank(A)=rank(A)=rank(AA)=rank(AA)
数乘不变rank(cA)=rank(A)c0
乘积rank(AB)min(rank(A),rank(B))
加法rank(A+B)rank(A)+rank(B)
可逆乘rank(PAQ)=rank(A)P,Q 可逆)

4.2 Sylvester 秩不等式

rank(A)+rank(B)nrank(AB)min(rank(A),rank(B))

其中 ARm×nBRn×p

4.3 秩-零化度定理

rank(A)+nullity(A)=n(ARm×n)

4.4 满秩分解

任意秩为 r 的矩阵 ARm×n 可分解为:

A=FG

其中 FRm×rGRr×nFG 均满秩。


5. 矩阵的逆(Inverse)

5.1 基本性质

性质公式
双重逆(A1)1=A
乘积逆(AB)1=B1A1
转置逆(A)1=(A1)
共轭逆(A)1=(A1)
数乘逆(cA)1=c1A1c0
幂次逆(An)1=(A1)n

5.2 Sherman-Morrison 公式

(A+uv)1=A1A1uvA11+vA1u

条件:A 可逆,1+vA1u0

5.3 Woodbury 矩阵恒等式

(A+UCV)1=A1A1U(C1+VA1U)1VA1

其中 ARn×nCRk×kURn×kVRk×n

5.4 块矩阵求逆

A,D 可逆,S=DCA1B(Schur 补):

(ABCD)1=(A1+A1BS1CA1A1BS1S1CA1S1)

5.5 Moore-Penrose 伪逆

对于任意矩阵 ARm×n,伪逆 A+ 是满足 Moore-Penrose 条件的唯一矩阵:

  1. AA+A=A
  2. A+AA+=A+
  3. (AA+)=AA+
  4. (A+A)=A+A

计算方法(通过 SVD,A=UΣV):

A+=VΣ+U

其中 Σ+ 是将 Σ 的非零奇异值取倒数再转置。

关键性质

条件结论
A 可逆A+=A1
列满秩(mnrank(A)=nA+=(AA)1A(左逆)
行满秩(mnrank(A)=mA+=A(AA)1(右逆)
(A)+(A+)
(A)+(A+)
(A+)+A
rank(A+)rank(A)

6. 转置与共轭转置

6.1 转置性质

性质公式
双重转置(A)=A
加法(A+B)=A+B
乘积(AB)=BA
数乘(cA)=cA
行列式det(A)=det(A)
(A)1=(A1)

6.2 共轭转置性质

A=A(取复共轭后转置):

性质公式
双重(A)=A
加法(A+B)=A+B
乘积(AB)=BA
数乘(αA)=α¯A

7. 特殊矩阵运算

7.1 Hadamard 积(逐元素乘)

[AB]ij=AijBij

性质

性质公式
交换律AB=BA
结合律(AB)C=A(BC)
分配律A(B+C)=AB+AC
迹关系tr(A(BC))=tr((AB)C)
半正定A,B 半正定 AB 半正定(Schur 积定理)

7.2 Kronecker 积

AB=[A11BA1nBAm1BAmnB]

性质

性质公式
混合乘积(AB)(CD)=(AC)(BD)
转置(AB)=AB
逆(均可逆时)(AB)1=A1B1
tr(AB)=tr(A)tr(B)
行列式det(AB)=det(A)ndet(B)mARm×mBRn×n
rank(AB)=rank(A)rank(B)
特征值λA 的特征值,μB 的特征值,则 λμAB 的特征值

7.3 vec 算子

vec(A) 将矩阵 A 的各列从左到右竖直堆叠成一个列向量。

关键公式

vec(AXB)=(BA)vec(X)tr(AB)=vec(A)vec(B)vec(A+B)=vec(A)+vec(B)

8. 特征值与特征向量

8.1 定义

Av=λvv0,则 λ特征值v 是对应的特征向量

特征多项式:p(λ)=det(AλI)=0

8.2 基本性质

性质公式
tr(A)=iλi
行列式det(A)=iλi
幂次Ak 的特征值为 λik
A1 的特征值为 λi1
多项式f(A) 的特征值为 f(λi)
转置AA 有相同特征值
相似变换AP1AP 有相同特征值
数乘cA 的特征值为 cλi
平移(AμI) 的特征值为 λiμ

8.3 Cayley-Hamilton 定理

矩阵满足其自身的特征多项式:

p(A)=0

例如,若 p(λ)=λ2tr(A)λ+det(A)2×2 情形),则 A2tr(A)A+det(A)I=0

8.4 特征分解

ARn×nn 个线性无关特征向量,则:

A=PΛP1

其中 Λ=diag(λ1,,λn)P 的列为对应特征向量。

对于实对称矩阵(或 Hermitian 矩阵),可取正交分解:

A=QΛQ(QQ=I)

8.5 特征值不等式

A 为实对称矩阵,特征值排列为 λ1λ2λn

Rayleigh 商

λnxAxxxλ1x0

Weyl 不等式C=A+B,均为 Hermitian):

λi+j1(C)λi(A)+λj(B)λi+jn(C)

Courant-Fischer 极小极大定理

λk(A)=mindim(S)=nk+1maxxS,x=1xAx

9. 矩阵分解

9.1 LU 分解

A=LU(或 PA=LU 含行交换)

L 为单位下三角矩阵,U 为上三角矩阵。用于高效求解 Ax=b:先前向代入 Ly=b,再后向代入 Ux=y

9.2 Cholesky 分解

A正定对称矩阵,则存在唯一下三角矩阵 L(对角元素为正),使得:

A=LL
  • 比 LU 分解快约 2×
  • 常用于多元正态分布的采样、最小二乘。

9.3 LDL 分解

A=LDL

其中 L 为单位下三角,D 为对角矩阵。适用于对称但不一定正定的矩阵。

9.4 QR 分解

任意矩阵 ARm×nmn)均可分解为:

A=QR

QRm×m 为正交矩阵,RRm×n 为上三角矩阵。

  • 用于求解最小二乘、计算特征值(QR 算法);
  • 紧凑形式(经济型):A=Q^R^Q^Rm×nR^Rn×n

9.5 奇异值分解(SVD)

任意矩阵 ARm×nmn):

A=UΣV
  • URm×m:正交矩阵(左奇异向量);
  • ΣRm×n:对角矩阵,对角元 σ1σ2σr0(奇异值);
  • VRn×n:正交矩阵(右奇异向量)。

关键关系

AA=VΣΣV,AA=UΣΣU

奇异值是 AA(或 AA)非零特征值的平方根。

截断 SVD(低秩近似)

Ak=i=1kσiuivi=UkΣkVk

Eckart-Young 定理:在所有秩 k 矩阵中,AkA 的最佳近似(Frobenius 范数和谱范数均成立):

minrank(B)=kABF=i=k+1rσi2

9.6 特征分解与 SVD 的关系

特征分解SVD
适用矩阵方阵(可对角化)任意矩阵
分解形式A=PΛP1A=UΣV
正交分解仅对称矩阵保证永远有正交 U,V
特征值(可为复数、负数)奇异值(非负实数)

10. 特殊矩阵类型

10.1 对称矩阵与反对称矩阵

  • 对称A=A;特征值均为实数;可正交对角化。
  • 反对称(斜对称)A=A;对角线全为零;特征值为纯虚数或零。

任意方阵可分解为对称与反对称部分之和:

A=A+A2对称部分+AA2反对称部分

10.2 正交矩阵

Q 正交 QQ=QQ=IQ1=Q

  • |det(Q)|=1det(Q)=±1);
  • 保范:Qx=x
  • 特征值模长为 1;
  • 正交矩阵的乘积仍为正交矩阵。

10.3 正定矩阵

实对称矩阵 A正定(positive definite,PD) 以下等价条件之一成立:

等价条件
xAx>0x0
所有特征值 λi>0
所有顺序主子式 >0(Sylvester 判据)
Cholesky 分解存在(A=LLL 对角元素为正)
A=BB 对某个满列秩矩阵 B

半正定(PSD) 替换以上所有 >

性质

性质结论
可逆正定矩阵均可逆
逆矩阵正定矩阵的逆仍为正定
加法正定矩阵之和仍为正定
主子矩阵正定矩阵的任意主子矩阵仍为正定
A+cIc>λmin 时正定
BABA 正定,B 列满秩 BAB 正定

10.4 幂等矩阵(投影矩阵)

P 幂等 P2=P

  • 特征值只有 0 或 1;
  • tr(P)=rank(P)
  • IP 也是幂等矩阵;
  • 正交投影矩阵额外满足 P=P(对称幂等)。

10.5 正规矩阵

A 正规 AA=AA

包含:Hermitian、反 Hermitian、酉矩阵。正规矩阵可被酉矩阵对角化(谱定理的推广)。

10.6 块矩阵

块对角矩阵

A=diag(A1,A2,,Ak),det(A)=idet(Ai),A1=diag(A11,,Ak1)

块三角矩阵

(AB0D)1=(A1A1BD10D1)

11. 矩阵范数

11.1 向量范数

名称定义
1 范数x1=i|xi|
2 范数(Euclidean)x2=ixi2
p 范数xp=(i|xi|p)1/pp1
范数x=maxi|xi|

11.2 矩阵范数

名称定义备注
Frobenius 范数AF=i,jAij2=tr(AA)与向量 2 一致
谱范数(2 算子范数)A2=σmax(A)最大奇异值
核范数A=iσi奇异值之和
1 算子范数A1=maxji|Aij|最大列绝对和
算子范数A=maxij|Aij|最大行绝对和

一般的诱导矩阵范数定义为:

Ap=maxx0Axpxp

SVD 与范数

AF2=iσi2,A2=σ1,A=iσi

11.3 范数不等式

1nAA2mA(ARm×n)A2AFrA2(r=rank(A))ABFAFBFAB2A2B2

11.4 条件数

κ(A)=AA1=σmaxσmin(使用谱范数时)

κ(A)=1 当且仅当 A 是正规化的正交矩阵。条件数衡量线性系统的数值稳定性。


12. 线性方程组的解

12.1 解的存在性与唯一性

条件解的情况
rank(A)<rank([A|b])无解
rank(A)=rank([A|b])=n唯一解
rank(A)=rank([A|b])<n无穷多解

12.2 最小二乘问题

minxAxb22 的解由正规方程给出:

AAx=Ab
  • A 列满秩:x^=(AA)1Ab=A+b
  • 一般解:x^=A+b(最小范数解)

12.3 正则化最小二乘

Tikhonov 正则化(岭回归)

minxAxb22+λx22

解为:

x^=(AA+λI)1Ab

12.4 零空间与值域

  • 零空间(核):ker(A)={x:Ax=0},维数 =nrank(A)
  • 列空间(值域):col(A)={Ax:xRn},维数 =rank(A)
  • 正交补ker(A)=col(A)col(A)=ker(A)

13. 向量空间与子空间

13.1 基本概念

  • 子空间:非空集合 SRn,对加法和数乘封闭;
  • :线性无关且张成整个空间的向量集合;
  • 维数:基的元素个数;
  • 正交基:基向量两两正交;正交归一基(ONB)额外要求每个向量模为 1。

13.2 Gram-Schmidt 正交化

将线性无关组 {v1,,vk} 正交化:

uj=vji=1j1vjuiuiuiui

单位化:ej=uj/uj

13.3 投影

A 列满秩,向量 b 在子空间 col(A) 上的正交投影:

b^=A(AA)1Ab=Pb

投影矩阵 P=A(AA)1A(对称幂等)。


14. 二次型

14.1 定义

Q(x)=xAx=i,jAijxixj

其中 A 可不妨取对称矩阵。

14.2 正定性判断

类型条件
正定(PD)Q(x)>0x0
半正定(PSD)Q(x)0x
负定(ND)Q(x)<0x0
半负定(NSD)Q(x)0x
不定以上均不满足

14.3 标准化

通过正交变换 x=QyQA 的特征向量矩阵),二次型化为标准形:

Q(x)=yΛy=iλiyi2

15. 矩阵函数与幂级数

15.1 矩阵多项式

f(λ)=k=0mckλk,则:

f(A)=k=0mckAk

15.2 矩阵指数

eA=k=0Akk!=I+A+A22!+

性质

性质公式
对角矩阵ediag(λi)=diag(eλi)
可对角化A=PΛP1eA=PeΛP1
换序(AB=BAeA+B=eAeB
(eA)1=eA
行列式det(eA)=etr(A)
导数ddtetA=AetA

15.3 矩阵对数

A 无零或负实数特征值,则:

ln(A)=k=1(1)k1k(AI)k(AI<1)

满足 elnA=A

15.4 矩阵的平方根

A 为正定矩阵,其正定平方根 A1/2 满足 A1/2A1/2=A。通过 A=QΛQ 可得:

A1/2=QΛ1/2Q

16. 常用恒等式与不等式

16.1 矩阵恒等式

恒等式公式
推广结合律(A+B)C=AC+BC
转置链(A1A2Ak)=AkA2A1
逆链(A1A2Ak)1=Ak1A21A11
迹循环tr(ABCD)=tr(BCDA)=tr(CDAB)=tr(DABC)
Sylvester 行列式det(I+AB)=det(I+BA)

16.2 重要不等式

Cauchy-Schwarz 不等式

|xy|2(xx)(yy)

矩阵形式(A 正定):

(xy)2(xAx)(yA1y)

Hadamard 不等式

|det(A)|jaj2(aj 为 A 的列向量)

迹不等式A,B 均为半正定矩阵):

tr(AB)tr(A)tr(B)tr(AB)0

Von Neumann 迹不等式

|tr(AB)|iσi(A)σi(B)

Fan 不等式(前 k 个最大奇异值之和):

i=1kσi(A+B)i=1kσi(A)+i=1kσi(B)

17. 统计与概率中的矩阵

17.1 协方差矩阵

Σ=E[(xμ)(xμ)]
  • 对称半正定;
  • Σij=Cov(xi,xj)
  • 对角线 Σii=Var(xi)

17.2 多元正态分布

p(x)=1(2π)n/2|Σ|1/2exp(12(xμ)Σ1(xμ))

二次型 (xμ)Σ1(xμ) 称为 Mahalanobis 距离的平方。


在 AI 中的应用

公式/概念AI/ML 中的体现
SVD / 低秩近似PCA、推荐系统矩阵分解、语义分析(LSA)
Woodbury 恒等式高斯过程、核方法中大矩阵求逆的高效计算
Cholesky 分解多元正态采样、卡尔曼滤波、贝叶斯优化
正规方程 / 伪逆线性回归、最小二乘解
Kronecker 积 / vec矩阵方程、多任务学习、高斯过程
谱范数 / 条件数神经网络谱归一化(SN-GAN)、数值稳定性
正定矩阵核函数(Gram 矩阵)、协方差矩阵
矩阵指数连续时间动态系统、状态空间模型
特征分解PCA(XX 的特征向量)、谱聚类
Rayleigh 商Fisher 线性判别分析(LDA)
投影矩阵线性回归帽矩阵 H=X(XX)1X
迹与 Frobenius 范数正则化(权重衰减)、核迹范数最小化

以知识图谱方式组织 AI 学习路径。