线性代数公式与性质汇总
本章系统整理线性代数中的核心公式与性质,主要参考 The Matrix Cookbook(Petersen & Pedersen, 2012)并补充经典结论。矩阵微积分内容见专项章节,本章不涉及。
1. 符号约定
| 符号 | 含义 |
|---|---|
| 矩阵(大写粗体或大写斜体) | |
| 列向量(小写加粗) | |
| 矩阵 | |
| 转置 | |
| 共轭转置(Hermitian 伴随) | |
| 逆矩阵 | |
| Moore-Penrose 伪逆 | |
| 行列式 | |
| 迹 | |
| 秩 | |
| 矩阵范数 | |
| 零矩阵或零向量 | |
| Kronecker 积 | |
| Hadamard 积(逐元素乘) | |
| 矩阵向量化(按列堆叠) |
2. 迹(Trace)
2.1 定义
仅对方阵定义。
2.2 基本性质
| 性质 | 公式 |
|---|---|
| 线性 | |
| 数乘 | |
| 转置不变 | |
| 相似不变 | |
| 循环置换 | |
| 交换 | |
| 与特征值 |
2.3 迹与内积
这是矩阵空间上的 Frobenius 内积:
2.4 二次型中的迹
3. 行列式(Determinant)
3.1 基本性质
| 性质 | 公式 |
|---|---|
| 乘积 | |
| 数乘 | |
| 转置 | |
| 逆矩阵 | |
| 幂次 | |
| 行交换 | 交换两行(列),行列式变号 |
| 行缩放 | 某行乘以 |
| 行倍加 | 一行加上另一行的倍数,行列式不变 |
| 块对角 | |
| 特征值 |
3.2 与秩的关系
3.3 块矩阵行列式
设
3.4 矩阵行列式引理
推广:
3.5 Sylvester 行列式恒等式
其中
3.6 计算方法
: - 余子式展开(按第
行): - 三角矩阵:
- 高斯消元:化为上三角后
, 为行交换次数
4. 矩阵的秩(Rank)
4.1 基本性质
| 性质 | 结论 |
|---|---|
| 上界 | |
| 转置不变 | |
| 数乘不变 | |
| 乘积 | |
| 加法 | |
| 可逆乘 |
4.2 Sylvester 秩不等式
其中
4.3 秩-零化度定理
4.4 满秩分解
任意秩为
其中
5. 矩阵的逆(Inverse)
5.1 基本性质
| 性质 | 公式 |
|---|---|
| 双重逆 | |
| 乘积逆 | |
| 转置逆 | |
| 共轭逆 | |
| 数乘逆 | |
| 幂次逆 |
5.2 Sherman-Morrison 公式
条件:
5.3 Woodbury 矩阵恒等式
其中
5.4 块矩阵求逆
设
5.5 Moore-Penrose 伪逆
对于任意矩阵
计算方法(通过 SVD,
其中
关键性质:
| 条件 | 结论 |
|---|---|
| 列满秩( | |
| 行满秩( | |
6. 转置与共轭转置
6.1 转置性质
| 性质 | 公式 |
|---|---|
| 双重转置 | |
| 加法 | |
| 乘积 | |
| 数乘 | |
| 行列式 | |
| 逆 |
6.2 共轭转置性质
| 性质 | 公式 |
|---|---|
| 双重 | |
| 加法 | |
| 乘积 | |
| 数乘 |
7. 特殊矩阵运算
7.1 Hadamard 积(逐元素乘)
性质:
| 性质 | 公式 |
|---|---|
| 交换律 | |
| 结合律 | |
| 分配律 | |
| 迹关系 | |
| 半正定 |
7.2 Kronecker 积
性质:
| 性质 | 公式 |
|---|---|
| 混合乘积 | |
| 转置 | |
| 逆(均可逆时) | |
| 迹 | |
| 行列式 | |
| 秩 | |
| 特征值 | 若 |
7.3 vec 算子
关键公式:
8. 特征值与特征向量
8.1 定义
若
特征多项式:
8.2 基本性质
| 性质 | 公式 |
|---|---|
| 迹 | |
| 行列式 | |
| 幂次 | |
| 逆 | |
| 多项式 | |
| 转置 | |
| 相似变换 | |
| 数乘 | |
| 平移 |
8.3 Cayley-Hamilton 定理
矩阵满足其自身的特征多项式:
例如,若
8.4 特征分解
若
其中
对于实对称矩阵(或 Hermitian 矩阵),可取正交分解:
8.5 特征值不等式
设
Rayleigh 商:
Weyl 不等式(
Courant-Fischer 极小极大定理:
9. 矩阵分解
9.1 LU 分解
9.2 Cholesky 分解
若
- 比 LU 分解快约
; - 常用于多元正态分布的采样、最小二乘。
9.3 LDL 分解
其中
9.4 QR 分解
任意矩阵
- 用于求解最小二乘、计算特征值(QR 算法);
- 紧凑形式(经济型):
, , 。
9.5 奇异值分解(SVD)
任意矩阵
:正交矩阵(左奇异向量); :对角矩阵,对角元 (奇异值); :正交矩阵(右奇异向量)。
关键关系:
奇异值是
截断 SVD(低秩近似):
Eckart-Young 定理:在所有秩
9.6 特征分解与 SVD 的关系
| 特征分解 | SVD | |
|---|---|---|
| 适用矩阵 | 方阵(可对角化) | 任意矩阵 |
| 分解形式 | ||
| 正交分解 | 仅对称矩阵保证 | 永远有正交 |
| 值 | 特征值(可为复数、负数) | 奇异值(非负实数) |
10. 特殊矩阵类型
10.1 对称矩阵与反对称矩阵
- 对称:
;特征值均为实数;可正交对角化。 - 反对称(斜对称):
;对角线全为零;特征值为纯虚数或零。
任意方阵可分解为对称与反对称部分之和:
10.2 正交矩阵
( ); - 保范:
; - 特征值模长为 1;
- 正交矩阵的乘积仍为正交矩阵。
10.3 正定矩阵
实对称矩阵
| 等价条件 |
|---|
| 所有特征值 |
| 所有顺序主子式 |
| Cholesky 分解存在( |
半正定(PSD):
性质:
| 性质 | 结论 |
|---|---|
| 可逆 | 正定矩阵均可逆 |
| 逆矩阵 | 正定矩阵的逆仍为正定 |
| 加法 | 正定矩阵之和仍为正定 |
| 主子矩阵 | 正定矩阵的任意主子矩阵仍为正定 |
10.4 幂等矩阵(投影矩阵)
- 特征值只有 0 或 1;
; 也是幂等矩阵; - 正交投影矩阵额外满足
(对称幂等)。
10.5 正规矩阵
包含:Hermitian、反 Hermitian、酉矩阵。正规矩阵可被酉矩阵对角化(谱定理的推广)。
10.6 块矩阵
块对角矩阵:
块三角矩阵:
11. 矩阵范数
11.1 向量范数
| 名称 | 定义 |
|---|---|
11.2 矩阵范数
| 名称 | 定义 | 备注 |
|---|---|---|
| Frobenius 范数 | 与向量 | |
| 谱范数( | 最大奇异值 | |
| 核范数 | 奇异值之和 | |
| 最大列绝对和 | ||
| 最大行绝对和 |
一般的诱导矩阵范数定义为:
SVD 与范数:
11.3 范数不等式
11.4 条件数
12. 线性方程组的解
12.1 解的存在性与唯一性
| 条件 | 解的情况 |
|---|---|
| 无解 | |
| 唯一解 | |
| 无穷多解 |
12.2 最小二乘问题
- 若
列满秩: - 一般解:
(最小范数解)
12.3 正则化最小二乘
Tikhonov 正则化(岭回归):
解为:
12.4 零空间与值域
- 零空间(核):
,维数 - 列空间(值域):
,维数 - 正交补:
,
13. 向量空间与子空间
13.1 基本概念
- 子空间:非空集合
,对加法和数乘封闭; - 基:线性无关且张成整个空间的向量集合;
- 维数:基的元素个数;
- 正交基:基向量两两正交;正交归一基(ONB)额外要求每个向量模为 1。
13.2 Gram-Schmidt 正交化
将线性无关组
单位化:
13.3 投影
若
投影矩阵
14. 二次型
14.1 定义
其中
14.2 正定性判断
| 类型 | 条件 |
|---|---|
| 正定(PD) | |
| 半正定(PSD) | |
| 负定(ND) | |
| 半负定(NSD) | |
| 不定 | 以上均不满足 |
14.3 标准化
通过正交变换
15. 矩阵函数与幂级数
15.1 矩阵多项式
若
15.2 矩阵指数
性质:
| 性质 | 公式 |
|---|---|
| 对角矩阵 | |
| 可对角化 | |
| 换序( | |
| 逆 | |
| 行列式 | |
| 导数 |
15.3 矩阵对数
若
满足
15.4 矩阵的平方根
若
16. 常用恒等式与不等式
16.1 矩阵恒等式
| 恒等式 | 公式 |
|---|---|
| 推广结合律 | |
| 转置链 | |
| 逆链 | |
| 迹循环 | |
| Sylvester 行列式 |
16.2 重要不等式
Cauchy-Schwarz 不等式:
矩阵形式(
Hadamard 不等式:
迹不等式(
Von Neumann 迹不等式:
Fan 不等式(前
17. 统计与概率中的矩阵
17.1 协方差矩阵
- 对称半正定;
; - 对角线
。
17.2 多元正态分布
二次型
在 AI 中的应用
| 公式/概念 | AI/ML 中的体现 |
|---|---|
| SVD / 低秩近似 | PCA、推荐系统矩阵分解、语义分析(LSA) |
| Woodbury 恒等式 | 高斯过程、核方法中大矩阵求逆的高效计算 |
| Cholesky 分解 | 多元正态采样、卡尔曼滤波、贝叶斯优化 |
| 正规方程 / 伪逆 | 线性回归、最小二乘解 |
| Kronecker 积 / vec | 矩阵方程、多任务学习、高斯过程 |
| 谱范数 / 条件数 | 神经网络谱归一化(SN-GAN)、数值稳定性 |
| 正定矩阵 | 核函数(Gram 矩阵)、协方差矩阵 |
| 矩阵指数 | 连续时间动态系统、状态空间模型 |
| 特征分解 | PCA( |
| Rayleigh 商 | Fisher 线性判别分析(LDA) |
| 投影矩阵 | 线性回归帽矩阵 |
| 迹与 Frobenius 范数 | 正则化(权重衰减)、核迹范数最小化 |