矩阵与线性方程组
线性代数的起点是线性方程组的求解,而矩阵是这一问题的核心工具。本节从高斯消元出发,系统介绍矩阵的基本运算与分解,并引出行列式这一重要标量量。
1. 线性方程组
一个包含
写成矩阵形式为
是系数矩阵; 是未知向量; 是常数向量。
增广矩阵(augmented matrix)将系数与常数项拼在一起,便于行变换操作:
2. 高斯-约当消元法
高斯消元法(Gaussian Elimination)通过对增广矩阵施加初等行变换,将方程组化简为等价但易于求解的形式。
2.1 初等行变换
共有三种基本操作,均不改变方程组的解:
| 操作 | 符号 | 含义 |
|---|---|---|
| 行缩放 | 某行乘以非零常数 | |
| 行交换 | 交换两行 | |
| 行加法 | 某行加上另一行的常数倍 |
2.2 阶梯形(REF)与简约阶梯形(RREF)
通过行变换可将矩阵化为:
行阶梯形(Row Echelon Form, REF):
- 全零行在最下方;
- 每行的主元(pivot,第一个非零元)严格位于上一行主元的右侧。
简约行阶梯形(Reduced Row Echelon Form, RREF):
- 在 REF 的基础上,每个主元为 1,且主元所在列的其他元素都为 0。
RREF 是唯一的,每个矩阵只对应一个 RREF。
2.3 解的存在性与 Rank
设增广矩阵
| 条件 | 解的情况 |
|---|---|
| 无解(矛盾方程) | |
| 唯一解 | |
| 无穷多解(存在自由变量) |
3. 矩阵的基本运算
3.1 加法与数乘
矩阵加法和数乘按分量逐元素进行,满足通常的代数律(交换律、结合律、分配律)。
3.2 矩阵乘法
注意:矩阵乘法一般不满足交换律,
主要代数性质:
- 结合律:
- 分配律:
- 转置:
3.3 矩阵的转置
若
- 对称矩阵:
(即 ); - 反对称(斜对称)矩阵:
(对角线必须全为 0)。
4. 矩阵的逆
4.1 定义
若存在矩阵
可逆矩阵的逆矩阵唯一。
4.2 逆矩阵的代数性质
4.3 计算矩阵的逆
方法一:公式法(
仅当
方法二:伴随矩阵法(一般
其中
是删去第 行第 列后所得子矩阵的行列式(余子式); (代数余子式矩阵的转置)。
方法三:增广矩阵行变换(推荐)
将
若左侧能化为
5. 特殊矩阵
5.1 初等矩阵
由单位矩阵经一次初等行变换得到的矩阵称为初等矩阵。对矩阵左乘一个初等矩阵,等价于对该矩阵施加对应的初等行变换。初等矩阵均可逆。
5.2 对角矩阵
仅主对角线上可能有非零元素的矩阵。设
可逆 所有 ; 。
5.3 上下三角矩阵
- 上三角矩阵:主对角线以下元素全为 0;
- 下三角矩阵:主对角线以上元素全为 0。
性质:上(下)三角矩阵可逆当且仅当主对角元素均非零,且其逆矩阵仍是上(下)三角矩阵。
6. LU 分解
6.1 定义
若存在下三角矩阵
则称之为
NOTE
并非每个矩阵都存在 LU 分解。若可逆矩阵
6.2 求解线性方程组的应用
当
- 前向代入:解
( 是下三角,从上往下代入); - 后向代入:解
( 是上三角,从下往上代入)。
相比直接高斯消元,LU 分解在需要对同一矩阵求解多个右端项时效率更高。
7. 行列式
7.1 定义与基本性质
矩阵
核心性质:
| 性质 | 公式 |
|---|---|
| 乘积法则 | |
| 数乘 | |
| 转置 | |
| 逆矩阵 | |
| 行交换 | 交换两行,行列式变号 |
| 行倍加 | 一行加上另一行的倍数,行列式不变 |
| 行缩放 | 某行乘以 |
7.2 计算方法
: (余子式展开,按第 行):
三角矩阵:行列式等于主对角线元素之积。
通过高斯消元:将
化为上三角形 ,记录行交换次数 ,则 。
7.3 Cramer 法则
对于
其中
NOTE
Cramer 法则在理论分析中有用,但计算效率远低于高斯消元,不建议直接用于数值求解。
8. 矩阵变换
8.1 定义
由矩阵
这是一个从
8.2 单射、满射与双射
| 性质 | 定义 | 矩阵条件 |
|---|---|---|
| 单射(injective) | 列线性无关, | |
| 满射(surjective) | 列张成 | |
| 双射(bijective) | 既单射又满射 |
对于方阵
:单射、满射、双射与 可逆四者互相等价。
9. 伴随矩阵与 Hermitian 矩阵
矩阵
即先转置再取复共轭。若
性质:Hermitian 矩阵对角线上的元素必定为实数。
对于实矩阵,Hermitian 矩阵即对称矩阵(
在 AI 中的应用
| 概念 | AI/ML 中的体现 |
|---|---|
| 矩阵乘法 | 神经网络前向传播: |
| 矩阵逆 | 正规方程求最小二乘解: |
| LU 分解 | 高效求解多右端项线性系统 |
| 行列式 | 归一化常数、变量替换的 Jacobian |
| 矩阵变换 | 注意力中的投影: |