线性变换
线性变换是线性代数中最核心的映射概念。矩阵只是线性变换在某组基下的"具体表示",理解这种抽象与具体的关系,才能真正理解神经网络层的本质。
特征值、特征向量与矩阵对角化属于矩阵的谱性质,见 矩阵的谱与性质。
1. 线性变换的定义
线性变换(Linear Transformation)是两个向量空间之间的映射
| 性质 | 公式 | 含义 |
|---|---|---|
| 可加性 | 变换保持加法结构 | |
| 齐次性 | 变换保持数乘结构 |
两条合并为一条等价判定:
线性变换 vs 矩阵变换
| 线性变换 | 矩阵变换 | |
|---|---|---|
| 性质 | 抽象的数学映射 | 线性变换在特定基下的具体表示 |
| 依赖基? | 不依赖 | 依赖(换一组基就得到不同矩阵) |
| 关系 | 给定基后,每个线性变换唯一对应一个矩阵 | 同一变换,不同基给出不同但相似的矩阵 |
2. 线性变换的矩阵表示
2.1 如何确定一个线性变换?
对于线性空间
只要知道线性变换
在每个基向量上的像,就能确定 在整个空间上的行为。
即,若
2.2 变换矩阵的构造
给定
3. 核与像
3.1 核(Kernel)
线性变换
是单射(injective) 。
3.2 像(Image)
线性变换
是满射(surjective) 。
3.3 维数定理
核的维数(nullity)加上像的维数(rank)等于定义域的维数——这是秩-零化度定理的变换版本。
4. 相似矩阵
4.1 核心思想:殊途同归
同一个线性变换
其中
4.2 相似矩阵的定义
若存在可逆矩阵
则称矩阵
4.3 相似矩阵共享的不变量
相似矩阵代表同一线性变换,因此共享所有与变换本身相关的量:
| 不变量 | 公式/说明 |
|---|---|
| 特征值(含重数) | |
| 行列式 | |
| 迹 | |
| 秩 | |
| 特征多项式 |
这些不变量是分析模型结构的关键工具,详见 矩阵的谱与性质。
5. 仿射变换
线性变换要求
其中
在 AI 中的应用
| 概念 | AI/ML 中的体现 |
|---|---|
| 线性变换 | 神经网络线性层: |
| 仿射变换 | 带 bias 的线性层: |
| 核(零空间) | 模型中不影响输出的输入方向(冗余信息) |
| 像(列空间) | 线性层能表达的输出集合,决定模型的表达能力 |
| 相似矩阵 | 不同坐标系下的同一变换;权重矩阵在不同基下的等价表示 |