线性空间
线性空间(又称向量空间)是线性代数中最核心的抽象结构。理解了线性空间,就能理解神经网络中的 embedding space、feature space 以及各种表示空间的本质。
1. 线性空间的定义
线性空间(Linear Space),也叫向量空间(Vector Space),是一个集合
- 向量加法:
- 数量乘法:
( 是标量)
1.1 两个封闭性(Closure)
| 封闭性 | 要求 |
|---|---|
| 对加法封闭 | |
| 对数乘封闭 |
1.2 八条公理(Axioms)
满足封闭性之外,还要满足以下 8 条公理:
| 编号 | 公理 | 含义 |
|---|---|---|
| A1 | 加法交换律 | |
| A2 | 加法结合律 | |
| A3 | 零向量存在 | |
| A4 | 加法逆元存在 | |
| A5 | 数乘单位元 | |
| A6 | 数乘结合律 | |
| A7 | 数乘对向量加法分配 | |
| A8 | 数乘对标量加法分配 |
线性空间的定义非常广泛。
是典型例子,但多项式集合、连续函数集合也可以构成线性空间。
2. 子空间
2.1 定义
设
(包含零向量) (对加法封闭) (对数乘封闭)
满足这三条即可(它们蕴含了 8 条公理中大部分的内容)。
2.2 常见子空间的例子
中的任意过原点的直线或平面; - 矩阵
的列空间 : 的各列的线性组合; - 矩阵
的零空间 :满足 的所有向量。
3. 线性相关与线性无关
3.1 线性组合
向量
3.2 线性无关
向量组
否则称为线性相关(linearly dependent)。直觉上,线性相关意味着某个向量可以由其他向量表示,是"冗余"的。
4. 基与坐标
4.1 基(Basis)
向量空间
- 线性无关:
之间没有冗余; - 张成:
中每个向量都是 的线性组合。
4.2 坐标(Coordinates)
给定基
系数
坐标依赖于所选的基——同一个向量在不同基下有不同的坐标,这就是基的变换的意义所在。
5. 维数与秩
5.1 维数(Dimension)
向量空间
5.2 矩阵的秩(Rank)
矩阵
5.3 零空间(Null Space)
矩阵
零空间是
如何求
- 构造齐次线性方程组
; - 将
化为 RREF; - 找出自由变量(对应非主元列);
- 用自由变量表示解向量的一般形式;
- 写出
的一组基,维数即为自由变量个数。
5.4 秩-零化度定理(Rank-Nullity Theorem)
其中
直觉:
6. 正交补
6.1 定义
设
即由所有与
6.2 性质
| 性质 | 公式/说明 |
|---|---|
| 维数互补 | |
| 直和分解 | |
| 二次正交补 | |
| 交集 |
6.3 与矩阵的关系
这意味着矩阵的零空间就是行空间的正交补,两者共同"瓜分"了整个
7. 可逆矩阵的等价命题
以下命题对
| 编号 | 等价命题 |
|---|---|
| 1 | |
| 2 | |
| 3 | |
| 4 | |
| 5 | |
| 6 | |
| 7 | |
| 8 | |
| 9 | |
| 10 |
这组等价命题是线性代数的核心定理,在分析神经网络层的可逆性和表达能力时极为有用。
8. 基的变换
8.1 坐标变换矩阵
设
8.2 直觉
不同的基就像不同的"坐标系"——同一个物体,在不同坐标系下有不同的坐标表示,但物体本身没有变。基变换矩阵做的就是在这些坐标系之间"翻译"。
这一思想在线性变换的矩阵表示中起核心作用:同一个抽象线性变换,在不同基下对应不同的矩阵(相似矩阵)。
在 AI 中的应用
| 概念 | AI/ML 中的体现 |
|---|---|
| 向量空间 | Embedding space:词向量、图像特征向量所在的空间 |
| 子空间 | 表示空间中的语义子空间(如情感方向、性别方向) |
| 基与坐标 | 任何一组特征提取器都在定义一组"基" |
| 秩-零化度定理 | 分析线性层的信息瓶颈:秩不足意味着信息压缩 |
| 零空间 | 模型参数更新的"无效方向"(不影响输出的方向) |
| 正交补 | PCA 中的主成分方向与噪声方向的关系 |