线性空间

线性空间（又称向量空间）是线性代数中最核心的抽象结构。理解了线性空间，就能理解神经网络中的 embedding space、feature space 以及各种表示空间的本质。

1. 线性空间的定义

线性空间（Linear Space），也叫向量空间（Vector Space），是一个集合 $V$ ，其中定义了两种运算：

向量加法： $u + v \in V$
数量乘法： $c \cdot u \in V$ （ $c$ 是标量）

1.1 两个封闭性（Closure）

封闭性	要求
对加法封闭	$\forall u, v \in V \Rightarrow u + v \in V$
对数乘封闭	$\forall c \in F, u \in V \Rightarrow c u \in V$

1.2 八条公理（Axioms）

满足封闭性之外，还要满足以下 8 条公理：

编号	公理	含义
A1	$u + v = v + u$	加法交换律
A2	$(u + v) + w = u + (v + w)$	加法结合律
A3	$\exists 0 \in V : u + 0 = u$	零向量存在
A4	$\forall u \in V, \exists (- u) \in V : u + (- u) = 0$	加法逆元存在
A5	$1 \cdot u = u$	数乘单位元
A6	$(c d) u = c (d u)$	数乘结合律
A7	$c (u + v) = c u + c v$	数乘对向量加法分配
A8	$(c + d) u = c u + d u$	数乘对标量加法分配

线性空间的定义非常广泛。 $R^{n}$ 是典型例子，但多项式集合、连续函数集合也可以构成线性空间。

2. 子空间

2.1 定义

设 $W \subseteq V$ 是向量空间 $V$ 的一个非空子集。 $W$ 是 $V$ 的子空间（subspace），当且仅当 $W$ 对 $V$ 的运算封闭：

$0 \in W$ （包含零向量）
$\forall u, v \in W \Rightarrow u + v \in W$ （对加法封闭）
$\forall c \in F, u \in W \Rightarrow c u \in W$ （对数乘封闭）

满足这三条即可（它们蕴含了 8 条公理中大部分的内容）。

2.2 常见子空间的例子

$R^{n}$ 中的任意过原点的直线或平面；
矩阵 $A$ 的列空间 $Col (A)$ ： $A$ 的各列的线性组合；
矩阵 $A$ 的零空间 $Null (A)$ ：满足 $A x = 0$ 的所有向量。

3. 线性相关与线性无关

3.1 线性组合

向量 $v$ 是向量组 ${v_{1}, v_{2}, \dots, v_{k}}$ 的线性组合，若存在标量 $c_{1}, c_{2}, \dots, c_{k}$ 使得：

v = c_{1} v_{1} + c_{2} v_{2} + \dots + c_{k} v_{k}

3.2 线性无关

向量组 ${v_{1}, \dots, v_{k}}$ 线性无关（linearly independent），若：

c_{1} v_{1} + c_{2} v_{2} + \dots + c_{k} v_{k} = 0 ⟹ c_{1} = c_{2} = \dots = c_{k} = 0

否则称为线性相关（linearly dependent）。直觉上，线性相关意味着某个向量可以由其他向量表示，是"冗余"的。

4. 基与坐标

4.1 基（Basis）

向量空间 $V$ 的一组基是一组线性无关且能张成（span）整个 $V$ 的向量组 ${e_{1}, e_{2}, \dots, e_{n}}$ ，即：

线性无关： ${e_{i}}$ 之间没有冗余；
张成： $V$ 中每个向量都是 ${e_{i}}$ 的线性组合。

4.2 坐标（Coordinates）

给定基 $B = {e_{1}, \dots, e_{n}}$ ， $V$ 中每个向量 $v$ 可以唯一表示为：

v = c_{1} e_{1} + c_{2} e_{2} + \dots + c_{n} e_{n}

系数 $(c_{1}, c_{2}, \dots, c_{n})$ 称为 $v$ 在基 $B$ 下的坐标（coordinates），记作 $[v]_{B}$ 。

坐标依赖于所选的基——同一个向量在不同基下有不同的坐标，这就是基的变换的意义所在。

5. 维数与秩

5.1 维数（Dimension）

向量空间 $V$ 的维数 $\dim (V)$ 是任意一组基中向量的个数。所有基的大小相同。

5.2 矩阵的秩（Rank）

矩阵 $A$ 的秩 $rank (A)$ 定义为 $A$ 的行空间（或等价地，列空间）的维数，等于 RREF 中主元的个数。

5.3 零空间（Null Space）

矩阵 $A \in R^{m \times n}$ 的零空间（null space）定义为：

Null (A) = {x \in R^{n} ∣ A x = 0}

零空间是 $R^{n}$ 的子空间（包含 $0$ ，且对加法和数乘封闭）。

如何求 $Null (A)$ ：

构造齐次线性方程组 $A x = 0$ ；
将 $A$ 化为 RREF；
找出自由变量（对应非主元列）；
用自由变量表示解向量的一般形式；
写出 $Null (A)$ 的一组基，维数即为自由变量个数。

5.4 秩-零化度定理（Rank-Nullity Theorem）

rank (A) + nullity (A) = n

其中 $nullity (A) = \dim (Null (A))$ 是零空间的维数， $n$ 是 $A$ 的列数（未知数个数）。

直觉： $A$ 的列中有 $rank (A)$ 个"主元方向"（被 $A$ 完全决定），剩下 $nullity (A)$ 个"自由方向"（落在零空间中）。

6. 正交补

6.1 定义

设 $W \subseteq R^{n}$ 是欧氏空间 $R^{n}$ 的一个子空间， $W$ 的正交补（orthogonal complement）定义为：

W^{⊥} = {v \in R^{n} ∣ v \cdot w = 0, \forall w \in W}

即由所有与 $W$ 中每个向量都正交的向量构成的集合。

6.2 性质

性质	公式/说明
维数互补	$\dim (W) + \dim (W^{⊥}) = n$
直和分解	$R^{n} = W \oplus W^{⊥}$ （每个向量可唯一分解为 $W$ 分量和 $W^{⊥}$ 分量之和）
二次正交补	$(W^{⊥})^{⊥} = W$
交集	$W \cap W^{⊥} = {0}$

6.3 与矩阵的关系

Row (A)^{⊥} = Null (A), Col (A)^{⊥} = Null (A^{⊤})

这意味着矩阵的零空间就是行空间的正交补，两者共同"瓜分"了整个 $R^{n}$ 。

7. 可逆矩阵的等价命题

以下命题对 $n \times n$ 矩阵 $A$ 互相等价（即一条成立则全部成立）：

编号	等价命题
1	$A$ 可逆（非奇异）
2	$A$ 的列向量线性无关
3	$A$ 的列向量张成 $R^{n}$
4	$A x = 0$ 只有零解
5	$A x = b$ 对任意 $b$ 有唯一解
6	$rank (A) = n$
7	$nullity (A) = 0$ （零空间只含 $0$ ）
8	$det (A) \neq 0$
9	$0$ 不是 $A$ 的特征值
10	$A^{⊤}$ 也可逆

这组等价命题是线性代数的核心定理，在分析神经网络层的可逆性和表达能力时极为有用。

8. 基的变换

8.1 坐标变换矩阵

设 $B = {b_{1}, \dots, b_{n}}$ 和 $C = {c_{1}, \dots, c_{n}}$ 是 $V$ 的两组基。从 $B$ 坐标到 $C$ 坐标的变换可以用过渡矩阵（change-of-basis matrix） $P_{B \to C}$ 来表达：

[v]_{C} = P_{B \to C} \cdot [v]_{B}

8.2 直觉

不同的基就像不同的"坐标系"——同一个物体，在不同坐标系下有不同的坐标表示，但物体本身没有变。基变换矩阵做的就是在这些坐标系之间"翻译"。

这一思想在线性变换的矩阵表示中起核心作用：同一个抽象线性变换，在不同基下对应不同的矩阵（相似矩阵）。

在 AI 中的应用

概念	AI/ML 中的体现
向量空间	Embedding space：词向量、图像特征向量所在的空间
子空间	表示空间中的语义子空间（如情感方向、性别方向）
基与坐标	任何一组特征提取器都在定义一组"基"
秩-零化度定理	分析线性层的信息瓶颈：秩不足意味着信息压缩
零空间	模型参数更新的"无效方向"（不影响输出的方向）
正交补	PCA 中的主成分方向与噪声方向的关系

线性空间 ​

1. 线性空间的定义 ​

1.1 两个封闭性（Closure） ​

1.2 八条公理（Axioms） ​

2. 子空间 ​

2.1 定义 ​

2.2 常见子空间的例子 ​

3. 线性相关与线性无关 ​

3.1 线性组合 ​

3.2 线性无关 ​

4. 基与坐标 ​

4.1 基（Basis） ​

4.2 坐标（Coordinates） ​

5. 维数与秩 ​

5.1 维数（Dimension） ​

5.2 矩阵的秩（Rank） ​

5.3 零空间（Null Space） ​

5.4 秩-零化度定理（Rank-Nullity Theorem） ​

6. 正交补 ​

6.1 定义 ​

6.2 性质 ​

6.3 与矩阵的关系 ​

7. 可逆矩阵的等价命题 ​

8. 基的变换 ​

8.1 坐标变换矩阵 ​

8.2 直觉 ​

在 AI 中的应用 ​