Skip to content

线性空间

线性空间(又称向量空间)是线性代数中最核心的抽象结构。理解了线性空间,就能理解神经网络中的 embedding space、feature space 以及各种表示空间的本质。

1. 线性空间的定义

线性空间(Linear Space),也叫向量空间(Vector Space),是一个集合 V,其中定义了两种运算:

  • 向量加法u+vV
  • 数量乘法cuVc 是标量)

1.1 两个封闭性(Closure)

封闭性要求
对加法封闭u,vVu+vV
对数乘封闭cF,uVcuV

1.2 八条公理(Axioms)

满足封闭性之外,还要满足以下 8 条公理:

编号公理含义
A1u+v=v+u加法交换律
A2(u+v)+w=u+(v+w)加法结合律
A30V:u+0=u零向量存在
A4uV,(u)V:u+(u)=0加法逆元存在
A51u=u数乘单位元
A6(cd)u=c(du)数乘结合律
A7c(u+v)=cu+cv数乘对向量加法分配
A8(c+d)u=cu+du数乘对标量加法分配

线性空间的定义非常广泛。Rn 是典型例子,但多项式集合、连续函数集合也可以构成线性空间。

2. 子空间

2.1 定义

WV 是向量空间 V 的一个非空子集。WV子空间(subspace),当且仅当 WV 的运算封闭:

  1. 0W(包含零向量)
  2. u,vWu+vW(对加法封闭)
  3. cF,uWcuW(对数乘封闭)

满足这三条即可(它们蕴含了 8 条公理中大部分的内容)。

2.2 常见子空间的例子

  • Rn 中的任意过原点的直线或平面;
  • 矩阵 A列空间 Col(A)A 的各列的线性组合;
  • 矩阵 A零空间 Null(A):满足 Ax=0 的所有向量。

3. 线性相关与线性无关

3.1 线性组合

向量 v 是向量组 {v1,v2,,vk}线性组合,若存在标量 c1,c2,,ck 使得:

v=c1v1+c2v2++ckvk

3.2 线性无关

向量组 {v1,,vk} 线性无关(linearly independent),若:

c1v1+c2v2++ckvk=0c1=c2==ck=0

否则称为线性相关(linearly dependent)。直觉上,线性相关意味着某个向量可以由其他向量表示,是"冗余"的。

4. 基与坐标

4.1 基(Basis)

向量空间 V 的一组是一组线性无关且能张成(span)整个 V 的向量组 {e1,e2,,en},即:

  • 线性无关:{ei} 之间没有冗余;
  • 张成:V 中每个向量都是 {ei} 的线性组合。

4.2 坐标(Coordinates)

给定基 B={e1,,en}V 中每个向量 v 可以唯一表示为:

v=c1e1+c2e2++cnen

系数 (c1,c2,,cn) 称为 v 在基 B 下的坐标(coordinates),记作 [v]B

坐标依赖于所选的基——同一个向量在不同基下有不同的坐标,这就是基的变换的意义所在。

5. 维数与秩

5.1 维数(Dimension)

向量空间 V维数 dim(V) 是任意一组基中向量的个数。所有基的大小相同。

5.2 矩阵的秩(Rank)

矩阵 A rank(A) 定义为 A 的行空间(或等价地,列空间)的维数,等于 RREF 中主元的个数。

5.3 零空间(Null Space)

矩阵 ARm×n零空间(null space)定义为:

Null(A)={xRnAx=0}

零空间是 Rn 的子空间(包含 0,且对加法和数乘封闭)。

如何求 Null(A)

  1. 构造齐次线性方程组 Ax=0
  2. A 化为 RREF;
  3. 找出自由变量(对应非主元列);
  4. 用自由变量表示解向量的一般形式;
  5. 写出 Null(A) 的一组基,维数即为自由变量个数。

5.4 秩-零化度定理(Rank-Nullity Theorem)

rank(A)+nullity(A)=n

其中 nullity(A)=dim(Null(A)) 是零空间的维数,nA 的列数(未知数个数)。

直觉A 的列中有 rank(A) 个"主元方向"(被 A 完全决定),剩下 nullity(A) 个"自由方向"(落在零空间中)。

6. 正交补

6.1 定义

WRn 是欧氏空间 Rn 的一个子空间,W正交补(orthogonal complement)定义为:

W={vRnvw=0, wW}

即由所有与 W 中每个向量都正交的向量构成的集合。

6.2 性质

性质公式/说明
维数互补dim(W)+dim(W)=n
直和分解Rn=WW(每个向量可唯一分解为 W 分量和 W 分量之和)
二次正交补(W)=W
交集WW={0}

6.3 与矩阵的关系

Row(A)=Null(A),Col(A)=Null(A)

这意味着矩阵的零空间就是行空间的正交补,两者共同"瓜分"了整个 Rn

7. 可逆矩阵的等价命题

以下命题对 n×n 矩阵 A 互相等价(即一条成立则全部成立):

编号等价命题
1A 可逆(非奇异)
2A 的列向量线性无关
3A 的列向量张成 Rn
4Ax=0 只有零解
5Ax=b 对任意 b 有唯一解
6rank(A)=n
7nullity(A)=0(零空间只含 0
8det(A)0
90 不是 A 的特征值
10A 也可逆

这组等价命题是线性代数的核心定理,在分析神经网络层的可逆性和表达能力时极为有用。

8. 基的变换

8.1 坐标变换矩阵

B={b1,,bn}C={c1,,cn}V 的两组基。从 B 坐标到 C 坐标的变换可以用过渡矩阵(change-of-basis matrix)PBC 来表达:

[v]C=PBC[v]B

8.2 直觉

不同的基就像不同的"坐标系"——同一个物体,在不同坐标系下有不同的坐标表示,但物体本身没有变。基变换矩阵做的就是在这些坐标系之间"翻译"。

这一思想在线性变换的矩阵表示中起核心作用:同一个抽象线性变换,在不同基下对应不同的矩阵(相似矩阵)。

在 AI 中的应用

概念AI/ML 中的体现
向量空间Embedding space:词向量、图像特征向量所在的空间
子空间表示空间中的语义子空间(如情感方向、性别方向)
基与坐标任何一组特征提取器都在定义一组"基"
秩-零化度定理分析线性层的信息瓶颈:秩不足意味着信息压缩
零空间模型参数更新的"无效方向"(不影响输出的方向)
正交补PCA 中的主成分方向与噪声方向的关系

以知识图谱方式组织 AI 学习路径。