我们已经将线性方程组表示为紧凑的矩阵形式 \(\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}\),并学习了矩阵的基本运算。现在,我们将系统地探讨如何求解这类方程组。本节介绍的高斯消元法不仅是一种求解算法,其过程本身也揭示了矩阵和解空间的深刻结构。
1. 解的结构:特解与齐次解#
在寻找求解方法之前,我们先来理解一个线性方程组解的通用结构。这个结构非常优美且重要。
一个线性方程组 \(\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}\) 的通解 (general solution) 由两部分组成:
$$ \boldsymbol{x} = \boldsymbol{x}_p + \boldsymbol{x}_h $$- 变量说明:
- \(\boldsymbol{x}_p\) 是方程 \(\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}\) 的一个任意特解 (particular solution)。
- \(\boldsymbol{x}_h\) 是相关齐次方程 (homogeneous equation) \(\boldsymbol{A}\boldsymbol{x} = \boldsymbol{0}\) 的所有解。
直观解释
这个结构有着清晰的几何意义:
- 齐次解 \(\boldsymbol{x}_h\): 所有满足 \(\boldsymbol{A}\boldsymbol{x} = \boldsymbol{0}\) 的解构成一个向量子空间(称为零空间(Null space)),它一定穿过原点。在三维空间中,它可能是一个点(原点)、一条过原点的线、一个过原点的面。这个解集描述了整个解集的“形状”和“方向”。
- 特解 \(\boldsymbol{x}_p\): 这个解的作用像一个“定位器”。它将穿过原点的齐次解空间“平移”到正确的位置,使其能够满足 \(\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}\)。
因此,求解 \(\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}\) 的过程可以分解为三个步骤:
- 找到一个特解 \(\boldsymbol{x}_p\) 来满足 \(\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}\)。
- 找到齐次方程 \(\boldsymbol{A}\boldsymbol{x} = \boldsymbol{0}\) 的所有解 \(\boldsymbol{x}_h\)。
- 将它们相加得到通解。
2. 高斯消元法 (Gaussian Elimination)#
高斯消元法是一种通过一系列初等行变换 (elementary row operations) 将复杂的方程组简化,从而轻松求解的算法。
核心工具
增广矩阵 (Augmented Matrix): 将系数矩阵 \(\boldsymbol{A}\) 和常数向量 \(\boldsymbol{b}\) 并排放在一起,形成 \([\boldsymbol{A} | \boldsymbol{b}]\)。对这个增广矩阵的行进行操作,就等价于对方程组进行操作,但形式上更简洁。
初等行变换:
- 交换 (Exchange):交换两行的位置。
- 缩放 (Scaling):将某一行乘以一个非零常数 \(\lambda\)。
- 加减 (Addition):将一行的倍数加到另一行上。
这些操作不会改变方程组的解集。
算法目标
高斯消元的目标是将增广矩阵化为一种“阶梯状”的简单形式。
目标1:行阶梯形矩阵 (Row Echelon Form, REF) 一个矩阵处于REF,如果它满足:
- 所有全零行都在非零行的下方。
- 某行的第一个非零元素(称为主元 (pivot) 或 主元系数 (leading coefficient))严格位于其上一行主元的右侧。
这就形成了一个“阶梯”结构。
目标2:简化行阶梯形矩阵 (Reduced Row Echelon Form, RREF) RREF在REF的基础上增加了两个更严格的条件:
每个主元的值都必须是 1。
每个主元所在的列,除了主元本身,其他所有元素都必须是 0。
一个矩阵的RREF是唯一的,这使得它成为求解的理想形式。
变量的分类
当矩阵化为REF或RREF后,变量可以分为两类:
- 基本变量 (Basic variables): 对应主元所在的列的变量。
- 自由变量 (Free variables): 不包含主元的列所对应的变量。自由变量可以取任意实数值,是导致无穷多解的根源。
数值示例 (Example 2.6) 我们通过高斯消元法求解一个方程组。 初始增广矩阵:
$$ \left[ \begin{array}{ccccc|c} -2 & 4 & -2 & -1 & 4 & -3 \\ 4 & -8 & 3 & -3 & 1 & 2 \\ 1 & -2 & 1 & -1 & 1 & 0 \\ 1 & -2 & 0 & -3 & 4 & a \end{array} \right] $$经过一系列初等行变换后,可以得到其行阶梯形矩阵 (REF):
$$ \left[ \begin{array}{ccccc|c} 1 & -2 & 1 & -1 & 1 & 0 \\ 0 & 0 & -1 & 1 & -3 & 2 \\ 0 & 0 & 0 & 1 & -2 & 1 \\ 0 & 0 & 0 & 0 & 0 & a+1 \end{array} \right] $$- 解的条件: 从最后一行 \([0, 0, 0, 0, 0 | a+1]\) 可知,要使方程成立 (\(0=a+1\)),必须有 \(a = -1\)。如果 \(a \neq -1\),则系统无解。
- 回代求解: 假设 \(a=-1\),我们可以从下往上回代 (back substitution) 求出解。
- 变量分类: 第1、3、4列有主元,所以 \(x_1, x_3, x_4\) 是基本变量。第2、5列没有主元,所以 \(x_2, x_5\) 是自由变量。
继续化简到简化行阶梯形矩阵 (RREF) 会让求解更直接。
3. 高斯消元法的应用#
求解 \(A\boldsymbol{x}=\boldsymbol{b}\)
- 构造增广矩阵 \([\boldsymbol{A} | \boldsymbol{b}]\)。
- 通过初等行变换将其化为RREF。
- 检查是否存在形如 \([0, \dots, 0 | c]\) 且 \(c \neq 0\) 的行,若有则无解。
- 将自由变量用参数(如 \(\lambda_1, \lambda_2, \dots\))表示。
- 将基本变量用这些参数表示,写出通解。
求解逆矩阵 \(A^{-1}\)
求解 \(\boldsymbol{A}\boldsymbol{X} = \boldsymbol{I}\) 等价于同时求解 \(n\) 个线性方程组。我们可以利用高斯-若尔当消元法 (Gauss-Jordan elimination) 一次性完成。
- 构造增广矩阵 \([\boldsymbol{A} | \boldsymbol{I}_n]\)。
- 通过初等行变换将左侧的 \(\boldsymbol{A}\) 化为 \(\boldsymbol{I}_n\)。
- 如果成功,右侧的矩阵就是 \(\boldsymbol{A}^{-1}\)。最终形式为 \([\boldsymbol{I}_n | \boldsymbol{A}^{-1}]\)。
- 如果左侧无法化为 \(\boldsymbol{I}_n\)(例如出现全零行),则说明矩阵 \(\boldsymbol{A}\) 不可逆。
Minus-1 Trick:快速求解齐次解
这是一个寻找 \(\boldsymbol{A}\boldsymbol{x} = \boldsymbol{0}\) 解的巧妙技巧。
- 将 \(\boldsymbol{A}\) 化为RREF。
- 在对角线上缺少主元的位置,通过添加新行的方式构造一个增广方阵\(\tilde{\boldsymbol{A}}\)。新添加的行在该对角线位置的值为 -1,而在该行的其他所有位置都补0。
- \(\tilde{\boldsymbol{A}}\) 中包含 -1 的那些列向量,就构成了齐次方程解空间的一组基。
数值示例 (Minus-1 Trick) 给定RREF矩阵 \(\boldsymbol{A} = \begin{bmatrix} 1 & 3 & 0 & 0 & 3 \\ 0 & 0 & 1 & 0 & 9 \\ 0 & 0 & 0 & 1 & -4 \end{bmatrix}\)。 它缺少第2和第5个主元。我们构造 \(5 \times 5\) 的 \(\tilde{\boldsymbol{A}}\):
$$ \tilde{\boldsymbol{A}} = \begin{bmatrix} 1 & 3 & 0 & 0 & 3 \\ 0 & \color{red}{-1} & 0 & 0 & 0 \\ 0 & 0 & 1 & 0 & 9 \\ 0 & 0 & 0 & 1 & -4 \\ 0 & 0 & 0 & 0 & \color{red}{-1} \end{bmatrix} $$包含 -1 的第2列和第5列就是解的基向量。齐次解为:
$$ \boldsymbol{x}_h = \lambda_1 \begin{bmatrix} 3 \\ -1 \\ 0 \\ 0 \\ 0 \end{bmatrix} + \lambda_2 \begin{bmatrix} 3 \\ 0 \\ 9 \\ -4 \\ -1 \end{bmatrix} $$本节知识点总结#
- 解的结构: 通解 = 特解 + 齐次解。
- 高斯消元法: 通过初等行变换将增广矩阵化简为行阶梯形(REF)或简化行阶梯形(RREF)。
- 主元 (Pivot): REF中每行第一个非零元素,其数量和位置至关重要。
- 变量分类: 主元列对应基本变量,非主元列对应自由变量。
- 核心应用:
- 求解任意线性方程组 \(\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}\)。
- 通过 \([\boldsymbol{A}|\boldsymbol{I}] \to [\boldsymbol{I}|\boldsymbol{A}^{-1}]\) 高效计算逆矩阵。
- 利用 Minus-1 Trick 快速写出齐次方程 \(\boldsymbol{A}\boldsymbol{x} = \boldsymbol{0}\) 的解。