我们从线性代数最基本也是最经典的问题开始:求解线性方程组。许多复杂的科学和工程问题,经过数学建模后,最终都会归结为求解一个大规模的线性方程组。理解它,是通往线性代数抽象世界的第一扇门。
1. 从实际问题到数学模型#
应用场景
考虑一个生产计划问题(例 2.1): 一家公司生产 \(n\) 种产品 \(N_1, \dots, N_n\),需要消耗 \(m\) 种资源 \(R_1, \dots, R_m\)。
- 已知:
- 生产一个单位的产品 \(N_j\) 需要消耗 \(a_{ij}\) 个单位的资源 \(R_i\)。
- 资源 \(R_i\) 的总供应量为 \(b_i\)。
- 目标:
- 找到一个最优生产计划,即每种产品 \(N_j\) 应该生产多少个单位,记为 \(x_j\),恰好能用完所有资源。
要消耗完所有资源 \(R_i\),那么生产所有产品对该资源的总消耗量必须等于其总供应量 \(b_i\)。对于第 \(i\) 种资源,我们有:
$$ a_{i1}x_1 + a_{i2}x_2 + \dots + a_{in}x_n = b_i $$这里,\(a_{i1}x_1\) 是生产 \(x_1\) 单位产品 \(N_1\) 所需资源 \(R_i\) 的量,以此类推。由于我们有 \(m\) 种资源,我们就得到了 \(m\) 个这样的方程。
2. 线性方程组的定义与解#
准确的数学定义
将上述问题泛化,我们就得到了一个由 \(m\) 个方程和 \(n\) 个未知数组成的线性方程组 (system of linear equations):
$$ \begin{align*} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n &= b_1 \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n &= b_2 \\ \vdots \qquad & \qquad \vdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n &= b_m \end{align*} $$- 变量说明:
- \(x_1, x_2, \dots, x_n\) 是未知数 (unknowns)。
- \(a_{ij}\) 是第 \(i\) 个方程中第 \(j\) 个未知数的系数 (coefficients)。
- \(b_i\) 是第 \(i\) 个方程的常数项 (constant terms)。
一个满足该系统中所有方程的 \(n\) 元组 \((\boldsymbol{x_1, \dots, x_n})\) 被称为该线性方程组的一个解 (solution)。
数值示例:解的三种可能性
一个线性方程组的解集可能有三种情况:
无解 (No solution):系统内存在矛盾的方程。 例如,对于系统 (2.4):
$$ \begin{align*} x_1 + x_2 + x_3 &= 3 \quad &(1) \\ x_1 - x_2 + 2x_3 &= 2 \quad &(2) \\ 2x_1 \qquad + 3x_3 &= 1 \quad &(3) \end{align*} $$将方程 (1) 和 (2) 相加,我们得到 \(2x_1 + 3x_3 = 5\)。这与方程 (3) 的 \(2x_1 + 3x_3 = 1\) 直接矛盾。因此,该系统无解。我们称这样的系统为不相容的 (inconsistent)。
唯一解 (Exactly one solution):系统提供的信息不多不少,刚好能确定所有未知数。 例如,系统 (2.5) 经计算可得唯一解 \((1, 1, 1)\)。
$$ \begin{align*}x_1 + x_2 + x_3 &= 3 \quad (1) \\x_1 - x_2 + 2x_3 &= 2 \quad (2) \\x_2 + x_3 &= 2 \quad (3)\end{align*} $$无穷多解 (Infinitely many solutions):系统中的方程存在冗余,无法唯一确定所有未知数。 例如,对于系统 (2.6):
$$ \begin{align*} x_1 + x_2 + x_3 &= 3 \quad &(1) \\ x_1 - x_2 + 2x_3 &= 2 \quad &(2) \\ 2x_1 \qquad + 3x_3 &= 5 \quad &(3) \end{align*} $$我们发现方程 (3) 恰好是 (1) 和 (2) 的和,它没有提供任何新信息,是冗余的 (redundant)。我们可以引入一个自由变量 (free variable),比如令 \(x_3 = a \in \mathbb{R}\)。然后用 \(a\) 来表示其他变量,得到一组解:\((\frac{5}{2} - \frac{3}{2}a, \frac{1}{2} + \frac{1}{2}a, a)\)。由于 \(a\) 可以取任何实数,所以该系统有无穷多解。
3. 几何解释#
线性方程组的几何意义为我们提供了强大的直观。
直观解释:
- 在二维空间 (\(\mathbb{R}^2\))中,一个关于 \(x_1, x_2\) 的线性方程(如 \(ax_1 + bx_2 = c\))代表一条直线。
- 在三维空间 (\(\mathbb{R}^3\))中,一个关于 \(x_1, x_2, x_3\) 的线性方程代表一个平面。
求解一个线性方程组,在几何上等价于寻找所有这些线(或面)的公共交点。
几何上的三种可能性:
- 唯一解:所有线(或面)交于一个点。
- 无解:线(或面)之间存在平行情况,导致它们没有公共交点。
- 无穷多解:线(或面)重合,交集是一条线、一个平面或更高维度的空间。

Figure 2.3: 展示两条直线相交于一点,作为唯一解的几何诠释
4. 迈向紧凑表示:矩阵#
当方程数量和未知数增多时,上面的写法显得非常累赘。我们需要一种更紧凑、更强大的表示方法。我们可以将系数 \(a_{ij}\) 收集起来,形成一个矩阵 (matrix),将未知数 \(x_j\) 和常数项 \(b_i\) 分别收集起来,形成向量 (vectors)。
原始的方程组:
$$ a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = b_1 \\ \vdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n = b_m $$可以被优雅地重写为:
$$ x_1 \begin{bmatrix} a_{11} \\ a_{21} \\ \vdots \\ a_{m1} \end{bmatrix} + x_2 \begin{bmatrix} a_{12} \\ a_{22} \\ \vdots \\ a_{m2} \end{bmatrix} + \cdots + x_n \begin{bmatrix} a_{1n} \\ a_{2n} \\ \vdots \\ a_{mn} \end{bmatrix} = \begin{bmatrix} b_1 \\ b_2 \\ \vdots \\ b_m \end{bmatrix} $$这个视角非常重要:整个方程组可以看作是寻找一组标量 \(x_1, \dots, x_n\) 去线性组合一组列向量,以得到目标向量。
最终,我们可以写成最紧凑的形式:
$$ \boldsymbol{A}\boldsymbol{x} = \boldsymbol{b} $$- 变量说明:
- \(\boldsymbol{A}\) 是一个 \(m \times n\) 的系数矩阵。
- \(\boldsymbol{x}\) 是一个 \(n \times 1\) 的未知数向量。
- \(\boldsymbol{b}\) 是一个 \(m \times 1\) 的常数向量。
理解要点#
线性方程组的核心,无论是代数上还是几何上,都是关于相交和组合。\(A\boldsymbol{x}=\boldsymbol{b}\) 这种形式不仅简洁,更揭示了线性代数的本质:将问题转化为对矩阵和向量这两种结构化对象的操作。
本节知识点总结#
- 线性方程组:由多个线性方程构成的系统,是许多实际问题的数学模型。
- 解的三种形态:无解(不相容)、唯一解、无穷多解。
- 几何直观:解是 \(n\) 维空间中 \(m\) 个超平面(线、面等)的交集。
- 核心代数表示:可以紧凑地表示为矩阵向量乘积的形式 \(\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}\)。
- 重要视角:求解 \(\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}\) 等价于寻找一个对矩阵 \(\boldsymbol{A}\) 的列向量的线性组合,使其等于向量 \(\boldsymbol{b}\)。