跳过正文
线性代数:线性方程组
  1. Blog/

线性代数:线性方程组

·2011 字·5 分钟
目录
线性代数 - 这篇文章属于一个选集。
§ 2: 本文

我们从线性代数最基本也是最经典的问题开始:求解线性方程组。许多复杂的科学和工程问题,经过数学建模后,最终都会归结为求解一个大规模的线性方程组。理解它,是通往线性代数抽象世界的第一扇门。

1. 从实际问题到数学模型
#

应用场景

考虑一个生产计划问题(例 2.1): 一家公司生产 \(n\) 种产品 \(N_1, \dots, N_n\),需要消耗 \(m\) 种资源 \(R_1, \dots, R_m\)。

  • 已知
    • 生产一个单位的产品 \(N_j\) 需要消耗 \(a_{ij}\) 个单位的资源 \(R_i\)。
    • 资源 \(R_i\) 的总供应量为 \(b_i\)。
  • 目标
    • 找到一个最优生产计划,即每种产品 \(N_j\) 应该生产多少个单位,记为 \(x_j\),恰好能用完所有资源。

要消耗完所有资源 \(R_i\),那么生产所有产品对该资源的总消耗量必须等于其总供应量 \(b_i\)。对于第 \(i\) 种资源,我们有:

$$ a_{i1}x_1 + a_{i2}x_2 + \dots + a_{in}x_n = b_i $$

这里,\(a_{i1}x_1\) 是生产 \(x_1\) 单位产品 \(N_1\) 所需资源 \(R_i\) 的量,以此类推。由于我们有 \(m\) 种资源,我们就得到了 \(m\) 个这样的方程。

2. 线性方程组的定义与解
#

准确的数学定义

将上述问题泛化,我们就得到了一个由 \(m\) 个方程和 \(n\) 个未知数组成的线性方程组 (system of linear equations)

$$ \begin{align*} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n &= b_1 \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n &= b_2 \\ \vdots \qquad & \qquad \vdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n &= b_m \end{align*} $$
  • 变量说明
    • \(x_1, x_2, \dots, x_n\) 是未知数 (unknowns)
    • \(a_{ij}\) 是第 \(i\) 个方程中第 \(j\) 个未知数的系数 (coefficients)
    • \(b_i\) 是第 \(i\) 个方程的常数项 (constant terms)

一个满足该系统中所有方程的 \(n\) 元组 \((\boldsymbol{x_1, \dots, x_n})\) 被称为该线性方程组的一个解 (solution)

数值示例:解的三种可能性

一个线性方程组的解集可能有三种情况:

  1. 无解 (No solution):系统内存在矛盾的方程。 例如,对于系统 (2.4):

    $$ \begin{align*} x_1 + x_2 + x_3 &= 3 \quad &(1) \\ x_1 - x_2 + 2x_3 &= 2 \quad &(2) \\ 2x_1 \qquad + 3x_3 &= 1 \quad &(3) \end{align*} $$

    将方程 (1) 和 (2) 相加,我们得到 \(2x_1 + 3x_3 = 5\)。这与方程 (3) 的 \(2x_1 + 3x_3 = 1\) 直接矛盾。因此,该系统无解。我们称这样的系统为不相容的 (inconsistent)

  2. 唯一解 (Exactly one solution):系统提供的信息不多不少,刚好能确定所有未知数。 例如,系统 (2.5) 经计算可得唯一解 \((1, 1, 1)\)。

    $$ \begin{align*}x_1 + x_2 + x_3 &= 3 \quad (1) \\x_1 - x_2 + 2x_3 &= 2 \quad (2) \\x_2 + x_3 &= 2 \quad (3)\end{align*} $$
  3. 无穷多解 (Infinitely many solutions):系统中的方程存在冗余,无法唯一确定所有未知数。 例如,对于系统 (2.6):

    $$ \begin{align*} x_1 + x_2 + x_3 &= 3 \quad &(1) \\ x_1 - x_2 + 2x_3 &= 2 \quad &(2) \\ 2x_1 \qquad + 3x_3 &= 5 \quad &(3) \end{align*} $$

    我们发现方程 (3) 恰好是 (1) 和 (2) 的和,它没有提供任何新信息,是冗余的 (redundant)。我们可以引入一个自由变量 (free variable),比如令 \(x_3 = a \in \mathbb{R}\)。然后用 \(a\) 来表示其他变量,得到一组解:\((\frac{5}{2} - \frac{3}{2}a, \frac{1}{2} + \frac{1}{2}a, a)\)。由于 \(a\) 可以取任何实数,所以该系统有无穷多解。

3. 几何解释
#

线性方程组的几何意义为我们提供了强大的直观。

  • 直观解释

    • 在二维空间 (\(\mathbb{R}^2\))中,一个关于 \(x_1, x_2\) 的线性方程(如 \(ax_1 + bx_2 = c\))代表一条直线
    • 在三维空间 (\(\mathbb{R}^3\))中,一个关于 \(x_1, x_2, x_3\) 的线性方程代表一个平面

    求解一个线性方程组,在几何上等价于寻找所有这些线(或面)的公共交点

  • 几何上的三种可能性

    • 唯一解:所有线(或面)交于一个点
    • 无解:线(或面)之间存在平行情况,导致它们没有公共交点。
    • 无穷多解:线(或面)重合,交集是一条线、一个平面或更高维度的空间。
    在
    Figure 2.3: 展示两条直线相交于一点,作为唯一解的几何诠释

4. 迈向紧凑表示:矩阵
#

当方程数量和未知数增多时,上面的写法显得非常累赘。我们需要一种更紧凑、更强大的表示方法。我们可以将系数 \(a_{ij}\) 收集起来,形成一个矩阵 (matrix),将未知数 \(x_j\) 和常数项 \(b_i\) 分别收集起来,形成向量 (vectors)

原始的方程组:

$$ a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = b_1 \\ \vdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n = b_m $$

可以被优雅地重写为:

$$ x_1 \begin{bmatrix} a_{11} \\ a_{21} \\ \vdots \\ a_{m1} \end{bmatrix} + x_2 \begin{bmatrix} a_{12} \\ a_{22} \\ \vdots \\ a_{m2} \end{bmatrix} + \cdots + x_n \begin{bmatrix} a_{1n} \\ a_{2n} \\ \vdots \\ a_{mn} \end{bmatrix} = \begin{bmatrix} b_1 \\ b_2 \\ \vdots \\ b_m \end{bmatrix} $$

这个视角非常重要:整个方程组可以看作是寻找一组标量 \(x_1, \dots, x_n\) 去线性组合一组列向量,以得到目标向量

最终,我们可以写成最紧凑的形式:

$$ \boldsymbol{A}\boldsymbol{x} = \boldsymbol{b} $$
  • 变量说明
    • \(\boldsymbol{A}\) 是一个 \(m \times n\) 的系数矩阵
    • \(\boldsymbol{x}\) 是一个 \(n \times 1\) 的未知数向量
    • \(\boldsymbol{b}\) 是一个 \(m \times 1\) 的常数向量

理解要点
#

线性方程组的核心,无论是代数上还是几何上,都是关于相交和组合。\(A\boldsymbol{x}=\boldsymbol{b}\) 这种形式不仅简洁,更揭示了线性代数的本质:将问题转化为对矩阵和向量这两种结构化对象的操作。


本节知识点总结
#

  • 线性方程组:由多个线性方程构成的系统,是许多实际问题的数学模型。
  • 解的三种形态:无解(不相容)、唯一解、无穷多解。
  • 几何直观:解是 \(n\) 维空间中 \(m\) 个超平面(线、面等)的交集。
  • 核心代数表示:可以紧凑地表示为矩阵向量乘积的形式 \(\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}\)。
  • 重要视角:求解 \(\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}\) 等价于寻找一个对矩阵 \(\boldsymbol{A}\) 的列向量的线性组合,使其等于向量 \(\boldsymbol{b}\)。
线性代数 - 这篇文章属于一个选集。
§ 2: 本文