线性代数实战：3种常见二次型配方法详解（附可逆变换证明）

最新推荐文章于 2026-07-01 17:17:40 发布

原创

最新推荐文章于 2026-07-01 17:17:40 发布 · 408 阅读

线性代数实战：3种常见二次型配方法详解（附可逆变换证明）

很多工程师和学生在初次接触二次型标准化时，都会产生一个根本性的困惑：为什么用配方法捣鼓半天，最后总能找到一个可逆的线性变换，把一堆交叉项整理成干净利落的平方和？课本上的定理告诉你“一定可以”，但看着配方过程中变量时有时无，甚至凭空出现又消失，心里总是不踏实。这种感觉，就像你知道魔术师一定能从帽子里变出兔子，但更想亲眼看看帽子的构造。这篇文章，我们就来当一回拆解魔术的工程师，抛开抽象的理论证明，直接上手三种最具代表性的二次型，一步步操作，看看那个“可逆变换”的矩阵究竟是如何从配方步骤中自然“长”出来的，以及当配方遇到“意外”（比如平方项系数为零）时，我们如何巧妙地“兜底”，确保变换始终可逆。

1. 从工程视角理解二次型与可逆变换

在信号处理、优化算法和机器学习中，我们经常需要分析一个多元二次函数的形式。比如，一个机器学习模型的损失函数在某个点附近，就可以用二次型来近似。将其化为标准型（即只有平方项，没有交叉项），能让我们一眼看出该函数的“形状”——是像一口锅（正定），还是一个马鞍（不定）——这对于判断最优解的性质至关重要。

配方法，本质上是一种通过配方消去交叉项的代数操作。但它的高级之处在于，每一步配方都对应着一个线性变量替换。当我们完成所有配方，将这些替换关系组合起来，就得到了一个从原始变量 x 到新变量 y 的线性变换 x = Cy。核心问题来了：我们随手写出的这个 C，凭什么一定是可逆的？如果 C 不可逆，意味着 y 无法完整代表 x，信息丢失了，这个标准化也就失去了意义。

注意：可逆性保证了变换是“无损”的。在物理或工程问题中，变量通常代表有实际意义的坐标或状态，可逆变换意味着新旧坐标系之间可以自由、唯一地转换，不会丢失任何维度信息。

从工程思维看，配方法构造可逆变换的“保险”在于其过程的可控性。它就像一套标准化的装配流程，即便中途遇到“零件缺失”（如某个平方项系数为零），我们也有预设的补救方案（如补充一个恒等变换），确保最终产出的变换矩阵 C 是一个满秩的三角矩阵或其组合，而三角矩阵的可逆性判断极其简单——主对角线元素全不为零即可。下面，我们就用三个逐渐进阶的案例，来演示这套流程的具体操作与内在逻辑。

2. 案例一：标准流程——含平方项的二次型

我们先从一个最“规矩”的例子开始，所有平方项系数均不为零。考虑二次型： f(x1, x2, x3) = 2x1² + 3x2² + 5x3² + 4x1x2 - 8x2x3 - 4x3x1

我们的目标是通过配方，将其化为 d1*y1² + d2*y2² + d3*y3² 的形式。

第一步：聚焦第一个变量 x1 将所有包含 x1 的项集中起来： 2x1² + 4x1x2 - 4x1x3 提取 x1² 的系数 2，进行配方： 2 [ x1² + 2x1*(x2 - x3) ] 要配成完全平方，需要加上 (x2 - x3)²，再减去它： 2 [ x1² + 2x1*(x2 - x3) + (x2 - x3)² - (x2 - x3)² ] = 2(x1 + x2 - x3)² - 2(x2 - x3)² 将配方结果代回原式，整理： f = 2(x1 + x2 - x3)² - 2(x2 - x3)² + 3x2² + 5x3² - 8x2x3 = 2(x1 + x2 - x3)² + (3x2² - 2x2²) + (5x3² - 2x3²) + (-8x2x3 + 4x2x3) （合并同类项） = 2(x1 + x2 - x3)² + x2² + 3x3² - 4x2x3