相似矩阵一定是合同矩阵吗-七点爱学

不是。

斩钉截铁地回答：相似矩阵不一定是合同矩阵。

这俩兄弟，长得是有点像，都用一个矩阵 P 从两边夹着 A，一个变成了 P⁻¹AP，另一个变成了 PᵀAP。但骨子里，一个是戴着逆矩阵 P⁻¹ 的面具，另一个是披着转置矩阵 Pᵀ 的斗篷。就这么一点差别，导致它们的出身、使命、看待世界的角度，完全是两码事。差之毫厘，谬以千里。

要真正搞懂这事儿，就不能只背公式。你得潜下去，看看它们各自在什么样的“场景”里混。

我们先聊聊相似（Similarity）。这玩意儿，说白了，是同一个线性变换在不同坐标系下的不同“马甲”。

想象一下，你就是那个线性变换，一个能把空间里的向量拉伸、旋转、剪切的魔法师。矩阵 A，就是在“标准坐标系”（就是我们最熟悉的那种横平竖直的网格）下，对你这个魔法的一份操作说明书。现在，来了一个新坐标系，网格可能是斜的，单位长度也可能变了。那么，同一个魔法，在这套新网格下的操作说明书，自然也就变了，变成了矩阵 B。而那个 P 矩阵，就是负责在新旧坐标系之间来回“翻译”的密码本。B = P⁻¹AP 这个过程，本质上就是在说：先把新坐标系下的向量用 P 翻译回老坐标系，然后用老说明书 A 施展魔法，最后再用 P⁻¹ 把结果翻译回新坐标系。

整个过程，换汤不换药。那个“魔法”的本质没变。所以，相似关系死死守护的东西，是线性变换内在的、不随坐标系改变而改变的属性。什么属性最重要？特征值（Eigenvalues）！特征值，就是这个变换的灵魂，是它内在的、不变的拉伸因子。一个向量扔进去，被拉伸了多少倍，这个“倍数”就是特征值。无论你怎么换坐标系看它，这个灵魂是不会变的。所以，相似变换的核心在于保特征值，以及由特征值衍生出来的一系列东西，比如行列式（所有特征值的乘积）、迹（所有特征值的和）、特征多项式等等。两个矩阵如果相似，它们的“内在性格”——特征值，必须一模一样。

好，现在镜头转向合同（Congruence）。这家伙的舞台，不在于线性变换，而在于二次型（Quadratic Form）。

二次型是什么？别被名字吓到。你肯定见过 f(x, y) = ax² + bxy + cy² 这种东西，它就是个二次型。它可以被写成矩阵的形式：XᵀAX，其中 X 是向量 [x, y]ᵀ，A 是一个对称矩阵。

你看，这儿出现了 Xᵀ 和 A。这说明二次型天生就和转置有关系。它描述的是什么呢？你可以把它想象成一个描述“能量”或者“曲面形状”的函数。比如，在某个物理系统里，XᵀAX 可能代表在状态 X 下的总能量。现在，我们也想换个坐标系（比如换一套测量基准），用 Y 来表示状态，X=PY。那么，原来的能量表达式就变成了 (PY)ᵀA(PY) = Yᵀ(PᵀAP)Y。

看到了吗？PᵀAP 就这么自然地登场了。这里的 B = PᵀAP，就是同一个二次型，在新的坐标系下的表达。它守护的东西，和相似变换完全不同。它不关心特征值是不是一样，它关心的是“形状”的本质有没有变。什么叫形状的本质？比如一个椭球，你把坐标轴旋转一下，或者拉伸一下，它可能变成一个更扁或者更长的椭球，但它不会变成一个马鞍面（双曲抛物面）。这种“是椭球还是马鞍面”的性质，就是由二次型的正负惯性指数决定的。所谓正负惯性指数，就是二次型化成标准型（只有平方项）后，系数为正的项有几个，系数为负的项有几个。合同变换的核心，是保持二次型的正负惯性指数不变。这被称为西尔维斯特定理（Sylvester’s Law of Inertia），是合同变换的“宪法”。

所以，你看：
– 相似关心的是线性变换，它的灵魂是特征值，它的工具是 P⁻¹。
– 合同关心的是二次型，它的灵魂是正负惯性指数，它的工具是 Pᵀ。

一个关心“变换的内在动力”，一个关心“形态的内在结构”。风马牛不相及。

来个实例，一巴掌拍醒还在犯迷糊的同学。
设矩阵 A = [[1, 2], [0, 1]]。它的特征值是 1 和 1。
再设一个可逆矩阵 P = [[1, 1], [0, 1]]。我们来算算它的相似矩阵和合同矩阵。

P 的逆 P⁻¹ = [[1, -1], [0, 1]]。
P 的转置 Pᵀ = [[1, 0], [1, 1]]。

相似矩阵 B_sim = P⁻¹AP = [[1, -1], [0, 1]] * [[1, 2], [0, 1]] * [[1, 1], [0, 1]] = [[1, 1], [0, 1]]。
注意，B_sim 的特征值也是 1 和 1，和 A 一样。这验证了我们前面的说法。

合同矩阵 B_con = PᵀAP = [[1, 0], [1, 1]] * [[1, 2], [0, 1]] * [[1, 1], [0, 1]] = [[1, 3], [1, 5]]。
这个 B_con 的特征值是多少？你算一下它的特征多项式 (1-λ)(5-λ) - 3 = λ² - 6λ + 2 = 0，解出来是 3 ± sqrt(7)。
看到了吗？B_con 的特征值和 A 的完全不一样！
所以，A 和 B_con 根本不相似。
这就提供了一个铁证：A 与 B_con 是合同的，但它们显然不相似。因此，合同矩阵不一定是相似矩阵。

反过来呢？相似矩阵一定是合同矩阵吗？
我们看 A = [[1, 2], [0, 1]] 和 B_sim = [[1, 1], [0, 1]]，它俩相似。但它俩合同吗？
这就要看它们的二次型 x² + 2xy + y² 和 x² + xy + y² 是否合同。对于非对称矩阵，我们通常会先将其对称化来研究其关联的二次型。但即便不这么做，我们也可以直接从定义出发。如果它们合同，就需要存在一个可逆矩阵 Q，使得 B_sim = QᵀAQ。这个问题就变得复杂了。但我们可以找到更简单的反例。

比如 A = [[-1, 0], [0, -1]] 和 B = [[-1, 6], [0, -1]]。A 和 B 相似吗？不相似，因为 A 可以对角化，而 B 不能（它是个有非零元素的Jordan块）。但它们都对应于负定的二次型（如果考虑对称部分），可能合同。这个例子不好。

换个思路：一个相似关系 B = P⁻¹AP，我们问 B 和 A 是否合同。这等价于问，是否存在某个 Q 使得 B = QᵀAQ。
除非 P⁻¹ 恰好等于某个 Qᵀ，否则我们没有任何理由相信这是成立的。

那么，什么时候这俩概念能握手言和，甚至合二为一呢？
答案就藏在那个 P 矩阵里。
如果，我是说如果，这个过渡矩阵 P 是一个正交矩阵（Orthogonal Matrix），奇迹就发生了。
对于正交矩阵，我们有一个极其优美的性质：P⁻¹ = Pᵀ。它的逆就是它的转置！
在这种特殊情况下，P⁻¹AP 就等于 PᵀAP。
这意味着，通过一个正交变换，得到的相似矩阵，同时也是合同矩阵。
这通常发生在哪里？实对称矩阵的对角化！
一个实对称矩阵 A，我们总能找到一个正交矩阵 P，使得 P⁻¹AP = PᵀAP = D，其中 D 是一个对角矩阵，对角元就是 A 的特征值。
这就是为什么实对称矩阵的对角化那么美妙，因为你可以用一个正交矩阵来同时完成相似和合同的对角化，一步到位，干净利落。此时，特征值和二次型的系数（在标准型下）达成了统一。

所以你看，“相似”和“合同”这两个概念的分野，绝不是数学家为了折磨学生凭空捏造的，它背后是几何与代数的深刻分野：一个是研究变换本身的性质，一个是研究度量和形态的性质。一个是动态的“操作”，一个是静态的“形状”。除非你的变换工具（那个矩阵P）本身具有非常好的几何性质（比如是正交的，只旋转不形变），否则这两个世界通常是各走各的路，互不相干。理解了这一点，你才算真正走进了线性代数的殿堂，而不仅仅是在门口计算行列式和逆矩阵。

相似矩阵一定是合同矩阵吗

相关推荐

评论抢沙发

评论前必须登录！

猜你喜欢

最新

相关推荐

评论 抢沙发

评论前必须登录！

猜你喜欢

最新

评论抢沙发