好好学习
天天向上

相似矩阵一定是合同矩阵吗

不是。

斩钉截铁地回答:相似矩阵不一定是合同矩阵

这俩兄弟,长得是有点像,都用一个矩阵 P 从两边夹着 A,一个变成了 P⁻¹AP,另一个变成了 PᵀAP。但骨子里,一个是戴着逆矩阵 P⁻¹ 的面具,另一个是披着转置矩阵 Pᵀ 的斗篷。就这么一点差别,导致它们的出身、使命、看待世界的角度,完全是两码事。差之毫厘,谬以千里。

要真正搞懂这事儿,就不能只背公式。你得潜下去,看看它们各自在什么样的“场景”里混。

我们先聊聊相似(Similarity)。这玩意儿,说白了,是同一个线性变换在不同坐标系下的不同“马甲”。

想象一下,你就是那个线性变换,一个能把空间里的向量拉伸、旋转、剪切的魔法师。矩阵 A,就是在“标准坐标系”(就是我们最熟悉的那种横平竖直的网格)下,对你这个魔法的一份操作说明书。现在,来了一个新坐标系,网格可能是斜的,单位长度也可能变了。那么,同一个魔法,在这套新网格下的操作说明书,自然也就变了,变成了矩阵 B。而那个 P 矩阵,就是负责在新旧坐标系之间来回“翻译”的密码本。B = P⁻¹AP 这个过程,本质上就是在说:先把新坐标系下的向量用 P 翻译回老坐标系,然后用老说明书 A 施展魔法,最后再用 P⁻¹ 把结果翻译回新坐标系。

整个过程,换汤不换药。那个“魔法”的本质没变。所以,相似关系死死守护的东西,是线性变换内在的、不随坐标系改变而改变的属性。什么属性最重要?特征值(Eigenvalues)!特征值,就是这个变换的灵魂,是它内在的、不变的拉伸因子。一个向量扔进去,被拉伸了多少倍,这个“倍数”就是特征值。无论你怎么换坐标系看它,这个灵魂是不会变的。所以,相似变换的核心在于保特征值,以及由特征值衍生出来的一系列东西,比如行列式(所有特征值的乘积)、迹(所有特征值的和)、特征多项式等等。两个矩阵如果相似,它们的“内在性格”——特征值,必须一模一样。

好,现在镜头转向合同(Congruence)。这家伙的舞台,不在于线性变换,而在于二次型(Quadratic Form)。

二次型是什么?别被名字吓到。你肯定见过 f(x, y) = ax² + bxy + cy² 这种东西,它就是个二次型。它可以被写成矩阵的形式:XᵀAX,其中 X 是向量 [x, y]ᵀ,A 是一个对称矩阵。

你看,这儿出现了 XᵀA。这说明二次型天生就和转置有关系。它描述的是什么呢?你可以把它想象成一个描述“能量”或者“曲面形状”的函数。比如,在某个物理系统里,XᵀAX 可能代表在状态 X 下的总能量。现在,我们也想换个坐标系(比如换一套测量基准),用 Y 来表示状态,X=PY。那么,原来的能量表达式就变成了 (PY)ᵀA(PY) = Yᵀ(PᵀAP)Y

看到了吗?PᵀAP 就这么自然地登场了。这里的 B = PᵀAP,就是同一个二次型,在新的坐标系下的表达。它守护的东西,和相似变换完全不同。它不关心特征值是不是一样,它关心的是“形状”的本质有没有变。什么叫形状的本质?比如一个椭球,你把坐标轴旋转一下,或者拉伸一下,它可能变成一个更扁或者更长的椭球,但它不会变成一个马鞍面(双曲抛物面)。这种“是椭球还是马鞍面”的性质,就是由二次型的正负惯性指数决定的。所谓正负惯性指数,就是二次型化成标准型(只有平方项)后,系数为正的项有几个,系数为负的项有几个。合同变换的核心,是保持二次型的正负惯性指数不变。这被称为西尔维斯特定理(Sylvester’s Law of Inertia),是合同变换的“宪法”。

所以,你看:
相似关心的是线性变换,它的灵魂是特征值,它的工具是 P⁻¹
合同关心的是二次型,它的灵魂是正负惯性指数,它的工具是 Pᵀ

一个关心“变换的内在动力”,一个关心“形态的内在结构”。风马牛不相及。

来个实例,一巴掌拍醒还在犯迷糊的同学。
设矩阵 A = [[1, 2], [0, 1]]。它的特征值是 1 和 1。
再设一个可逆矩阵 P = [[1, 1], [0, 1]]。我们来算算它的相似矩阵和合同矩阵。

P 的逆 P⁻¹ = [[1, -1], [0, 1]]
P 的转置 Pᵀ = [[1, 0], [1, 1]]

相似矩阵 B_sim = P⁻¹AP = [[1, -1], [0, 1]] * [[1, 2], [0, 1]] * [[1, 1], [0, 1]] = [[1, 1], [0, 1]]
注意,B_sim 的特征值也是 1 和 1,和 A 一样。这验证了我们前面的说法。

合同矩阵 B_con = PᵀAP = [[1, 0], [1, 1]] * [[1, 2], [0, 1]] * [[1, 1], [0, 1]] = [[1, 3], [1, 5]]
这个 B_con 的特征值是多少?你算一下它的特征多项式 (1-λ)(5-λ) - 3 = λ² - 6λ + 2 = 0,解出来是 3 ± sqrt(7)
看到了吗?B_con 的特征值和 A 的完全不一样!
所以,A 和 B_con 根本不相似。
这就提供了一个铁证:A 与 B_con 是合同的,但它们显然不相似。因此,合同矩阵不一定是相似矩阵

反过来呢?相似矩阵一定是合同矩阵吗?
我们看 A = [[1, 2], [0, 1]]B_sim = [[1, 1], [0, 1]],它俩相似。但它俩合同吗?
这就要看它们的二次型 x² + 2xy + y²x² + xy + y² 是否合同。对于非对称矩阵,我们通常会先将其对称化来研究其关联的二次型。但即便不这么做,我们也可以直接从定义出发。如果它们合同,就需要存在一个可逆矩阵 Q,使得 B_sim = QᵀAQ。这个问题就变得复杂了。但我们可以找到更简单的反例。

比如 A = [[-1, 0], [0, -1]]B = [[-1, 6], [0, -1]]。A 和 B 相似吗?不相似,因为 A 可以对角化,而 B 不能(它是个有非零元素的Jordan块)。但它们都对应于负定的二次型(如果考虑对称部分),可能合同。这个例子不好。

换个思路:一个相似关系 B = P⁻¹AP,我们问 B 和 A 是否合同。这等价于问,是否存在某个 Q 使得 B = QᵀAQ
除非 P⁻¹ 恰好等于某个 Qᵀ,否则我们没有任何理由相信这是成立的。

那么,什么时候这俩概念能握手言和,甚至合二为一呢?
答案就藏在那个 P 矩阵里。
如果,我是说如果,这个过渡矩阵 P 是一个正交矩阵(Orthogonal Matrix),奇迹就发生了。
对于正交矩阵,我们有一个极其优美的性质:P⁻¹ = Pᵀ。它的逆就是它的转置!
在这种特殊情况下,P⁻¹AP 就等于 PᵀAP
这意味着,通过一个正交变换,得到的相似矩阵,同时也是合同矩阵
这通常发生在哪里?实对称矩阵的对角化
一个实对称矩阵 A,我们总能找到一个正交矩阵 P,使得 P⁻¹AP = PᵀAP = D,其中 D 是一个对角矩阵,对角元就是 A 的特征值。
这就是为什么实对称矩阵的对角化那么美妙,因为你可以用一个正交矩阵来同时完成相似和合同的对角化,一步到位,干净利落。此时,特征值和二次型的系数(在标准型下)达成了统一。

所以你看,“相似”和“合同”这两个概念的分野,绝不是数学家为了折磨学生凭空捏造的,它背后是几何与代数的深刻分野:一个是研究变换本身的性质,一个是研究度量和形态的性质。一个是动态的“操作”,一个是静态的“形状”。除非你的变换工具(那个矩阵P)本身具有非常好的几何性质(比如是正交的,只旋转不形变),否则这两个世界通常是各走各的路,互不相干。理解了这一点,你才算真正走进了线性代数的殿堂,而不仅仅是在门口计算行列式和逆矩阵。

赞(0)
未经允许不得转载:七点爱学 » 相似矩阵一定是合同矩阵吗

评论 抢沙发

评论前必须登录!

立即登录   注册