不是。
斩钉截铁地回答:相似矩阵不一定是合同矩阵。
这俩兄弟,长得是有点像,都用一个矩阵 P 从两边夹着 A,一个变成了 P⁻¹AP
,另一个变成了 PᵀAP
。但骨子里,一个是戴着逆矩阵 P⁻¹
的面具,另一个是披着转置矩阵 Pᵀ
的斗篷。就这么一点差别,导致它们的出身、使命、看待世界的角度,完全是两码事。差之毫厘,谬以千里。
要真正搞懂这事儿,就不能只背公式。你得潜下去,看看它们各自在什么样的“场景”里混。
我们先聊聊相似(Similarity)。这玩意儿,说白了,是同一个线性变换在不同坐标系下的不同“马甲”。
想象一下,你就是那个线性变换,一个能把空间里的向量拉伸、旋转、剪切的魔法师。矩阵 A,就是在“标准坐标系”(就是我们最熟悉的那种横平竖直的网格)下,对你这个魔法的一份操作说明书。现在,来了一个新坐标系,网格可能是斜的,单位长度也可能变了。那么,同一个魔法,在这套新网格下的操作说明书,自然也就变了,变成了矩阵 B。而那个 P 矩阵,就是负责在新旧坐标系之间来回“翻译”的密码本。B = P⁻¹AP
这个过程,本质上就是在说:先把新坐标系下的向量用 P 翻译回老坐标系,然后用老说明书 A 施展魔法,最后再用 P⁻¹
把结果翻译回新坐标系。
整个过程,换汤不换药。那个“魔法”的本质没变。所以,相似关系死死守护的东西,是线性变换内在的、不随坐标系改变而改变的属性。什么属性最重要?特征值(Eigenvalues)!特征值,就是这个变换的灵魂,是它内在的、不变的拉伸因子。一个向量扔进去,被拉伸了多少倍,这个“倍数”就是特征值。无论你怎么换坐标系看它,这个灵魂是不会变的。所以,相似变换的核心在于保特征值,以及由特征值衍生出来的一系列东西,比如行列式(所有特征值的乘积)、迹(所有特征值的和)、特征多项式等等。两个矩阵如果相似,它们的“内在性格”——特征值,必须一模一样。
好,现在镜头转向合同(Congruence)。这家伙的舞台,不在于线性变换,而在于二次型(Quadratic Form)。
二次型是什么?别被名字吓到。你肯定见过 f(x, y) = ax² + bxy + cy²
这种东西,它就是个二次型。它可以被写成矩阵的形式:XᵀAX
,其中 X
是向量 [x, y]ᵀ
,A 是一个对称矩阵。
你看,这儿出现了 Xᵀ
和 A
。这说明二次型天生就和转置有关系。它描述的是什么呢?你可以把它想象成一个描述“能量”或者“曲面形状”的函数。比如,在某个物理系统里,XᵀAX
可能代表在状态 X 下的总能量。现在,我们也想换个坐标系(比如换一套测量基准),用 Y
来表示状态,X=PY
。那么,原来的能量表达式就变成了 (PY)ᵀA(PY) = Yᵀ(PᵀAP)Y
。
看到了吗?PᵀAP
就这么自然地登场了。这里的 B = PᵀAP
,就是同一个二次型,在新的坐标系下的表达。它守护的东西,和相似变换完全不同。它不关心特征值是不是一样,它关心的是“形状”的本质有没有变。什么叫形状的本质?比如一个椭球,你把坐标轴旋转一下,或者拉伸一下,它可能变成一个更扁或者更长的椭球,但它不会变成一个马鞍面(双曲抛物面)。这种“是椭球还是马鞍面”的性质,就是由二次型的正负惯性指数决定的。所谓正负惯性指数,就是二次型化成标准型(只有平方项)后,系数为正的项有几个,系数为负的项有几个。合同变换的核心,是保持二次型的正负惯性指数不变。这被称为西尔维斯特定理(Sylvester’s Law of Inertia),是合同变换的“宪法”。
所以,你看:
– 相似关心的是线性变换,它的灵魂是特征值,它的工具是 P⁻¹
。
– 合同关心的是二次型,它的灵魂是正负惯性指数,它的工具是 Pᵀ
。
一个关心“变换的内在动力”,一个关心“形态的内在结构”。风马牛不相及。
来个实例,一巴掌拍醒还在犯迷糊的同学。
设矩阵 A = [[1, 2], [0, 1]]
。它的特征值是 1 和 1。
再设一个可逆矩阵 P = [[1, 1], [0, 1]]
。我们来算算它的相似矩阵和合同矩阵。
P
的逆 P⁻¹ = [[1, -1], [0, 1]]
。
P
的转置 Pᵀ = [[1, 0], [1, 1]]
。
相似矩阵 B_sim = P⁻¹AP = [[1, -1], [0, 1]] * [[1, 2], [0, 1]] * [[1, 1], [0, 1]] = [[1, 1], [0, 1]]
。
注意,B_sim
的特征值也是 1 和 1,和 A 一样。这验证了我们前面的说法。
合同矩阵 B_con = PᵀAP = [[1, 0], [1, 1]] * [[1, 2], [0, 1]] * [[1, 1], [0, 1]] = [[1, 3], [1, 5]]
。
这个 B_con
的特征值是多少?你算一下它的特征多项式 (1-λ)(5-λ) - 3 = λ² - 6λ + 2 = 0
,解出来是 3 ± sqrt(7)
。
看到了吗?B_con
的特征值和 A 的完全不一样!
所以,A 和 B_con
根本不相似。
这就提供了一个铁证:A 与 B_con
是合同的,但它们显然不相似。因此,合同矩阵不一定是相似矩阵。
反过来呢?相似矩阵一定是合同矩阵吗?
我们看 A = [[1, 2], [0, 1]]
和 B_sim = [[1, 1], [0, 1]]
,它俩相似。但它俩合同吗?
这就要看它们的二次型 x² + 2xy + y²
和 x² + xy + y²
是否合同。对于非对称矩阵,我们通常会先将其对称化来研究其关联的二次型。但即便不这么做,我们也可以直接从定义出发。如果它们合同,就需要存在一个可逆矩阵 Q,使得 B_sim = QᵀAQ
。这个问题就变得复杂了。但我们可以找到更简单的反例。
比如 A = [[-1, 0], [0, -1]]
和 B = [[-1, 6], [0, -1]]
。A 和 B 相似吗?不相似,因为 A 可以对角化,而 B 不能(它是个有非零元素的Jordan块)。但它们都对应于负定的二次型(如果考虑对称部分),可能合同。这个例子不好。
换个思路:一个相似关系 B = P⁻¹AP
,我们问 B 和 A 是否合同。这等价于问,是否存在某个 Q 使得 B = QᵀAQ
。
除非 P⁻¹
恰好等于某个 Qᵀ
,否则我们没有任何理由相信这是成立的。
那么,什么时候这俩概念能握手言和,甚至合二为一呢?
答案就藏在那个 P 矩阵里。
如果,我是说如果,这个过渡矩阵 P 是一个正交矩阵(Orthogonal Matrix),奇迹就发生了。
对于正交矩阵,我们有一个极其优美的性质:P⁻¹ = Pᵀ
。它的逆就是它的转置!
在这种特殊情况下,P⁻¹AP
就等于 PᵀAP
。
这意味着,通过一个正交变换,得到的相似矩阵,同时也是合同矩阵。
这通常发生在哪里?实对称矩阵的对角化!
一个实对称矩阵 A,我们总能找到一个正交矩阵 P,使得 P⁻¹AP = PᵀAP = D
,其中 D 是一个对角矩阵,对角元就是 A 的特征值。
这就是为什么实对称矩阵的对角化那么美妙,因为你可以用一个正交矩阵来同时完成相似和合同的对角化,一步到位,干净利落。此时,特征值和二次型的系数(在标准型下)达成了统一。
所以你看,“相似”和“合同”这两个概念的分野,绝不是数学家为了折磨学生凭空捏造的,它背后是几何与代数的深刻分野:一个是研究变换本身的性质,一个是研究度量和形态的性质。一个是动态的“操作”,一个是静态的“形状”。除非你的变换工具(那个矩阵P)本身具有非常好的几何性质(比如是正交的,只旋转不形变),否则这两个世界通常是各走各的路,互不相干。理解了这一点,你才算真正走进了线性代数的殿堂,而不仅仅是在门口计算行列式和逆矩阵。
评论前必须登录!
立即登录 注册