二次型这部分,很多人觉得头疼。公式多,概念绕,还跟前面的特征值、特征向量搅和在一起。但其实你把它想明白了,它就是线性代数这门课的“大结局”,把前面的知识串起来了。考试里它通常是个大题,分值不低,啃下来很划算。
咱们先说二次型到底是啥。说白了,它就是一个关于多个变量的二次齐次多项式。比如 f(x1, x2) = x1^2 + 2x1x2 + 3x2^2
这种。考试不会让你就看着这个多项式发呆,第一步永远是让你把它写成矩阵形式,也就是 x^T A x
。
这个 A
矩阵怎么写?这是最基础的一步,错了后面全完。记住两点:
1. 主对角线上的元素,就是 xi^2
项的系数。
2. 非主对角线上的元素 aij
(第i行第j列),等于 xi*xj
这一项系数的一半。而且这个矩阵必须是对称的,所以 aij
和 aji
是一样的。
举个例子:f(x1, x2, x3) = x1^2 + 2x2^2 + 3x3^2 + 4x1x2 - 6x1x3 + 8x2x3
对应的矩阵 A
就是:
第一行: [1, 2, -3]
(1是x1^2系数,2是4的一半,-3是-6的一半)
第二行: [2, 2, 4]
(2是x2^2系数,2是4的一半,4是8的一半)
第三行: [ -3, 4, 3]
(3是x3^2系数,-3是-6的一半,4是8的一半)
你看,这个 A
是不是一个对称矩阵?这一步是基本功,必须滚瓜烂熟。
写出矩阵A之后,二次型这部分的核心任务就来了:化二次型为标准型。
标准型就是只含有平方项的二次型,比如 y1^2 + 5y2^2 - 2y3^2
这种,没有 y1y2
这样的交叉项。为什么要做这一步?因为标准型能让我们一眼就看出这个二次型的“性质”,比如它是不是恒大于零。
怎么化成标准型?考研主要就两种方法。
方法一:配方法
这个方法名字听着就像初中数学,做起来也差不多。就是硬凑,把交叉项都凑到完全平方里去。
还是用刚才那个例子 f = x1^2 + 4x1x2 - 6x1x3 + ...
1. 先把所有含 x1
的项都抓出来:x1^2 + 4x1x2 - 6x1x3
。
2. 把它配方,凑成 (x1 + 2x2 - 3x3)^2
。但你展开这个平方,会多出来 4x2^2 + 9x3^2 - 12x2x3
这些项。
3. 所以在原式里,你得把这些多出来的项减掉。
4. 然后对剩下的只含 x2, x3
的项,重复这个过程。
最后,你就能得到类似 ( ... )^2 + ( ... )^2 + ( ... )^2
的形式。
令 y1 = ( ... )
,y2 = ( ... )
,y3 = ( ... )
,这就成了标准型。
配方法的好处是直观,计算量可能不大。但它的缺点也很明显,如果第一项 x1^2
的系数是0,你就没法直接配了,得先做个变量代换,比如令 x1 = z1+z2
之类的,把平方项凑出来,很麻烦。考研数学题一般设计得比较巧,不会在这种地方卡你,但你得知道有这么个坑。
方法二:正交变换法
这是考试的重点,也是更“高级”的方法。它把二次型和特征值、特征向量完美结合。逻辑是这样的:任何一个二次型 x^T A x
,我都能找到一个正交替换 x = Py
,把它变成一个标准型 y^T Λ y
。
这个 P
是什么?它是由矩阵 A
的标准正交化的特征向量构成的正交矩阵。
这个 Λ
是什么?它是一个对角矩阵,对角线上的元素正好就是矩阵 A
的所有特征值。
所以,用这个方法的步骤非常清晰:
1. 写出二次型的对称矩阵 A
。
2. 求出 A
的所有特征值 λ1, λ2, ..., λn
。
3. 标准型直接就写出来了:λ1*y1^2 + λ2*y2^2 + ... + λn*yn^2
。
就这么简单。如果题目只要求你写出标准型,到这一步就结束了。
但如果题目还要求你写出那个正交变换 x = Py
,那你还得继续:
4. 求出每个特征值对应的特征向量。
5. 如果一个特征值对应多个特征向量(也就是重根的情况),这些特征向量需要先做施密特正交化。
6. 把所有特征向量都单位化。
7. 最后把这些标准正交的特征向量作为列向量,拼成正交矩阵 P
。
这个方法计算量大,求特征值、求特征向量、正交化、单位化,一步都不能错。但它的逻辑非常清晰,而且威力巨大。它告诉你,二次型的标准型本质上是由其矩阵的特征值决定的。
现在我们知道了怎么化标准型,那么化完之后干嘛用?这就引出了二次型里最常考的应用:判断正定性。
一个二次型 f(x)
,如果对任何不为零的 x
,都有 f(x) > 0
,那它就是正定的。说白了就是,这个函数是不是永远取正值。
怎么判断?有几个等价条件,你必须像记乘法口诀一样记住它们。假设二次型的矩阵是 A
:
1. A的所有特征值都大于0。这是最直观的。你想,标准型是 λ1*y1^2 + ...
,如果所有 λ
都大于0,那只要 y
不全为0,结果肯定大于0。
2. A的各阶顺序主子式全大于0。这是考试中最快、最好用的方法。什么是顺序主子式?就是从 A
的左上角开始,依次取1×1, 2×2, 3×3, … , nxn的子矩阵,算它们的行列式。比如一个3×3矩阵 A
,它的顺序主子式就是 |a11|
,|[a11, a12; a21, a22]|
,和 |A|
本身。如果这三个行列式都大于0,那 A
就是正定的。
3. 二次型的标准型里,所有项的系数都为正(也就是说,正惯性指数等于n)。
这三个条件是等价的。考试时,题目如果只问你“判断正定性”,或者“当k为何值时,二次型正定”,你第一时间就应该想到用“顺序主子式”这个方法。因为它只用算几个行列式,比求全部特征值快多了。
除了正定,还有负定(所有特征值<0)、半正定(所有特征值>=0)、不定(特征值有正有负)等。负定的判断方法类似:奇数阶顺序主子式为负,偶数阶顺序主子式为正。
总结一下考研复习的思路:
第一,搞清楚二次型和对称矩阵的对应关系,会写矩阵 A
。
第二,掌握两种化标准型的方法。配方法要会,但重点是正交变换法,因为这关系到特征值。
第三,背熟判断正定性的几个等价条件,特别是顺序主子式法,这是快速解题的武器。
第四,多做题。二次型的计算不难,但步骤多,容易错。求特征值算错一个数,整个题就没了。把计算练熟,速度和准确率才能上去。
二次型这部分就是这样,看着吓人,其实就是把前面矩阵、行列式、特征值这些东西打包起来用一下。它的逻辑链条很清晰,只要你把每个环节都搞懂,分数就稳了。
评论前必须登录!
立即登录 注册