第5章 相似矩阵及二次型

§1 向量的内积、长度及正交性

定义1 设有n维向量

令$[x,y]=x_1y_1+x_2y_2+\dots+x_ny_n$,称为向量$x$与$y$的内积。

内积具有下列性质:

(i)$[x,y]=[y,x]$;

(ii)$[\lambda x,y]=\lambda[x,y]$;

(iii)$[x+y,z]=[x,z]+[y,z]$;

(iv)当$x=0$时,$[x,x]=0$;当$x\neq0$时,$[x,x]>0$。

施瓦茨(Schwarz)不等式$[x,y]^2\leq[x,x][y,y]$。

定义2 令$||x||=\sqrt{[x,x]}=\sqrt{x_1^2+x_2^2+\dots+x_n^2},||x||$称为n维向量$x$的长度(或范数)。

向量的长度具有下述性质:

(i)非负性 当$x\neq0$时,$||x||>0$;当$x=0$时,$||x||=0$;

(ii)齐次性 $||\lambda x||=|\lambda|||x||$;

当$x\neq0、y\neq0$时,$\theta=arccos\frac{[x,y]}{||x||||y||}$称为n维向量$x$与$y$的夹角。当$[x,y]=0$时,称向量$x$与$y$正交。

定理1 若n维向量$a_1,a_2,\dots,a_r$是一组两两正交的非零向量,则$a_1,a_2,\dots,a_r$线性无关。

定义3 设n维向量$e_1,e_2,\dots,e_r$是向量空间$V(V\subseteq\mathbb{R^n})$的一个基,如果$e_1,e_2,\dots,e_r$两两正交,且都是单位向量,则称$e_1,e_2,\dots,e_r$是$V$的一个标准正交基。

设$e_1,e_2,\dots,e_r$是标准正交集,则任意向量$a$都能由$e_1,e_2,\dots,e_r$线性表示,设为$a=\lambda_1e_1+\lambda_2e_2+\dots+\lambda_re_r,$为求其中系数,可用$e_i^T$左乘上式,有$e_i^Ta=\lambda_ie_i^Te_i=\lambda_i,$即$\lambda_i=e_i^Ta=[a,e_i],$这就是向量在标准正交基中的坐标计算公式。

可以用施密特(Schmidt)正交化方法把一个基标准正交化,取:

然后把它们单位化,即:

就是$V$的一个标准正交基。

定义4 如果n阶矩阵$A$满足$A^TA=E(即A^{-1}=A^T),$那么称$A​$为正交矩阵,简称正交阵。

方阵为正交矩阵的充分必要条件是列向量都是单位向量,且两两正交。

因为$A^TA=E与AA^T=E$等价,所以上述结论对行向量亦成立。

正交矩阵具有以下性质:

(i)若$A$为正交矩阵,则$A^{-1}=A^T$也是正交矩阵,且$|A|=1或(-1)$;

(ii)若$A$和$B$都是正交矩阵,则$AB$也是正交矩阵。

定义5 若$P$为正交矩阵,则线性变换$y=Px$称为正交变换。

设$y=Px$为正交变换,则有$||y||=\sqrt{y^Ty}=\sqrt{x^TP^TPx}=sqrt{x^Tx}=||x||$。

说明经正交变换线段长度不变。

§2 方阵的特征值与特征向量

定义6 设$A$是n阶矩阵,如果数$\lambda$和n维非零列向量$x$使关系式

成立,那么,这样的数$\lambda$称为矩阵$A$的特征值,非零向量$x$称为$A$的对应于特征值$\lambda$的特征向量。(1)式也可写成$(A-\lambda E)x=0$。它有非零解的充分必要条件是系数行列式$|A-\lambda E|=0$,称为矩阵$A$的特征方程,方程左端称为矩阵$A$的特征多项式。n阶矩阵在复数范围内有n个特征值。

设n阶矩阵$A=(a_{ij})​$的特征值为$\lambda_1,\lambda_2,\dots,\lambda_n,​$不难证明

(i)$\lambda1+\lambda_2+\dots+\lambda_n=a{11}+a{22}+\dots+a{nn}$;

(ii)$\lambda_1\lambda_2\dots\lambda_n=|A|$。

可知$A$是可逆矩阵的充要条件是n个特征值全不为零。

定理2 设$\lambda_1,\lambda_2,\dots,\lambda_m$是方阵$A$的m个特征值,$p_1,p_2,\dots,p_m$依次是与之对应的特征向量,如果$\lambda_1,\lambda_2,\dots,\lambda_m$各不相等,则$p_1,p_2,\dots,p_m$线性无关。

推论 设$\lambda_1$和$\lambda_2$是方阵的两个不同特征值,$\xi_1,\xi_2,\dots,\xi_s$和$\eta_1,\eta_2,\dots,\eta_t$分别是对应于$\lambda_1$和$\lambda_2$的线性无关的特征向量,则$\xi_1,\xi_2,\dots,\xi_s,\eta_1,\eta_2,\dots,\eta_t$线性无关。

§3 相似矩阵

定义7 设$A、B$都是n阶矩阵,若有可逆矩阵$P$使$P^{-1}AP=B$,则称$B$是$A$的相似矩阵,或说矩阵$A$与$B$相似。对$A$进行运算$P^{-1}AP$称为对$A$进行相似变换,可逆矩阵$P$称为把$A$变成$B$的相似变换矩阵。

定理3 若n阶矩阵$A$与$B$相似,则$A$与$B$的特征多项式相同,从而$A$与$B$特征值亦相同。

推论 若n阶矩阵$A$与对角矩阵

相似,则$\lambda_1,\lambda_2,\dots,\lambda_n​$即是$A​$的n个特征值

定理4 n阶矩阵$A$与对角矩阵相似(即$A$能对角化)的充分必要条件是$A$有n个线性无关的特征向量。

推论 如果n阶矩阵$A$的n个特征值互不相等,则$A$与对角矩阵相似。

§4 对称矩阵的对角化

性质1 对称矩阵的特征值为实数。

性质2 设$\lambda_1,\lambda_2$是对称矩阵$A$的两个特征值,$p_1,p_2$是对应的特征向量。若$\lambda_1\neq\lambda_2$,则$p_1$与$p_2$正交。

定理5 设$A$为n阶对称矩阵,则必有正交矩阵$P$,使$P^{-1}AP=P^TAP=\Lambda$,其中$\Lambda$是以$A$的n个特征值为对角元的对角矩阵。

推论 设$A$为n阶对称矩阵,$\lambda$是$A$的特征方程的k重根,则矩阵$A-\lambda E$的秩$R(A-\lambda E)=n-k$,从而对应特征值$\lambda$恰有k个线性无关的特征向量。

把对称矩阵$A$对角化的步骤:

(i)求出$A$的全部互不相等的特征值$\lambda_1,\lambda_2,\dots,\lambda_s,$他们的重数依次为$k_1,\dots,k_s(k_1+\dots+k_s=n)$。

(ii)对每个$k_i$重特征值$\lambda_i,$求方程$(A-\lambda_iE)x=0$的基础解系,得$k_i$个线性无关的特征向量。再把它们正交化、单位化,得$k_i$个两两正交的单位特征向量。因$k_1+\dots+k_s=n$,故总共可得n个两两正交的单位特征向量。

(iii)把这n个两两正交的单位特征向量构成正交矩阵$P$,便有便有$P^{-1}AP=P^TAP=\Lambda$。注意$\Lambda$中对角元的排列次序应与$P$中列向量的排列次序相对应。

§5 二次型及其标准形

定义8 含有n个变量$x_1,x_2,\dots,x_n​$的二次齐次函数

称为二次型。当$j>i$时,取$a{ji}=a{ij}$,则$2a{ij}x_ix_j=a{ij}xix_j+a{ji}x_jx_i$,于是(5)可写成

只含平方项的二次型称为二次型的标准形(或法式)。

如果标准形的系数只在1,-1,0三个数中取值,称为二次型的规范形。

二次型可用矩阵记作

其中$A$为对称矩阵。

定义9 设$A$和$B$是n阶矩阵,若有可逆矩阵$C$,使$B=C^TAC$,则称矩阵$A$与$B$合同。

对于对称矩阵$A$,寻求可逆矩阵$C$,使$C^TAC$为对角矩阵。这个问题称为把对称矩阵$A$合同对角化。

定理6 任给二次型$f=\sum{i,j=1}^na{ij}xix_j(a{ij}=a_{ji})$,总有正交变换$x=Py$,使$f$化为标准形

其中$\lambda1,\lambda_2,\dots,\lambda_n$是$f$的矩阵$A=(a{ij})$的特征值。

推论 任给n元二次型$f(x)=x^TAx(A^T=A)$,总有可逆变换$x=Cz$,使$f(Cz)$为规范形。

§6 用配方法化二次型成标准形

拉格朗日配方法。

例15 化二次型$f=x_1^2+2x_2^2+5x_3^2+2x_1x_2+2x_1x_3+6x_2x_3$为标准形并求所用的变换矩阵。

配方为$f=(x_1+x_2+x_3)^2+(x_2+2x_3)^2$

令$y_1=x_1+x_2+x_3,y_2=x_2+2x_3,y_3=x_3$,就化为标准形$f=y_1^2+y_2^2$。所用变换矩阵为

§7 正定二次型

定理7 设二次型$f=x^TAx$的秩为r,且有两个可逆变换

则$k_1,\dots,k_r$中正数的个数与$\lambda_1,\dots,\lambda_r$中正数的个数相等。称为惯性定理。

二次型的标准形中正系数的个数称为二次型的正惯性指数,负系数的个数称为负惯性指数。

定义10 设二次型$f(x)=x^TAx$,如果对任何$x\neq0$,都有$f(x)>0$,则称f为正定二次型,并称对称矩阵$A$是正定的;如果对任何$x\neq0$都有$f(x)<0$,则称f为负定二次型,并称对称矩阵$A$是负定的。

定理8 n元二次型$f=x^TAx$为正定的充分必要条件是:它的标准形的n个系数全为正,即它的规范形的n个系数全为1,亦即它的正惯性指数等于n。

推论 对称矩阵$A$为正定的充分必要条件是:$A$的特征值全为正。

定理9 对称矩阵$A$为正定的充分必要条件是:$A$的各阶主子式都为正,即

对称矩阵$A$为负定的充分必要条件是:奇数阶主子式为负,而偶数阶主子式为正,即

这个定理称为赫尔维茨定理。