MIT线性代数公开课学习笔记第16~20课
十六、投影矩阵和最小二乘
给出\(n\)组\(m-1\)个自变量的数据点(用\(n\times m\)大小的矩阵\(A\)表示,其中第一列均为1,代表常数项),以及它们的真实取值(用n维列向量\(b\)表示),现在需要用一个\(m-1\)元未知数的线性方程来拟合这组数据点。可以用非齐次线性方程组\(AX=b\)表示。
一般来说这个方程组是无解的,即\(b\notin C(A)\),我们需要找到一个近似的\(\hat b,\hat X\),使得\(A\hat X=\hat b\)。其中\(b_i\)是第\(i\)个数据点的真实取值,\(\hat b_i\)是第\(i\)个数据点通过拟合直线的近似取值,如下图所示:
在第十五课已经讲过,最小二乘法的损失函数是均方差函数,即:
\]
换言之:
\]
为直观起见,这里的\(\mathrm{dim}C(A)=2\),则\(b\)投影到\(C(A)\)上的向量\(\hat b\)如图所示,显然\(e=b-\hat b,e\perp C(A)\),因此此时\(\|e\|=\|b-\hat b\|\)是最小的。
根据第十五节的知识,我们可以令投影矩阵\(P=A(A^TA)^{-1}A^T\),则:
\]
\]
上式左右同时左乘\(A^T\):
\]
根据这个非齐次线性方程组便可以解出\(\hat X\),也就能得到这个拟合的直线方程了。
十七、正交矩阵和Gram-Schmidt正交化
正交矩阵和Gram-Schmidt正交化在国内的各类线代教材中都有出现,这里不做过多赘述。
这里值得一提的是,前\(t-1\)个线性无关向量\(\alpha_1\cdots \alpha_{t-1}\)已正交化为\(\beta_1\cdots \beta_{t-1}\),正交化第\(t\)个向量\(\alpha t\)的过程,就是将其投射到\(C(\beta_1\cdots \beta_{t-1})\)这个空间中,然后获得误差向量的过程。
如上图,若已获得两个正交化的向量\(\beta_1,\beta_2\),则首先将\(\alpha_3\)投射到\(C(\beta_1,\beta_2)\)得到\(\mathrm{Prj}_{C(\beta_1,\beta_2)}\alpha_3\)
则
\]
由十五课的投影相关的内容可得
\]
十八、行列式性质
国内线代教材包含了此课中的所有内容,此处不作过多赘述。
十九、行列式公式
根据行列式的性质,将三阶行列式按第一行拆分,如下图:
然后对每个行列式,将其按第二行拆分,以此类推,最终可以得到:
类似地,对于\(n\)阶行列式\(\mathrm{det}(a_{i,j})_{n\times n}\)而言,可以将其拆分为
\]
其中\(\{i,j,\cdots,l\}\)表示的是\(a_{1,i}a_{2,j}\cdots a_{n,l}\),\(x\)是序列\(\{i,j,\cdots,l\}\)的逆序对个数,\(\mathrm{Permutation}\{1,2,\cdots,n\}\)表示的是1到n的全排列
如果我们把其中含\(a_{i,j}\)的项全部提出来,就能得到\(a_{i,j}\)对应的代数余子式\(A_{i,j}\)
二十、克拉默法则
国内线代教材包含了克拉默法则相关的内容,此处不作过多赘述。
值得一提的是二阶(三阶)行列式的值与面积(体积)的关系。
对于一个二阶矩阵A
\]
而言,\(|\mathrm{det}(A)|\)就是如下平行四边形的面积:
实际上这和叉积是完全相同的:
\]
对于一个三阶矩阵A
\]
而言,\(|\mathrm{det}A|\)就是如下图所示的平行六面体的体积
这符合混合积的定义:
\]
而且二阶(三阶)行列式的性质也有几何意义。如对于三阶行列式A的某一行乘以2得到A\’,则A\’=2A,相当于是对应的向量长度乘2,则该平行六面体体积也乘2