首页 > 其他 > 详细

(邹博ML)矩阵和线性代数

时间:2020-03-17 18:43:48      阅读:145      评论:0      收藏:0      [点我收藏+]

主要内容

  • 矩阵
  • 特征值和特征向量
  • 矩阵求导

矩阵

SVD的提法

技术分享图片

  • 奇异值分解(Singular Value Decomposition)是一种重要的矩阵分解方法,可以看做对称方阵在任意矩阵上的推广。

  • 假设A是一个\(m\times n\)阶实矩阵,则存在一个分解使得:

    技术分享图片

    • 通常将奇异值从大到小排列,这样\(\sum\)就能由A唯一确定了。
  • 与特征值、特征向量的概念相对应

    • \(\sum\)在对角线上的元素称为矩阵A的奇异值;
    • U的第i列称为A的关于技术分享图片的左奇异向量;
    • V的第i列称为A的关于技术分享图片的右奇异向量。

例子:

技术分享图片

技术分享图片

  • 技术分享图片

线性代数

方阵的行列式

  • 一阶方阵的行列式为该元素本身

    技术分享图片

  • n阶方阵的行列式等于它的任意行(或列)的各元素与其对应的代数余子式乘积之和

  • \(2\times 2\)的方阵

    技术分享图片

代数余子式

在n阶行列式D中划去任意选定的k行、k列后,余下的元素按原来顺序组成的n-k阶行列式M,称为行列式D的k阶子式A的余子式。如果k阶子式A在行列式D中的行和列的标号分别为i1,i2,…,ik和j1,j2,…,jk。则在A的余子式M前面添加符号:

技术分享图片

后,所得到的n-k阶行列式,称为行列式D的k阶子式A的代数余子式。

#### 伴随矩阵

对于\(n\times n\)方阵的任意元素\(a_{ij}\)都有各自的代数余子式\(A_{ij}=(-1)^{i+j}M_{ij}\),构造\(n \times n\)的方阵\(A^*\);
技术分享图片

\(A^*\)是A的伴随矩阵。

方阵的逆

技术分享图片

范德蒙行列式Vandermonde

范德蒙行列式:

技术分享图片

第n行是\(x_1,x_2,...,x_n\)的n-1次幂。

如果我们能使得\(x_1,x_2,...,x_n\)互不相等,那么矩阵\(D\)不为0,则存在\(D^{-1}\)

矩阵的乘法

A为\(m \times s\)阶矩阵,B为\(s\times n\)阶的矩阵,那么,\(C=A \times B\)\(m\times n\)阶的矩阵,其中:

技术分享图片

矩阵模型

考虑随机过程\(\pi\),它的状态有n个,用1~n表示。记在当前时刻t时刻时位于i状态,它在t+1时刻处于j状态的概率为P(i,j)=P(j|i)。

即状态转移的概率只依赖于前一个状态

(思考马尔可夫过程?)

技术分享图片

举例:

假定按照经济状况将人群分为上中下三个阶层,用123表示。假定当前处于某阶层只和上一代有关,即,考察父代为第i阶层,则子代为第j阶层的概率。假定为如下转移概率矩阵:

技术分享图片

图解为:

技术分享图片

概率转移矩阵

第n+1代处于第j个阶层的概率为:

技术分享图片

矩阵P即为(条件)概率转移矩阵。

第i行元素表示,在上一状态为i时的分布概率,每一行元素的和为1.

那么思考:初始概率分布对最终分布的影响?

Think!

初始概率\(\pi =[0.21,0.68,0.1]\)迭代

技术分享图片

初始概率\(\pi =[0.75,0.15,0.1]\)迭代

技术分享图片

平稳分布

初始概率不同,但经过若干次迭代,\(\pi\)最终稳定收敛在某个分布上。这是转移概率矩阵P的性质,而非初始分布的性质。

上例中,矩阵P的n次幂,每行都是技术分享图片,这实际上就是特征向量。

如果一个非周期马尔可夫随机过程具有转移概率矩阵P,且它的任意两个状态都是连通的,则技术分享图片存在,记作技术分享图片

In Fect,下面两种写法等价:

技术分享图片

同时,若某概率分布\(\pi P=\pi\),说明

  • 该多项分布是状态转移矩阵P的平稳分布;

矩阵和向量的乘法

技术分享图片

矩阵和向量的乘法应用

技术分享图片

矩阵的秩

\(m\times n\)矩阵A中,任取k行k列,不改变这\(k^2\)个元素在A中的次序,得到k阶方阵,称为矩阵A的k阶子式。

技术分享图片

设在矩阵A中有一个不等于0的r阶子式D,且所有r+1阶子式(如果存在)全等于0,那么,D称为A的最高阶非零子式,r称为A的秩,记作R(A)=r

技术分享图片

秩与线性方程组解的关系

技术分享图片

技术分享图片

推论

  • Ax=0有非零解的充要条件是R(A)<n
  • Ax=b有解的充要条件是R(A)=R(A,b)

向量组等价

技术分享图片

系数矩阵

将向量组A,B所构成的矩阵依次记作\(A(a_1,a_2,...,a_m)\)\(B(b_1,b_2,...,b_m)\),B组能由A组线性表示,即对于每个向量\(b_i\),存在\(k_{1j},k_{2j},...,k_{mj}\)

使得:

技术分享图片

从而得到系数矩阵K

技术分享图片

对C=AB的重新认识

由上,若\(C= A\times B\),则矩阵C的列向量由A的列向量线性表示,B即为这一表示的系数矩阵;C同样由B的行向量线性表示,A为这一表示的系数矩阵。

向量组\(B:b_1,b_2,...,b_n\)能由向量组\(A:a_1,a_2,...,a_n\)线性表示的充要条件是矩阵\(A=(a_1,a_2,...,a_n)\)的秩等于矩阵\((A,B)=(a_1,a_2,...,a_n,b_1,b_2,...,b_n)\)的秩。

正交阵

若n阶矩阵A满足\(A^TA=I\),称A为正交矩阵,简称正交阵。

I为对角线为1,其他为0的矩阵

A是正交阵,x为向量,则Ax称作正交变换。

正交变换不改变向量长度。

特征值和特征向量

A是n阶矩阵,若数\(\lambda\)和n纬非0列向量x满足\(Ax=\lambda x\),那么数\(\lambda\)称为A的特征值,x称为对应于特征值的特征向量。

技术分享图片

特征值的性质

设n阶矩阵\(A(a_{ij})\)的特征值为\(\lambda_1,\lambda_2,...,\lambda_n\),则:

\(\lambda_1+\lambda_2+...+\lambda_n=a_{11}+a_{22}+...+a_{nn}\)

\(\lambda_1\lambda_2...\lambda_n=|A|\)

矩阵A主对角线行列式的元素和,称作矩阵A的

不同特征值对应的特征向量

技术分享图片

  • 不同特征值对应的特征向量,线性无关。

  • 若方阵A是对称阵,结论是否加强?

    技术分享图片

引理

实对称阵的特征值是实数

技术分享图片

应用:

将实数\(\lambda\)带入方程组\((A-\lambda I)x=0\),该方程组为实系数方程组,因此,实对称阵的特征向量可以取实向量

实对称阵的不同特征值的特征向量正交

令实对称阵为A,其两个不同的特征值\(\lambda_1 \lambda_2\)对应的特征向量分别是\(\mu_1\mu_2\)

技术分享图片

最终结论

技术分享图片

正定阵

对于n阶方阵A,若任意n阶向量x,都有\(x^TAx>0\)则称A是正定阵。

若条件变为\(x^TAx\ge0\),则A称作半正定阵。

类似的还有负定阵,半负定阵。

给定任意\(m\times n\)的矩阵A,证明\(A^TA\)一定是半正定阵。

正定阵的判定

  • 对称阵A为正定阵;
  • A的特征值都为正;
  • A的顺序主子式大于0;
  • 以上三个命题等价。

例题:

技术分享图片

定义证明:

技术分享图片

向量的导数

A为\(m\times n\)的矩阵,x为\(n \times1\)的列向量,则Ax为\(m\times1\)的列向量,记为:

技术分享图片

推导

令:

技术分享图片

从而:

技术分享图片

结论与直接推广

技术分享图片

注意

关于列向量求导,资料中有如下方案:

技术分享图片

以上公式将会导致向量间求导得到“超越矩阵”-矩阵的每个元素仍然是一个矩阵,不利于应用。

标量对向量的导数

技术分享图片

推导公式:技术分享图片

技术分享图片

标量对方阵的导数

技术分享图片

(邹博ML)矩阵和线性代数

原文:https://www.cnblogs.com/upcwsh/p/12512066.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!