# 矩阵
正定矩阵
酉矩阵
埃尔米特矩阵
共轭转置与转置
奇异值分解
一个矩阵主元的数量就是 rank,就是化简到最后的主元 就是有多少个解
rank = 基的维度 = 列向量的
当 R=n<m 的情况,有 0 或一个解例如.I 是定义矩阵,其中 0 是自由行,m 是 row number 行数,n 是 colunm number 列数 F 是自由行
R=∣∣∣∣∣I0∣∣∣∣∣
当R=m<n 时,有无数多个解
R=∣IF∣
当R<m,R<n 时候,有 0 或无数多个解
R=∣∣∣∣∣I0F0∣∣∣∣∣
# 消元法
对于三元一次方程
x+2y+z=23x+8y+z=124y+z=2
可以写成
∣∣∣∣∣∣∣130284111∣∣∣∣∣∣∣∣∣∣∣∣∣∣xyz∣∣∣∣∣∣∣=∣∣∣∣∣∣∣2122∣∣∣∣∣∣∣
利用消元法把第一行 * -3 加到第二行上变成了
∣∣∣∣∣∣∣1002241−21∣∣∣∣∣∣∣∣∣∣∣∣∣∣xyz∣∣∣∣∣∣∣=∣∣∣∣∣∣∣262∣∣∣∣∣∣∣
然后把第二行 * -2 加到第三行上
∣∣∣∣∣∣∣∣1002201−25∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣xyz∣∣∣∣∣∣∣=∣∣∣∣∣∣∣26−10∣∣∣∣∣∣∣
这样就变成了上三角矩阵,其中等于的是 增广矩阵
,其中框中的是主元,主元在高斯消元法中不能为 0,要是为 0 就不能交换行或列,要是交换后还是为 0 就是没有解。
# 行列式
记作 det (𝐴) 或 |𝐴|,是一个在方块矩阵上计算得到的标量。行列式可以看作是有向面积或体积的概念在一般的欧几里得空间中的推广。或者说,在欧几里得空间中,行列式描述的是一个线性变换对 “体积” 所造成的影响。
- 求法可以通过消元法或者 LU 分解得到主元,然后把所有主元相乘起来,要是不是满秩的话,行列式是 0,代表方程式就是无解
- 对于 2x2 矩阵就是对角线相加,对于A=[acbd]|\mathrm{A}|=\text
- 3*3 矩阵就是A=⎣⎢⎡adgbehcfi⎦⎥⎤\mathrm
- |A|=a\cdot\begin{vmatrix}e&f\\h&i\end{vmatrix}-b\cdot\begin{vmatrix}d&f\\g&i\end{vmatrix}+c\cdot\begin{vmatrix}d&e\\g&h\end
# 性质
在行列式中,一行(列)元素全为 0,则此行列式的值为 0。∣∣∣∣∣∣∣∣∣0a21⋮an10a22⋮an2……⋱…0a2n⋮ann∣∣∣∣∣∣∣∣∣=∣∣∣∣∣∣∣∣∣00⋮0a12a22⋮an2……⋱…a1na2n⋮ann∣∣∣∣∣∣∣∣∣=0
在行列式中,某一行(列)有公因子𝑘,则可以提出𝑘D=\begin{vmatrix}a_{11}&a_{12}&\ldots&a_{1n}\\\varvdots&\varvdots&\ddots&\varvdots\\ka_{i1}&ka_{i2}&\ldots&ka_{in}\\\varvdots&\varvdots&\ddots&\varvdots\\a_{n1}&a_{n2}&\ldots&a_{nn}\end{vmatrix}=k\begin{vmatrix}a_{11}&a_{12}&\ldots&a_{1n}\\\varvdots&\varvdots&\ddots&\varvdots\\a_{i1}&a_{i2}&\ldots&a_{in}\\\varvdots&\varvdots&\ddots&\varvdots\\a_{n1}&a_{n2}&\ldots&a_{nn}\end{vmatrix}=kD_
在行列式中,某一行(列)的每个元素是两数之和,则此行列式可拆分为两个相加的行列式\begin{vmatrix}a_{11}&a_{12}&\ldots&a_{1n}\\\vdots&\vdots&\ddots&\vdots\\a_{i1}+b_{i1}&a_{i2}+b_{i2}&\ldots&a_{in}+b_{in}\\\vdots&\vdots&\ddots&\vdots\\a_{n1}&a_{n2}&\ldots&a_{nn}\end{vmatrix}=\begin{vmatrix}a_{11}&a_{12}&\ldots&a_{1n}\\\vdots&\vdots&\ddots&\vdots\\a_{i1}&a_{i2}&\ldots&a_{in}\\\vdots&\vdots&\ddots&\vdots\\a_{n1}&a_{n2}&\ldots&a_{nn}\end{vmatrix}+\begin{vmatrix}a_{11}&a_{12}&\ldots&a_{1n}\\\vdots&\vdots&\ddots&\vdots\\b_{i1}&b_{i2}&\ldots&b_{in}\\\vdots&\vdots&\ddots&\vdots\\a_{n1}&a_{n2}&\ldots&a_{nn}\end
行列式中的两行(列)互换,改变行列式正负符号\begin{vmatrix}\vdots&\vdots&\vdots&\vdots\\a_{i1}&a_{i2}&\ldots&a_{in}\\a_{j1}&a_{j2}&\ldots&a_{jn}\\\vdots&\vdots&\vdots&\vdots\end{vmatrix}=-\begin{vmatrix}\vdots&\vdots&\vdots&\vdots\\a_{j1}&a_{j2}&\ldots&a_{jn}\\a_{i1}&a_{i2}&\ldots&a_{in}\\\vdots&\vdots&\vdots&\vdots\end
在行列式中,有两行(列)对应成比例或相同,则此行列式的值为 0∣∣∣∣∣∣∣∣∣∣28⋮an128⋮an2……⋱…28⋮ann∣∣∣∣∣∣∣∣∣∣=0
行列式的乘法定理:方块矩阵的乘积的行列式等于行列式的乘积。det (𝐴𝐵)=det (𝐴) det (𝐵)。特别的,若将矩阵中的每一行每一列上的数都乘以一个常数𝑟,那么所得到的行列式不是原来的𝑟倍,而是𝑟𝑛倍:
det(rA)=det(rIn⋅A)=det(rIn)⋅det(A)=rndet(A)
矩阵的行列式和矩阵的迹数有一定的关联,当矩阵的系数为域时,在定义了矩阵的指数函数后,有如下的恒等式:
det(exp(A))=exp(tr(A))
# 特征值与特征向量
给定一个矩阵A 经过线性变换 x 后得到Ax=λx, 这个λ 就是特征值,x 就是特征向量,意思就是朝着某一个方向对矩阵进行缩放,其中 A 的矩阵的维度就有多少个特征值
求法:
det(A−λI)=0
例子:
A=[3113]det(A−λI)=∣∣∣∣∣3−λ113−λ∣∣∣∣∣=(3−λ)2−1=0λ1=2,λ2=4
特征向量是:
(A−λ1I)x=[3−2113−2]x=[1111]x=0x=[1−1]
要是A−1 的特征值就是 A 特征值的倒数
特征值之积等于矩阵行列式、特征值之和等于矩阵的迹
# 相乘
# 方法一
对于矩阵乘向量,列(column)相乘是这样的,每一竖跟每一竖相乘
x∣∣∣∣∣∣∣130∣∣∣∣∣∣∣+y∣∣∣∣∣∣∣284∣∣∣∣∣∣∣+z∣∣∣∣∣∣∣111∣∣∣∣∣∣∣
行(row)向量相乘是这样的
∣∣∣∣∣∣∣1002201−25∣∣∣∣∣∣∣∣∣∣xyz∣∣∣
x∣∣∣∣∣∣∣121∣∣∣∣∣∣∣+y∣∣∣∣∣∣∣02−2∣∣∣∣∣∣∣+z∣∣∣∣∣∣∣005∣∣∣∣∣∣∣
# 方法二
结果矩阵任意一点就是相乘的两个矩阵对应行的点乘,例如c23 就是A 第二行跟B 第三列进行点乘A2⋅B3
# 逆矩阵
逆矩阵求法定义为AA−1=I, 对于求法可以用增广矩阵来求,把另一侧变为单位矩阵最后结果就是逆矩阵 ,要是行列式是 0 说明矩阵不可逆
[12371001][10311−201][10017−2−31]
最后得到逆矩阵就是
∣∣∣∣∣7−2−31∣∣∣∣∣
也可以用逆矩阵 = 伴随矩阵 *(1 / 矩阵的行列式值)(绝对值)
伴随矩阵 = 余子式矩阵对角变换
https://www.shuxuele.com/algebra/matrix-inverse-minors-cofactors-adjugate.html
对于 i + j = 偶数时候,符号要取负号
# 矩阵的行列式值求法
**|A|** 代表矩阵 A 的行列式和绝对值的符号一样
矩阵的行列式
行列式的几何意义是面积体积,2x2 矩阵的行列式是平行四边形的面积,3x3 矩阵的行列式是正方体也就是六面体的体积,行列式也代表线性变化的缩放程度,大于 1 则放大 \
如果矩阵的秩等于列数或行数(或两者),则称矩阵具有满秩。没有满秩的矩阵称为秩亏矩阵的。
一个复系数矩阵 A 的极分解将其分解成两个矩阵的乘积,可以表示为:A=Up
其中 U 是一个酉矩阵,P 是一个半正定的埃尔米特矩阵。这样的分解对任意的矩阵 A 都存在。当 A 是可逆矩阵时,分解是唯一的,并且 P 必然为正定矩阵。
# 矩阵叉乘
# 四大基础子空间
# 列空间或行空间
是由一个矩阵的列向量或者行向量组成的空间
# 列空间 ColumeSpace
对于 m×n 矩阵 A 列空间就是 A 的各列的线性组合的集合,记为 ColA,列空间上所有向量都是列向量的线性组合,都处在Rm 一个子空间,即 Ax=b 中的 b。他的维数是秩,列空间的基就是主元的列
对于矩阵
A=⎣⎢⎢⎢⎡123423453579⎦⎥⎥⎥⎤Ax=⎣⎢⎢⎢⎡123423453579⎦⎥⎥⎥⎤⎣⎢⎡x1x2x3⎦⎥⎤=⎣⎢⎢⎢⎡b1b2b3b4⎦⎥⎥⎥⎤
他的列空间就是r1=(1,2,3,4)r2=(2,3,4,5)r3=(3,5,7,9)∣∣(r1,r2), 因为 r3 是前连个线性相关,所以不是
从几何角度来说所有向量会组成一个平面,要是解不包含 0 的话就不存在子空间组合
列空间的意义就是 b 是 A 的线性组合,在列空间的里面,所以这个 Ax=b 方程是有解的,反而是无解
基
列空间的基就是可以化简成 11 的所在的列
A=⎣⎢⎡123114141132⎦⎥⎤C(A)=span(⎣⎢⎡123⎦⎥⎤,⎣⎢⎡114⎦⎥⎤,⎣⎢⎡141⎦⎥⎤,⎣⎢⎡132⎦⎥⎤)
A=⎣⎢⎡123114141132⎦⎥⎤→⎣⎢⎡1001−1112−211−1⎦⎥⎤→⎣⎢⎡1000103−202−10⎦⎥⎤→⎣⎢⎡1000103−202−10⎦⎥⎤⎣⎢⎢⎢⎡x1x2x3x4⎦⎥⎥⎥⎤=⎣⎢⎡000⎦⎥⎤
其中所在的 1,0,0 和 0,1,0 是基
C(A)=span⎝⎛⎣⎢⎡123⎦⎥⎤,⎣⎢⎡114⎦⎥⎤⎠⎞
# 零空间
对于Ax=0 点情况所有解的组合就是零空间,他们会变成一条经过 0 点一条线
# 投影
对于一个没有解到矩阵,我们可以把它投影到另一个矩阵上求其近似解,就低维来说,就像一个向量投影到另一个向量上,当再次投影就是他自己,他的公式是
P=A(ATA)−1AT
求一个矩阵的投影也可以写成,b 是要投影的矩阵,A 是接受投影的矩阵
ATAATbA
# 投影矩阵的性质
- 幂等性(Idempotence):
p2=p
这表示再次应用投影矩阵不会改变已经投影的向量。
- 对称性(Symmetry):
P=PT
这是 PPP 投影到子空间时保持的性质。
- 特征值:
- 投影矩阵的特征值是 0 和 1。
- 1 的特征向量对应于投影子空间中的向量。
- 0 的特征向量对应于投影到零的向量。
- 迹(Trace):
- 投影矩阵 P 的迹等于其秩,即 P 投影的子空间的维度。
# 例子
# 最小二乘法
最小二乘法(Least Squares Method)是一种在数据拟合中常用的统计方法,用于寻找一个函数(如线性或非线性函数)使得它与给定数据点的偏差最小。它的目标是通过最小化数据点与模型预测值之间的误差平方和(Sum of Squared Errors, SSE),从而找到最合适的拟合参数。下面是对最小二乘法的详细解释。
核心思想
假设我们有一组数据点 ((x1,y1),(x2,y2),…,(xn,yn)),我们希望找到一个函数 (f (x) ) 使得它能够尽可能地贴合这些数据点。对于每个数据点 ((xi,yi)),我们计算函数 (f(xi)) 和实际值 yi 之间的误差,通常用平方的形式来度量:
误差平方=(yi−f(xi))2
最小二乘法的目标是最小化所有误差平方的总和,即:
S=∑i=1n(yi−f(xi))2
应用:线性回归
最常见的应用是线性回归,即拟合一条直线 f(x)=ax+b 到数据点上。
线性回归的步骤:
1、定义误差平方和:
S=∑i=1n(yi−(axi+b))2
2、求偏导数:
对参数 (a) 和 ( b ) 求偏导数,使得误差平方和最小化:
∂a∂S=−2i=1∑nxi(yi−(axi+b))∂b∂S=−2i=1∑n(yi−(axi+b))
3、设导数为 0:
设这两个偏导数为 0,得到一组方程:
⁍
i=1∑nyi=ai=1∑nxi+bn
4、求解方程:
通过解这组方程,我们可以得到 (a) 和 b 的值:
a=n∑i=1nxi2−(∑i=1nxi)2n∑i=1nxiyi−∑i=1nxi∑i=1nyi
⁍
优点和局限
- 优点:
・ 简单且计算效率高。
・ 在噪声较小的情况下能够给出较好的拟合效果。
・ 广泛适用于各种数据拟合问题。
・ 局限:
・ 对离群点敏感,因为误差平方会放大大的偏差。
・ 只能处理线性或可以通过变换线性化的问题,无法直接处理高度非线性问题。
# 可对角化矩阵
可对角化矩阵是可化简为对角矩阵的方阵。矩阵对角化后大幅降低了某些属性的计算难度,比如其行列式就是对角线上所有数字的乘积,而对角线上的数字就是其特征值。
对角矩阵就是除了主元其余都是 0
可将矩阵变为,A 是 D 特征值组成的对角矩阵,x 是特征向量
x−1λx=D
例子:
A=⎣⎢⎡10223−4002⎦⎥⎤λ1=3,λ2=2,λ3=1v1=⎣⎢⎡−1−12⎦⎥⎤v2=⎣⎢⎡001⎦⎥⎤v3=⎣⎢⎡−102⎦⎥⎤P=⎣⎢⎡−1−12001−102⎦⎥⎤P−1AP=⎣⎢⎡02−1−101010⎦⎥⎤⎣⎢⎡300020001⎦⎥⎤⎣⎢⎡−1−12001−102⎦⎥⎤=⎣⎢⎡10223−4002⎦⎥⎤
# 正定与半正定
正定矩阵就是一类对称矩阵,满足:
- 所有的特征值是正数
- 所有主元为正
- 所有的子行列式都为正
判定方式:xTAx>0 x 是任意向量,当等于 0 的时候就是半正定