一、矩阵基础运算
1. 矩阵加法与减法
定义:同型矩阵(行数和列数相同)对应元素相加/减。
公式:
若 A=[aij],B=[bij],则
A+B=[aij+bij],A−B=[aij−bij]。用途:
图像处理中的像素值叠加(如图像增强)。
经济学中合并多个数据表。
2. 标量乘法
定义:矩阵每个元素乘以一个标量。
公式:
kA=[k⋅aij]。用途:
调整图像亮度(k>1 增亮,0<k<1 减暗)。
缩放物理系统中的参数。
3. 矩阵乘法
定义:若 A 是 m×n 矩阵,B 是 n×p 矩阵,则 C=AB 是 m×p 矩阵,其中
cij=∑k=1naikbkj。性质:
不满足交换律(AB!=BA)。
满足结合律和分配律。
用途:
线性变换(如旋转、缩放图像)。
神经网络中的权重更新(W⋅X+b)。
经济学中的投入产出模型。
4. 矩阵转置
定义:将矩阵的行与列互换。
公式:
若 A=[aij],则 AT=[aji]。用途:
求解最小二乘法问题(ATAx=ATb)。
优化算法中的梯度计算。
5. 矩阵的逆
定义:若 A 是方阵且存在矩阵 B 使得 AB=BA=I,则 B=A−1。
性质:
仅对非奇异矩阵(行列式 =0)存在。
(A−1)−1=A,(AB)−1=B−1A−1。
用途:
解线性方程组(Ax=b⇒x=A−1b)。
控制系统中的状态反馈。
6. 矩阵的行列式
定义:方阵的标量值,反映矩阵的“缩放因子”。
公式(2x2矩阵):
det[acbd]=ad−bc。用途:
判断矩阵是否可逆(det(A)=0)。
计算体积(3x3矩阵的行列式表示平行六面体的体积)。
7. 特征值与特征向量
定义:若 Av=λv,则 λ 是特征值,v 是特征向量。
求解:
解特征方程 det(A−λI)=0。用途:
主成分分析(PCA)中提取数据的主方向。
物理中的振动分析(如固有频率)。
二、矩阵的高级运算
1. 矩阵分解
LU分解:将矩阵分解为下三角矩阵 L 和上三角矩阵 U 的乘积(A=LU)。
用途:解线性方程组。QR分解:将矩阵分解为正交矩阵 Q 和上三角矩阵 R 的乘积(A=QR)。
用途:最小二乘法。奇异值分解(SVD):A=UΣVT,其中 U 和 V 是正交矩阵,Σ 是对角矩阵。
用途:图像压缩、推荐系统。
2. 矩阵的幂
定义:Ak=k 次A⋅A⋯A。
性质:
对角矩阵的幂易计算(Dk=diag(d1k,d2k,…))。
用于马尔可夫链的稳态分析。
3. 矩阵的指数
定义:eA=∑k=0∞k!Ak。
用途:
微分方程的解(如 dtdx=Ax)。
量子力学中的演化算符。
三、矩阵的典型应用
1. 线性方程组
形式:Ax=b。
解法:
高斯消元法。
矩阵分解(如LU分解)。
应用:
电路分析中的基尔霍夫定律。
经济学中的均衡模型。
2. 图像处理
卷积:通过矩阵乘法实现图像的滤波(如边缘检测)。
压缩:利用SVD保留主要特征,减少数据量。
3. 机器学习
线性回归:最小化误差平方和(∥Ax−b∥2)。
神经网络:前向传播(W⋅X+b)和反向传播(梯度计算)。
4. 物理学
量子力学:状态向量和算符用矩阵表示。
刚体运动:旋转矩阵描述物体的空间变换。
5. 经济学
投入产出模型:分析产业间的相互依赖关系。
博弈论:支付矩阵表示策略的收益。
四、示例:Python实现矩阵运算
import numpy as np
# 定义矩阵
A = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6], [7, 8]])
# 矩阵加法
C = A + B
print("A + B =\n", C)
# 转置
A_T = A.T
print("A的转置:\n", A_T)
# 矩阵乘法
D = np.dot(A, B)
print("A * B =\n", D)
# 矩阵的逆
A_inv = np.linalg.inv(A)
print("A的逆 =\n", A_inv)
# 特征值与特征向量
eigenvalues, eigenvectors = np.linalg.eig(A)
print("特征值 =", eigenvalues)
print("特征向量 =\n", eigenvectors)
评论区