LA - 3.3 不如两个一起吃
矩阵的加法和数乘
我们也说了 $T$ 所属的也是一个向量空间,他也满足加法和数乘。这里我们可以讨论一下这两个操作的几何意义。
一个矩阵可以表示的变换有以下几种:
- 旋转 rotation \(R(\theta) = \begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \ \ \cos\theta \end{pmatrix}\)
- 拉伸 stretch\(S = \begin{pmatrix} s_x & 0 \\ 0 & s_y \end{pmatrix}\)
- 剪切 shear \(H_x(k) = \begin{pmatrix} 1 & k \\ 0 & 1 \end{pmatrix}\)
我们首先假设变换前的 $V$ 的基为我们熟知的 $x$ 和 $y$ 轴。理解了矩阵列向量的意思后,我们就可以解读每一种操作了:
- 旋转所做的是将 $x$ 轴的 $(1,0)$ 移到 $(\cos{\theta},\sin{\theta})$ 处,$y$ 轴的 $(0,1)$ 相位差为 $\frac{2}{\pi}$ 的地方
- 剪切实际上是保持 $x$ 不变,将 $y$ 轴的 $(0,1)$ 拉到 $(1,k)$ 的位置,原来直角坐标系变成了斜角坐标系了。
加法操作实际上相当于将两种变换做叠加,但是要注意的是这个相乘不一样,之后我们会进一步解释。而数乘相当于拉伸,这个我们进一步解析一下:
[!tip] 在我们之后了解到矩阵的零元为 $E$ 或 $I$ 之后,我们可以将 $\lambda A$ 写为: \(\lambda A=\lambda I A\) 也就是先做 $\lambda$ 倍的拉伸变换,再进行 $A$ 变换。
矩阵的加法
行列式的加法要求除某一行外其他行都相等。但矩阵的加法非常直观,就是对应位相加。这里不做赘述 \(\begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix} + \begin{bmatrix} 5 & 6 \\ 7 & 8 \end{bmatrix} = \begin{bmatrix} 6 & 8 \\ 10 & 12 \end{bmatrix}\)
矩阵的数乘
行列式的数乘会在某一行统一乘一个数。而矩阵的数乘是为所有数字都乘,这就是为什么 $|kA|=k^n|A|$ \(3 \times \begin{bmatrix} 2 & -1 \\ 0 & 5 \end{bmatrix} = \begin{bmatrix} 6 & -3 \\ 0 & 15 \end{bmatrix}\)
矩阵的乘法 Matrix Multiplication
我们先来定义一个符号
[!definition] $F^{m,n}$ $F^{m,n}$ 表示所有元素属于 $F$ 的 $m\times n$ 的矩阵,则有 \(dim\ F^{m,n}=mn\) 要验证这个结论,我们直接规定它的标准基,其中每一个基是 $m\times n$ 个位置中只有一个位置是 $1$ ,其余都是 $0$ 的矩阵,显然这有 $mn$ 个。
现在给定几个空间 $U,V,W$ 和两个变换 $S:V\to W$ 和 $T:U\to V$,$ST$ 也就代表一个 $U\to W$ 的变换。现在我们希望矩阵的乘法能满足 $\mathcal{M}(ST)=\mathcal{M}(S)\mathcal{M}(T)$,这就需要我们去定义一个矩阵乘法的规则去满足这个性质。
[!quote] 推理 假设 $\mathcal{M}(S)=A,\mathcal{M}(T)=B$,那么对于 $1\leq k\leq p$ 我们有: \((ST)u_k=S(\sum^n_{r=1}B_{r,k}v_r)\) 这相当于先计算了 $Tu_k$,同时由于向量空间满足分配律,所以可以把 $S$ 乘进去 \(=\sum^n_{r=1}B_{r,k}Sv_r\) 再次计算,就有 \(=\sum_{j=1}^m \left( \sum_{r=1}^n A_{j,r} B_{r,k} \right) w_j\) 注意到这实际上是 $\mathcal{M}(ST)$ 的矩阵计算形式,他要求里面的 $j$ 行 $k$ 列为: \((ST)_{j,k}=\sum^n_{r=1}A_{j,r}B_{r,,k}\) 我们就这样定义了矩阵的乘法
下面我们就不再次定义了,我们来一些浅显的理解。
观察上面的乘法式子,你会发现他和我们高中学到的 点乘 形式非常像。实际上,你要取的是第一个矩阵的第 i 行去点乘第二个矩阵的第 j 列。这就要求第一个矩阵的行和第二个矩阵的列数值上一样,体现在映射上,这个数值实际上是过渡空间 $V$ 的维度 $dim\ V$。这个方式运算方式我们可以这样表示: \((AB)_{j,k}=A_{j,·}·B_{·,k}\) 这里的 $A_{j,·}$ 表示第 $j$ 行的行向量,$A_{·,k}$ 表示第 $k$ 列的列向量
这里我们就不去深究它数值上的的几何意义了,但是我们还是要把矩阵乘法和加法所带来的几何上的变化的不同区分一下。
- 对于乘法来说:两个变换相乘相当于按顺序对 $\vec{v}$ 进行两次变换,注意,这里的变换顺序很重要,这和 $AB\neq BA$ 是一个道理。
- 对于加法而言:你可以把他拆分为 $(A+B)\vec{v}=A\vec{v}+B{\vec{v}}$ ,即两个变换后的变量的加和,纯粹的去理解变换的叠加是不可行的。
回想我们之前对 [[Linear Algebra - 3.2 矩阵 Matrics#对线性方程组的几何意义的补充|线性方程组几何意义的补充]] 中对未知数矩阵意义的理解,我们不难发现,如果有一个 $A$ 是一个 $m\times n$ 的矩阵,$\vec{b}$ 是一个 $n$ 维列向量,则有 \(A\vec{b}=b_1A_{·,1}+\cdots+b_nA_{·,n}\)
[!example] \(\begin{pmatrix}1 & 2 \\3 & 4 \\5 & 6\end{pmatrix}\begin{pmatrix}5 \\1\end{pmatrix}=\begin{pmatrix}7\\19 \\31\end{pmatrix}= 5\begin{pmatrix}1 \\3 \\5\end{pmatrix}+1\begin{pmatrix}2 \\4 \\6\end{pmatrix}\) 这个就是我们上面说的几何意义。
列向量、行向量与矩阵乘法的关系
我们知道矩阵可以分为列向量和行向量,但实际上这和矩阵乘法有这不可分割的关系。
[!tip] 假设 $C$ 是 $m\times c$ 的矩阵,$R$ 是 $c\times n$ 的矩阵
- $CR$ 的列向量 $\vec{a}_k$ 是 $C$ 中列向量的线性组合,而每一个向量的系数是 $R$ 中的第 $k$ 列。
- $CR$ 的行向量 $\vec{a}_j$ 是 $R$ 中行向量的线性组合,而每一个向量的系数是 $C$ 中的第 $j$ 行。
具体验证可以看上面给的 Example
到了这一点,我们就可以谈论他们在线性方程组背景下具体的几何意义了
- 行向量相当于 $n$ 维空间中的一条直线或者一个面,或者更多。以行向量的视角来看,我们是去求这些空间的交集。
- 列向量相当于 $m$ 个 $n$ 维基底,未知数矩阵 $x$ 实际上就是线性组合的系数。