LA - 3.2 你想要蓝药丸还是红药丸
接下来我们讨论的实际上是同济大学教材的最后一章的内容,也就是 #6 线性空间与线性变换,这里对应的是线性变换的矩阵表示法。
矩阵来表示的线性变换
[!definition] $matrix$ $A_{j,k}$ 矩阵是一个 $m$ 行 $n$ 列的元素阵列,记为: \(A = \begin{pmatrix} A_{1,1} & \cdots & A_{1,n}\\ \vdots & & \vdots\\ A_{m,1} & \cdots & A_{m,n} \end{pmatrix}\) 其中 $A_{j,k}$ 代表第 $j$ 行第 $k$ 列的元素
一个线性变换 $T: V \to W$ 本身是抽象的,但一旦我们给 $V$ 和 $W$ 选择具体的基,就可以用矩阵这种具体的数字表格来表示它。简单来说,矩阵的作用是 输入一个向量在 V 的基下的坐标,输出它在 W 的基下的坐标。
[!definition] 矩阵表示的线性变换 $\mathcal{M}(T)$ 假设 $T\in\mathcal{L}(V,W)$ 并且 $\vec{v}1,\dots,\vec{v}_n$ 是 $V$ 的一组基,$\vec{w}_1,\dots,\vec{w}_m$ 是 $W$ 的一组基。 我们定义矩阵 $\mathcal{M}(T)$ 的第 $k$ 列,是 $T(v_k)$ 在 $W$ 的基 ${w_1, \dots, w_m}$ 下的坐标。 \(T(\vec{v}_k) = A_{1,k} \vec{w}_1 + \cdots + A_{m,k} \vec{w}_m\) 这里的系数 $A{1,k}, A_{2,k}, \dots, A_{m,k}$ 就构成了 $\mathcal{M}(T)$ 的第 $k$ 列
上面我们输入了一个 $v_k$ ,$T$ 将他从 $n$ 维变换到了 $m$ 维,此时我们已经规定了 $m$ 维的基底 $w_1,\dots,w_m$,所以 $T(v_k)$ 一定可以被 $w_1,\dots,w_m$ 唯一的线性表示。这也说明了 $A_{j,k}$ 的唯一性。 我们可以把矩阵的每一行对应上一个 $w_j$ ,列对应上一个 $v_k$,这样里面的每一列的元素都表示了 \(T(\vec{v}_k) = A_{1,k} \vec{w}_1 + \cdots + A_{m,k} \vec{w}_m\)
[!danger] 我们日常做题的时候,一般会选取标准基! 我们挑选的两个基一个是 $V$ 空间的,也就是输入空间的,一个是输出空间 $W$,此时,我们一般会将两个空间的基都选为标准基: \(\left({\left(\displaylines{1\\0\\\vdots\\0\\0}\right)},{\left(\displaylines{0\\1\\\vdots\\0\\0}\right)},\cdots,{\left(\displaylines{0\\0\\\vdots\\1\\0}\right)},{\left(\displaylines{0\\0\\\vdots\\0\\1}\right)}\right)\) 也就是一个 对角单位矩阵。 这样的话,如果我们要就不需要去专门把每一个 $A_{i,j}$ 算出来了,我们来看一下上面的式子 \(T(\vec{v}_k) = A_{1,k} \vec{w}_1 + \cdots + A_{m,k} \vec{w}_m\) 如果 $\vec{w}$ 选为标准基,那么就只有一位是 $1$,其他都是 $0$,也就是说 \(T(\vec{v}_k)=\left(\displaylines{A_{1,k}\\\vdots\\A_{m,k}}\right)\) 这个式子的意思就是,在通过 $T$ 变换将 $V$ 的基 $\vec{v}_k$ 变换到 $W$ 后,它的坐标就是这个。我们也就会在矩阵里填入这个数。
这也引申出了一个更深刻的几何意义: 当矩阵作为线性变换的时候,它实际上是将 $V$ 中的标准基 $v_k$ 拉伸到了这个矩阵第 $k$ 列向量的位置。矩阵 $A$ 的第 $k$ 列就是输入空间的标准基向量 $e_k$ 被映射到的输出向量(用标准坐标表示)。
同时,这也说明了 $\mathcal{M}(T)$ 的构建需要至少两个空间的两个基底,才能表示出来。所以这个表示方法也可以写为 $\mathcal{M}(T,(v_1,\dots,v_n),(w_1,\dots,w_m))$
这样,在定义完成之后,我们要想通过 $\mathcal{M}(T)$ 来计算一个变换,就可以这样用矩阵的乘法来计算了。
[!example] 用矩阵来表示函数空间中的求导映射算子 假设求导算子 $\frac{d}{dx}\in \mathcal{L}(\mathcal{P}_3(\mathbb{R}),\mathcal{P}_2(\mathbb{R}))$,因为我们规定了 $(x^n)’=nx^{n-1}$ ,也规定了输入空间的输出空间的基均为 $(1,x,x^2,\dots,x^m)$,则矩阵为: \(\mathcal{M}(D) = \begin{pmatrix} 0 & 1 & 0 & 0 \\ 0 & 0 & 2 & 0 \\ 0 & 0 & 0 & 3 \end{pmatrix}\) 我们以这个为例子来分析一下:
- 对于 $\mathcal{P}_3(\mathbb{R})$ 的第一个基向量 $1$,把他映射到了 $0$ 上,这是一个降维操作
- 对于 $\mathcal{P}_3(\mathbb{R})$ 的第二个基向量 $x$,把他映射到了 $(1,0,\cdots)$ 上,也就是 $\mathcal{P}_2(\mathbb{R})$ 的第一个基向量——常数项上,这符合我们对求导的认知!
- 后面不多赘述,就是多了个指数项
线性方程组在向量表示下的几何意义
我们提到了,线性方程组其实可以理解为被赋予了意义的向量组,那么我们不妨去探索一下它作为向量组时的几何意义。回忆一下 [[Linear Algebra - 5.1 齐次线性方程组 Linear equation|线性方程组]] 的内容:
一个方程组表示为,如果你竖行的来看,他其实就是 $n$ 个向量数乘后相加,$x_k$ 就是这个数 \(\begin{cases} A_{1,1} x_1+\cdots+A_{1,n} x_n = 0 \\ \quad \vdots \\ A_{m,1} x_1+\cdots+A_{m,n} x_n = 0 \end{cases}\)
实际上齐次线性方程组是在问——存不存在一个 n元数字组(当然,你也可以把他叫成向量)使得: \(x_1\vec{v_1}+\cdots+x_n\vec{v_n}=(0,\cdots,0)^T\in\mathbb{F}^m\) 你会发现,如果把 $\vec{v}_k$ 全部都打开,这个式子其实就和上面的式子等价了: \(x_1{\left(\displaylines{A_{1,1}\\\vdots\\A_{1,m}}\right)}+\cdots+x_n{\left(\displaylines{A_{1,n}\\\vdots\\A_{m,n}}\right)}=(0,\cdots,0)^T\in\mathbb{F}^m\) 回忆一下我们之前将 [[Linear Algebra - 2 张成、线性相关与线性独立|线性无关]] 时候的公式,这实际上在看这 $n$ 个 $m$ 维向量是否 线性无关,也就是说。显然,要线性方程组有非零解,也就是 $x_1,\dots,x_n\neq0$ ,则要求这些向量 线性相关。即:
- 齐次方程组有非零解 ⇔ 列向量组线性相关
- 齐次方程组只有零解 ⇔ 列向量组线性无关 在学习了矩阵之后,我们就理解了这些列向量的几何意义——在 $W$ 的标准基视角下,$V$ 的标准基的坐标。其过程可以缩减为下图: \(\underbrace{e_k}_{\text{V的标准基向量}} \quad \xrightarrow{T}\underbrace{T(e_k)}_{\text{W中的向量}} \quad \xrightarrow{在W标准基下取坐标}\underbrace{A_{j,k}}_{\text{A的第k列}}\)
| 这样,[[Linear Algebra - 5.1 齐次线性方程组 Linear equation#齐次线性方程组的推论 | 齐次线性方程组的推论]] 就有了另一个直观的解释,这我们之前在 [[Linear Algebra - 2 张成、线性相关与线性独立#线性无关与相关的推论 | 线性独立的推论]] 里提到了。 |
[!tip] 推论 特别的,$n+1$ 个向量的 $n$ 维向量组必线性相关。
这也就是我们所说的 $n>m$ 了。 对于另一个推论,我说 可能无解 的意思是,他对基底的要求比较苛刻。我们之后再来补充