Notation
- $[T]_B$表示,以$B、B$为
输入、输出基
下,$T$变换的矩阵表示 - $[I]_{BB’}$表示分别以$B、B’$为
输入、输出基
下,$I$变换的矩阵表示。 - $[x_1]_{B’}$表示$x_1$这个
object
在$B’$下的坐标表示。上述
Abstract
关于基变换算子的一些理解,(秃头进行中…)基变换算子是什么,我们可以用基变换算子干嘛?
- 用基变换算子,当然是对物体object进行基变换的鸭
- 探索对于同一个线性变换,在给定不同的输入基以及输出基下,其对应的矩阵有什么联系
什么是基变换算子
这一点是我学习时非常困扰的一点,把一切抛之于脑后,不去想基变换,就把它看成是一种变换,这样就好解释了。首先我们说明:基变换是一种线性变换,这个自己验证即可,而一个从$U->V$的线性变换是
客观存在的
,只有当我们给定$U、V$的一组基后,这个线性变换的矩阵表示
才被确定下来。我们知道,给定$U、V$空间的一组基$B=[u_1,u_2…u_n],B’=[v_1,v_2…v_m]$从$U->V$空间的任意线性变换$T$,都对应着一个矩阵表示。现在我们引出一个问题:基变换也是线性变换,那么我们给定一组基$B=[u_1,u_2…u_n]、B’=[v_1,v_2…v_n]$,基变换是从基$B1->B1’$,请问$B、B’$与$B1、B1’$之间都是基,那他们有什么联系呢?
这是我学习时非常非常困惑的一点,按照我的理解,这两者没有任何联系,他们所表示的内容是两个不同的概念:
把基变换算子就抽象出一个变换,其输入空间与输出空间都是$R^n$(管它什么基变换不变换的,就看成是一个变换),而一个线性变换要在给定输入空间的一组输入基、输出空间的一组输出基下,才能给出其唯一的矩阵表示。上面的输入、输出基,即是$B、B’$。那么可能就有人问了:“那$B1、B1’$是啥呢?”,我们只要把$B1与B1$’看作是这个线性变换里边儿的元素就可以了。
对应,李老师直接给出线性变换的定义:给定两个基$B=(x_1,x_2…x_n),B’=(y_1,y_2…y_n)$。把$B$变换为$B’$的T表示为
\begin{equation}\label{1}
T(y_i)=x_i
\end{equation}tips:上述定义之中的基$B、B’$是
T要变换的东西,而不是T所在的基
,好绕啊…
基变换算子的作用之一
假设$P$是一个基变换算子$T$的矩阵表示$P=[T]_{BB’}$,
x
是一个object
,其在$B$下的坐标表示为$[x]_{B}$,其在$B’$下的坐标表示为$[x]_{B’}$,那么$[x]_{B’}=P·[x]_{B}$。
基变换算子的矩阵表示是啥
不给定输入基与输出基谈变换的矩阵表示都是耍流氓,上述我们给出了基变换算子的定义,却并未给出该变换输入空间的输入基,输出空间的输出基。来看一下这个表达式
\begin{equation}\label{2}
P=[T]_{BB}=[T]_{B’B’}=[I]_{BB’}=([x_1]_{B’}|[x_2]_{B’}|···|[x_n]_{B’})
\end{equation}
我个人觉得的就是,由于基变换算子太饶了,而我们可以用一个简单的形式来等价表示,即$[I]_{BB’}$,那我们就干脆用$[I]_{BB’}$来表示从B到B’的线性变换的矩阵了。
Prove Equation 3
根据定义,我们可以得到:
\begin{equation}\label{3}
T(y_i)=x_i=\sum_{j=1}^n \alpha_jy_j
\end{equation}
$[\alpha_1, \alpha_2···\alpha_n]$即表示$x_i$这个
object
,在$B’$下的坐标表示,即$\alpha=[x_i]_{B’}$。现在,我们同时考虑对等式3左右两边同时进行T变换:
\begin{equation}\label{4}
T(x_i)=\sum_{j=1}^n\alpha_j·T(y_j) = \sum_{j=1}^n\alpha_jx_j
\end{equation}
这个式子很有趣啊,表示$T(x_i)$在$B$下的坐标表示也为$\alpha$,即$\alpha=[T(x_i)]_{B}$,结合等式3,那么就是
\begin{equation}\label{5}
[x_i]_{B’} = [T(x_i)]_B
\end{equation}
这样我们可以得到如下:
\begin{equation}\label{6}
[T]_b = ([T(x_1)]_B,[T(x_2)]_B···[T(x_n)]_B) = ([x_1]_{B’},[x_2]_{B’}···,[x_n]_B’) = [T]_{B’}
\end{equation}
证明$[I]_{BB’}$与他们相等也很简单
\begin{equation}\label{7}
[I]_{BB’}=[[I(x_n)]_{B’},[I(x_2)]_{B’}···,[I(x_n)]_{B’}]=[[x_1]_{B’},[x_2]_{B’}···,[x_n]_{B’}]=[T]_{B’}
\end{equation}
我靠,这也太神奇了,从而,研究从$B->B’$的基变换算子,我们就可以研究$[I]_{BB’}$这个矩阵了。
基变换算子的作用之二
考虑这样一种情况,$A$是在$V$上的一个线性算子
(linear operator)
,$B、B’$分别是$V$的两组基,那么$[A]_B$与$[A]_{B’}$这两个矩阵既然表示同样线性变换,那么它们有什么联系呢?
\begin{equation}\label{8}
[A]_B = P^{-1}[A]_{B’}P
\end{equation}
where $P = [I]_{BB’}$,这个很好理解嘛,我们把两边都乘以$[x]_B$,即
\begin{equation}\label{9}
[A]_B[x]_B = P^{-1}[A]_{B’}P[x]_B
\end{equation}
学废了吗?因为这个东西,所以如果我们已知一个线性变换的矩阵表示$[A]_B$,那么我们通过变换基,可以得到其更好的矩阵表示形式$[A]_{B’}$,这样在特定情况下就可以方便问题求解了。(一定要注意:线性变换是
客观存在
的,上述讨论的只是线性算子,即输入空间、输出空间是一样的。并且仅考虑输入空间、输出空间的基也是一样的。就相当于控制变量嘛,有同学可能要问了,那诸如投影算子这些呢,它们输入、输出空间肯定不一样鸭。这种情况不在我们的讨论范围之内,因为这样的话它的矩阵表示肯定不是满秩了,肯定会有维度的损失。)