Change Of Basis Operator

Notation

$[T]_B$表示，以$B、B$为输入、输出基下，$T$变换的矩阵表示
$[I]_{BB’}$表示分别以$B、B’$为输入、输出基下，$I$变换的矩阵表示。
$[x_1]_{B’}$表示$x_1$这个object在$B’$下的坐标表示。上述

Abstract

关于基变换算子的一些理解，(秃头进行中…)基变换算子是什么，我们可以用基变换算子干嘛？

用基变换算子，当然是对物体object进行基变换的鸭

探索对于同一个线性变换，在给定不同的输入基以及输出基下，其对应的矩阵有什么联系

什么是基变换算子

这一点是我学习时非常困扰的一点，把一切抛之于脑后，不去想基变换，就把它看成是一种变换，这样就好解释了。首先我们说明：基变换是一种线性变换，这个自己验证即可，而一个从$U->V$的线性变换是客观存在的，只有当我们给定$U、V$的一组基后，这个线性变换的矩阵表示才被确定下来。

我们知道，给定$U、V$空间的一组基$B=[u_1,u_2…u_n]，B’=[v_1,v_2…v_m]$从$U->V$空间的任意线性变换$T$，都对应着一个矩阵表示。现在我们引出一个问题：基变换也是线性变换，那么我们给定一组基$B=[u_1,u_2…u_n]、B’=[v_1,v_2…v_n]$,基变换是从基$B1->B1’$，请问$B、B’$与$B1、B1’$之间都是基，那他们有什么联系呢？

这是我学习时非常非常困惑的一点，按照我的理解，这两者没有任何联系，他们所表示的内容是两个不同的概念：

把基变换算子就抽象出一个变换，其输入空间与输出空间都是$R^n$（管它什么基变换不变换的，就看成是一个变换），而一个线性变换要在给定输入空间的一组输入基、输出空间的一组输出基下，才能给出其唯一的矩阵表示。上面的输入、输出基，即是$B、B’$。那么可能就有人问了：“那$B1、B1’$是啥呢？”，我们只要把$B1与B1$’看作是这个线性变换里边儿的元素就可以了。

对应，李老师直接给出线性变换的定义：给定两个基$B=(x_1,x_2…x_n)，B’=(y_1,y_2…y_n)$。把$B$变换为$B’$的T表示为
\begin{equation}\label{1}
T(y_i)=x_i
\end{equation}

tips：上述定义之中的基$B、B’$是T要变换的东西，而不是T所在的基，好绕啊…

基变换算子的作用之一

假设$P$是一个基变换算子$T$的矩阵表示$P=[T]_{BB’}$，x是一个object，其在$B$下的坐标表示为$[x]_{B}$，其在$B’$下的坐标表示为$[x]_{B’}$，那么$[x]_{B’}=P·[x]_{B}$。

基变换算子的矩阵表示是啥

不给定输入基与输出基谈变换的矩阵表示都是耍流氓，上述我们给出了基变换算子的定义，却并未给出该变换输入空间的输入基，输出空间的输出基。来看一下这个表达式

\begin{equation}\label{2}
P=[T]_{BB}=[T]_{B’B’}=[I]_{BB’}=([x_1]_{B’}|[x_2]_{B’}|···|[x_n]_{B’})
\end{equation}

我个人觉得的就是，由于基变换算子太饶了，而我们可以用一个简单的形式来等价表示，即$[I]_{BB’}$，那我们就干脆用$[I]_{BB’}$来表示从B到B’的线性变换的矩阵了。

Prove Equation 3

根据定义，我们可以得到：

\begin{equation}\label{3}
T(y_i)=x_i=\sum_{j=1}^n \alpha_jy_j
\end{equation}

$[\alpha_1, \alpha_2···\alpha_n]$即表示$x_i$这个object，在$B’$下的坐标表示，即$\alpha=[x_i]_{B’}$。现在，我们同时考虑对等式3左右两边同时进行T变换：

\begin{equation}\label{4}
T(x_i)=\sum_{j=1}^n\alpha_j·T(y_j) = \sum_{j=1}^n\alpha_jx_j
\end{equation}

这个式子很有趣啊，表示$T(x_i)$在$B$下的坐标表示也为$\alpha$，即$\alpha=[T(x_i)]_{B}$，结合等式3，那么就是

\begin{equation}\label{5}
[x_i]_{B’} = [T(x_i)]_B
\end{equation}

这样我们可以得到如下：

\begin{equation}\label{6}
[T]_b = ([T(x_1)]_B,[T(x_2)]_B···[T(x_n)]_B) = ([x_1]_{B’},[x_2]_{B’}···,[x_n]_B’) = [T]_{B’}
\end{equation}

证明$[I]_{BB’}$与他们相等也很简单

\begin{equation}\label{7}
[I]_{BB’}=[[I(x_n)]_{B’},[I(x_2)]_{B’}···,[I(x_n)]_{B’}]=[[x_1]_{B’},[x_2]_{B’}···,[x_n]_{B’}]=[T]_{B’}
\end{equation}

我靠，这也太神奇了，从而，研究从$B->B’$的基变换算子，我们就可以研究$[I]_{BB’}$这个矩阵了。

基变换算子的作用之二

考虑这样一种情况，$A$是在$V$上的一个线性算子(linear operator)，$B、B’$分别是$V$的两组基，那么$[A]_B$与$[A]_{B’}$这两个矩阵既然表示同样线性变换，那么它们有什么联系呢？

\begin{equation}\label{8}
[A]_B = P^{-1}[A]_{B’}P
\end{equation}

where $P = [I]_{BB’}$，这个很好理解嘛，我们把两边都乘以$[x]_B$，即

\begin{equation}\label{9}
[A]_B[x]_B = P^{-1}[A]_{B’}P[x]_B
\end{equation}

学废了吗？因为这个东西，所以如果我们已知一个线性变换的矩阵表示$[A]_B$，那么我们通过变换基，可以得到其更好的矩阵表示形式$[A]_{B’}$，这样在特定情况下就可以方便问题求解了。（一定要注意：线性变换是客观存在的，上述讨论的只是线性算子，即输入空间、输出空间是一样的。并且仅考虑输入空间、输出空间的基也是一样的。就相当于控制变量嘛，有同学可能要问了，那诸如投影算子这些呢，它们输入、输出空间肯定不一样鸭。这种情况不在我们的讨论范围之内，因为这样的话它的矩阵表示肯定不是满秩了，肯定会有维度的损失。）