线性代数

坐标转换和线性变换

空间的基和坐标系

前面讨论了什么是空间,什么是向量空间,什么是子空间,对于一个空间来说基是一个非常重要的属性并且一个空间是有无数组基的,那么一个空间的一组基和另外一组基是怎么变换的

理解空间的基的一个视角就是坐标系,坐标系和空间的基是一一对应的关系,有了空间的基就可以说有了空间的坐标系,有了空间的坐标系就可以说有了空间的基.

举个例子,如下左图二维平面坐标系取一点(12,8),这个坐标是建立在图中红色箭头即一组基的基础上. 同时二维平面有无数组基,因此右图中的一组基又定义了一个坐标系,此时红点的坐标就变成了(2,2).

image-20251213133832562

同样的一个二维平面空间中,我们使用了空间的两组基对应两个坐标系,一个点对应了两个坐标.

第一组基用矩阵表示:

(1001)(128)\begin {pmatrix} 1&0\\ 0&1 \end{pmatrix} \rightarrow \begin {pmatrix} 12\\ 8 \end{pmatrix}

第二组基用矩阵表示:

(4213)(22)\begin {pmatrix} 4&2\\ 1&3 \end{pmatrix} \rightarrow \begin {pmatrix} 2\\ 2 \end{pmatrix}

在n维空间,如果给定一组基,任何一个向量(或者是点)都可以表示成这组基的线性组合,且表示方法唯一.

对于(12,8)这个点:

e1=(10)T,e2=(01)T(128)T=12(10)T+8(01)T=12e1+8e2u=(41)T,v=(23)T(128)T=2(41)T+2(23)T=2u+2ve_1=(1\quad 0)^T,e_2=(0\quad 1)^T\\ (12\quad 8)^T=12(1\quad 0)^T+8(0\quad1)^T=12\vec{e_1}+8\vec{e_2}\\ u=(4\quad 1)^T,v=(2\quad 3)^T\\ (12\quad 8)^T=2(4\quad1)^T+2(2\quad3)^T=2\vec{u}+2\vec{v}

如果给定向量空间V中的一组基B=b1,b2,b3,...bnB={\vec{b_1},\vec{b_2},\vec{b_3},...\vec{b_n}} 以及V中的一个向量x,则x一定可以被这组基线性表示。假设:

x=c1b1+c2b2+c3b3+...++cnbn\vec{x}=c_1\vec{b_1}+c_2\vec{b_2}+c_3\vec{b_3}+...++c_n\vec{b_n}

则称x在这组基B下的坐标为(c1c2...cn)T(c_1\quad c_2\quad ...\quad c_n)^T . 记为[x]B[\vec{x}]_B

举例:

ϵ={e1,e2}[x]ϵ=(128)B={u,v}[x]B=(22)\epsilon=\{\vec{e_1},\vec{e_2}\}\\ [\vec{x}]_\epsilon=\begin {pmatrix} 12\\ 8 \end{pmatrix}\\ B=\{\vec{u},\vec{v}\}\\ [\vec{x}]_B=\begin {pmatrix} 2\\ 2 \end{pmatrix}\\

使用ϵ\epsilon 这种坐标系是最常用的表示方法,这种基叫做标准基(Standard Basis),标准基对应的坐标系就是标准坐标系.

注意不要和标准正交基(Orthonormal)混淆,标准正交基是有无数组的,但标准基在n维空间中只对应一个,这一个基中所有的向量是有n-1个0,只有一个位置对应的元素为1.

其他坐标系与标准坐标系的转换

假设有一组基B=b1,b2,b3,...bnB={\vec{b_1},\vec{b_2},\vec{b_3},...\vec{b_n}} 设立矩阵PB=(b1,b2,b3,...bn)P_B=(\vec{b_1},\vec{b_2},\vec{b_3},...\vec{b_n}) 在这组基下的一个向量[x]B[\vec{x}]_B[x]ϵ=PB[x]B[\vec{x}]_{\epsilon}=P_B[\vec{x}]_B .

比如上面的例子:

(4213)(22)=(128)\begin {pmatrix} 4&2\\ 1&3 \end{pmatrix} \begin {pmatrix} 2\\ 2 \end{pmatrix}= \begin {pmatrix} 12\\ 8 \end{pmatrix}

此时PBP_B 称为坐标转换矩阵.

因此任意坐标系向标准坐标系转换都有:

[x]ϵ=PB[x]B[\vec{x}]_{\epsilon}=P_B[\vec{x}]_B

反过来标准坐标系向任意坐标系转换:

[x]B=PB1[x]ϵ[\vec{x}]_B=P_B^{-1}[\vec{x}]_{\epsilon}

任意坐标系转换

现在考虑任意两个坐标系,它们之间如何相互转换?

假设有一组基B=b1,b2,b3,...bnB={\vec{b_1},\vec{b_2},\vec{b_3},...\vec{b_n}} ,另外一组基C=c1,c2,c3,...cnC={\vec{c_1},\vec{c_2},\vec{c_3},...\vec{c_n}} ,这两组基对应两个坐标系,这两个坐标系如何相互转换?假设B这组基下的一个向量[x]B[\vec{x}]_B , 求[x]C[\vec{x}]_C .

以标准坐标系为桥梁:

[x]ϵ=PB[x]B[x]C=PC1[x]ϵ[x]C=PC1PB[x]B[\vec{x}]_{\epsilon}=P_B[\vec{x}]_B\\ [\vec{x}]_C=P_C^{-1}[\vec{x}]_{\epsilon}\\ \downarrow \\ [\vec{x}]_C=P_C^{-1}P_B[\vec{x}]_B\\

可以把两个矩阵合一起记为:

[x]C=PBC[x]BPBC=PC1PB[\vec{x}]_C=P_{B\rightarrow C}[\vec{x}]_B\\ P_{B\rightarrow C}=P_C^{-1}P_B

同理反过来从C到B:

PCB=PB1PCP_{C\rightarrow B}=P_B^{-1}P_C

两个矩阵互为逆矩阵.

前面从任意坐标系向标准坐标系转换中的PBP_B 默认是:

PB=([b1]ϵ[b2]ϵ[b3]ϵ...[bn]ϵ)P_B=([\vec{b_1}]_\epsilon \quad [\vec{b_2}]_\epsilon \quad [\vec{b_3}]_\epsilon \quad ...\quad [\vec{b_n}]_\epsilon )

我们知道这些基向量在我们要转到的坐标系即标准坐标系的表示.

假设有一组基B=b1,b2,b3,...bnB={\vec{b_1},\vec{b_2},\vec{b_3},...\vec{b_n}} ,另外一组基C=c1,c2,c3,...cnC={\vec{c_1},\vec{c_2},\vec{c_3},...\vec{c_n}} 如果我们知道([b1]C[b2]C[b3]C...[bn]C)([\vec{b_1}]_C \quad [\vec{b_2}]_C \quad [\vec{b_3}]_C \quad ...\quad [\vec{b_n}]_C ) 在这组基下的一个向量[x]B[\vec{x}]_B[x]C[\vec{x}]_C .

那么就有:

PBC=([b1]C[b2]C[b3]C...[bn]C)[x]C=PBC[x]BP_{B\rightarrow C}=([\vec{b_1}]_C \quad [\vec{b_2}]_C \quad [\vec{b_3}]_C \quad ...\quad [\vec{b_n}]_C )\\ [\vec{x}]_C=P_{B\rightarrow C}[\vec{x}]_B\\

举个例子:

b1=1c1+2c2b2=3c1+4c2[b1]C=(1,2)T[b2]C=(3,4)T在这组基下的一个向量[xB]=(2,2)T[x]C\vec{b_1}=1\vec{c_1}+2\vec{c_2}\quad \vec{b_2}=3\vec{c_1}+4\vec{c_2}\\ [\vec{b_1}]_C=(1,2)^T\quad[\vec{b_2}]_C=(3,4)^T\\ 在这组基下的一个向量[\vec{x}_B]=(2,2)^T 求[\vec{x}]_C\\

显然:

PBC=(1324)[x]C=(1324)(22)P_{B\rightarrow C}=\begin {pmatrix} 1&3\\ 2&4 \end{pmatrix} \\ [\vec{x}]_C=\begin {pmatrix} 1&3\\ 2&4 \end{pmatrix} \begin {pmatrix} 2\\ 2 \end{pmatrix}

线性变换

通常数学中,变换是一个函数. 线性代数研究的是线性变换,一个变换T(x)称为线性变换,必须满足:

T(u+v)=T(u)+T(v)T(cu)=cT(u)cRT(u+v)=T(u)+T(v)\\ T(cu)=cT(u) \quad c\in R

只探讨欧几里得空间,矩阵所表示的变换,均为线性变换.

为什么一个矩阵乘以一个向量被称为线性变换?

T(x)=AxT(\vec{x})=A\vec{x}

证明:

T(u+v)=A(u+v)=Au+Av=T(u)+T(v)T(cu)=A(cu)=c(Au)=cT(u)T(\vec{u}+\vec{v})=A(\vec{u}+\vec{v})=A\vec{u}+A\vec{v}=T(\vec{u})+T(\vec{v})\\ T(c\vec{u})=A(c\vec{u})=c(A\vec{u})=cT(\vec{u})