前置定义 1 设 VnV_nVn,UmU_mUm 分别是 nnn 维和 mmm 维线性空间,TTT 是一个从 VnV_nVn 到 UmU_mUm 的映射,如果映射 TTT 满足:
(i)任给 α1,α2∈Vn\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2 \in V_nα1,α2∈Vn(从而 α1+α2∈V\boldsymbol{\alpha}_1 + \boldsymbol{\alpha}_2 \in Vα1+α2∈V),有
T(α1+α2)=T(α1)+T(α2)T(\boldsymbol{\alpha}_1 + \boldsymbol{\alpha}_2) = T(\boldsymbol{\alpha}_1) + T(\boldsymbol{\alpha}_2) T(α1+α2)=T(α1)+T(α2)
(ii)任给 α∈Vn\boldsymbol{\alpha} \in V_nα∈Vn,λ∈R\lambda \in \Rλ∈R(从而 λα∈Vn\lambda \boldsymbol{\alpha} \in V_nλα∈Vn),有
T(λα)=λT(α)T(\lambda \boldsymbol{\alpha}) = \lambda T(\boldsymbol{\alpha}) T(λα)=λT(α)
那么,TTT 就称为从 VnV_nVn 到 UmU_mUm 的 线性映射,或称为 线性变换。
描述见 “线性变换及其基本性质”。
设有 nnn 阶矩阵
A=(a11a12⋯a1na21a22⋯a2n⋮⋮⋮an1an2⋯ann)=(α1,α2,⋯,αn)\boldsymbol{A} = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{pmatrix} = (\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n) A=⎝⎜⎜⎜⎛a11a21⋮an1a12a22⋮an2⋯⋯⋯a1na2n⋮ann⎠⎟⎟⎟⎞=(α1,α2,⋯,αn)
其中
αi=(a1ia2i⋮ani)\boldsymbol{\alpha}_i = \begin{pmatrix} a_{1i} \\ a_{2i} \\ \vdots \\ a_{ni} \end{pmatrix} αi=⎝⎜⎜⎜⎛a1ia2i⋮ani⎠⎟⎟⎟⎞
定义 Rn\R^nRn 中的变换 y=T(x)\boldsymbol{y} = T(\boldsymbol{x})y=T(x) 为
T(x)=Ax(x∈Rn)(1)T(\boldsymbol{x}) = \boldsymbol{A} \boldsymbol{x} \ (x \in R^n) \tag{1} T(x)=Ax (x∈Rn)(1)
设 a,b∈Rn\boldsymbol{a}, \boldsymbol{b} \in R^na,b∈Rn,λ∈R\lambda \in Rλ∈R,则
T(a+b)=A(a+b)=Aa+Ab=T(a)+T(b)(2)T(\boldsymbol{a} + \boldsymbol{b}) = \boldsymbol{A} (\boldsymbol{a} + \boldsymbol{b}) = \boldsymbol{A} \boldsymbol{a} + \boldsymbol{A} \boldsymbol{b} = T(\boldsymbol{a}) + T(\boldsymbol{b}) \tag{2} T(a+b)=A(a+b)=Aa+Ab=T(a)+T(b)(2)
T(λa)=A(λa)=λAa=λT(a)(3)T(\lambda \boldsymbol{a}) = \boldsymbol{A} (\lambda \boldsymbol{a}) = \lambda \boldsymbol{A} \boldsymbol{a} = \lambda T(\boldsymbol{a}) \tag{3} T(λa)=A(λa)=λAa=λT(a)(3)
又因为根据式 (1)(1)(1),TTT 的像空间就是由 α1,α2,⋯,αn\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_nα1,α2,⋯,αn 所生成的向量空间
T(Rn)={y=x1a1+x2a2+⋯+xnan∣x1,x2,⋯xn∈R}T(\R^n) = \{ \boldsymbol{y} = x_1 \boldsymbol{a}_1 + x_2 \boldsymbol{a}_2 + \cdots + x_n \boldsymbol{a}_n | x_1, x_2, \cdots x_n \in R \} T(Rn)={y=x1a1+x2a2+⋯+xnan∣x1,x2,⋯xn∈R}
显然,TTT 的像空间为 nnn 维线性空间,所以 TTT 是一个从 nnn 维线性空间到 nnn 维线性空间的映射。
综上所述,根据前置定义 1 可知,TTT 为线性变换。
不妨设单位坐标向量 e1,e2,⋯,en\boldsymbol{e}_1, \boldsymbol{e}_2, \cdots, \boldsymbol{e}_ne1,e2,⋯,en 为单位坐标向量,将它们代入式 (1)(1)(1),则有
αi=T(ei)(i=1,2,⋯,n)(4)\boldsymbol{\alpha}_i = T(\boldsymbol{e}_i) \hspace{1em} (i=1,2,\cdots,n) \tag{4} αi=T(ei)(i=1,2,⋯,n)(4)
可见如果线性变换 TTT 有关系式 T(x)=AxT(\boldsymbol{x}) = \boldsymbol{A} \boldsymbol{x}T(x)=Ax,那么矩阵 A\boldsymbol{A}A 应以 T(ei)T(\boldsymbol{e}_i)T(ei) 为列向量。
反之,设有任意线性变换 y=T(x)\boldsymbol{y} = T(\boldsymbol{x})y=T(x),将单位坐标向量 e1,e2,⋯,en\boldsymbol{e}_1, \boldsymbol{e}_2, \cdots, \boldsymbol{e}_ne1,e2,⋯,en 代入,不妨设满足
T(ei)=βi(i=1,2,⋯,n)T(\boldsymbol{e}_i) = \boldsymbol{\beta}_i \hspace{1em} (i=1,2,\cdots,n) T(ei)=βi(i=1,2,⋯,n)
于是根据式 (2)(2)(2) 和式 (3)(3)(3),有
KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲ T(\boldsymbol{…
设 B=(β1,β2,⋯,βn)\boldsymbol{B} = (\boldsymbol{\beta}_1, \boldsymbol{\beta}_2, \cdots, \boldsymbol{\beta}_n)B=(β1,β2,⋯,βn),则根据上式 (5)(5)(5),有
T(x)=BxT(\boldsymbol{x}) = \boldsymbol{B} \boldsymbol{x} T(x)=Bx
综上所述,Rn\R^nRn 中任何线性变换 TTT,都能用关系式
T(x)=Ax(x∈Rn)T(\boldsymbol{x}) = \boldsymbol{A} \boldsymbol{x} \hspace{1em} (x \in \R^n) T(x)=Ax(x∈Rn)
表示,其中 A=(T(e1),T(e2),⋯,T(en))\boldsymbol{A} = (T(\boldsymbol{e}_1), T(\boldsymbol{e}_2), \cdots, T(\boldsymbol{e}_n))A=(T(e1),T(e2),⋯,T(en))。
将上面的讨论推广到一般的线性空间,我们有
定义 1 设 TTT 是线性空间 VnV_nVn 中的线性变换,在 VnV_nVn 中取定一个基 α1,α2,⋯,αn\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_nα1,α2,⋯,αn,如果这个基在变换 TTT 下的像(用这个基线性表示)为
KaTeX parse error: No such environment: align* at position 16: \left\{ \begin{̲a̲l̲i̲g̲n̲*̲}̲ & T(\boldsymb…
记 T(α1,α2,⋯,αn)=(T(α1),T(α2),⋯,T(αn))T(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n) = (T(\boldsymbol{\alpha}_1), T(\boldsymbol{\alpha}_2), \cdots, T(\boldsymbol{\alpha}_n))T(α1,α2,⋯,αn)=(T(α1),T(α2),⋯,T(αn)),则上式 (6)(6)(6) 可表示为
T(α1,α2,⋯,αn)=(α1,α2,⋯,αn)A(7)T(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n) = (\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n) \boldsymbol{A} \tag{7} T(α1,α2,⋯,αn)=(α1,α2,⋯,αn)A(7)
其中
A=(a11a12⋯a1na21a22⋯a2n⋮⋮⋮an1an2⋯ann)\boldsymbol{A} = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{pmatrix} A=⎝⎜⎜⎜⎛a11a21⋮an1a12a22⋮an2⋯⋯⋯a1na2n⋮ann⎠⎟⎟⎟⎞
那么,A\boldsymbol{A}A 就称为 线性变换 TTT 在基 α1,α2,⋯,αn\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_nα1,α2,⋯,αn 下的矩阵。
显然,矩阵 A\boldsymbol{A}A 由基的像 T(α1),⋯,T(αn)T(\boldsymbol{\alpha}_1),\cdots,T(\boldsymbol{\alpha}_n)T(α1),⋯,T(αn) 唯一确定。