Skip to content

Canonical Forms

대각화 요약

  1. nn차원 벡터공간 V\mathbf{V} 의 선형연산자 T\operatorname{T} 를 대각행렬 [T]β[\operatorname{T}]_{\beta} 로 표현할 수 있는 기저 β\beta 가 존재하면 T\operatorname{T} 를 대각화가능하다고 말한다.

  2. T\operatorname{T} 를 대각화 할 수 있는 기저를 β={v1,v2,,vn}\beta = \{v_1, v_2, \dots, v_n\} 로 두면 T\operatorname{T} 를 대각행렬로 표현하는 과정에서 반드시 T(vi)=λivi\operatorname{T}(v_i) = \lambda _iv_i 꼴의 결과가 나오게 된다.

    바로 이 형태 T(v)=λv\operatorname{T}(v) = \lambda v 를 일반화하여 vv 를 고유벡터, λ\lambda 를 고윳값이라 정의한다.

  3. 그러면 T\operatorname{T} 를 대각화할 수 있다는 것은 T\operatorname{T} 의 고유벡터로 이루어진 V\mathbf{V} 의 기저가 존재한다는 것이 된다.

  4. 따라서 T\operatorname{T} 를 대각화하고 싶다면 V\mathbf{V} 안에서 서로 일차독립인 T\operatorname{T} 의 고유벡터들을 nn개 찾기만 하면 된다. 그러면 서로 일차독립인 T\operatorname{T} 의 고유벡터 nn개를 어떻게 찾는가?

  5. (고윳값 구하기) 특성다항식의 근을 구하면 선형연산자가 지니는 모든 고윳값을 하나도 빠짐없이 알 수 있다. 선형연산자의 서로 다른 고윳값은 최대 nn개이다(정리 5.3). 만약 특성다항식의 근이 존재하지 않으면 고윳값도 존재하지 않으며 대각화 불가능하다.

  6. (고유벡터 구하기) 고유공간은 고윳값에 대응하는 모든 고유벡터들의 집합이며 V\mathbf{V} 의 부분공간이다. 따라서 고유공간의 기저를 구하면 고윳값에 대응하는 일차독립인 고유벡터들을 구할 수 있다.

  7. 각각의 고윳값에 대응하는 일차독립 집합들의 합집합은 일차독립이다(정리 5.8). 또한 고유공간의 차원은 항상 고윳값의 중복도와 같거나 작다(정리 5.7).

  8. 따라서 만약 특성다항식의 근이 nn개라면, 각 고유공간은 1차원이고 그것들의 기저를 모으면 선형연산자 T\operatorname{T} 를 대각화하는 V\mathbf{V} 의 기저를 얻는다. 즉, 대각화 가능하다.

    만약 특성다항식의 근이 nn개 보다 작다면, 어떤 고윳값의 중복도가 2 이상이라는 것이다. 그러한 고윳값의 고유공간의 차원이 중복도보다 작으면, 아무리 모든 고유공간의 기저를 모아도 일차독립인 고유벡터들의 개수가 nn 보다 작을 수밖에 없고, 대각화 불가능하다. 즉, 어떤 고유공간이 너무 작으면 대각화 불가능하다.

    따라서 이 경우 T\operatorname{T} 가 대각화 가능하려면 중복도가 2 이상인 고윳값의 고유공간의 차원이 반드시 중복도와 같아야 한다. 그러면 대각화 가능하고, 고유공간의 기저를 모으면 T\operatorname{T} 를 대각화하는 V\mathbf{V} 의 기저를 얻는다.

    그러면 이 문장 하나로 모든 것을 요약할 수 있다. T\operatorname{T} 의 고유공간의 기저의 합집합이 V\mathbf{V} 의 기저가 되면 T\operatorname{T} 는 대각화 가능하다. 이 과정이 어떤 이유에서든 실패하면 T\operatorname{T} 는 대각화 불가능하다.

  9. 그러나 T\operatorname{T} 를 대각화할 수 없는 경우라고 해도 아직 희망은 남아있다. 물론 대각행렬표현이 T\operatorname{T} 를 가장 단순하게 표현할 수 있는 형태이긴 하지만, 이 형태를 대체할 수 있는 여러가지 행렬표현 형태들이 존재한다. 이 행렬표현을 표준형이라 한다.

    대각화 불가능한 T\operatorname{T} 의 특성다항식이 완전히 인수분해되는 경우 조르당 표준형으로 T\operatorname{T} 를 행렬표현하면 된다.

    대각화 불가능한 T\operatorname{T} 의 특성다항식이 완전히 인수분해되지 않으면 유리 표준형으로 T\operatorname{T} 를 행렬표현한다.

  • 대각화 요약을 그대로 가져와서 다시 한 번 강조한 것이다.

Generalized Eigenvector and Eigenspace

일반화된 고유벡터(generalized eigenvector)

벡터공간 V\mathbf{V} 의 선형연산자 T\operatorname{T} 와 스칼라 λ\lambda 와 어떤 양의 정수 pp 에 대하여 (TλI)p(x)=0(\operatorname{T}-\lambda \operatorname{I})^{p}(x) = 0 을 만족하는 xV{0}x \in \mathbf{V}\setminus \{0\} 를 고윳값 λ\lambda 에 대응하는 T\operatorname{T} 의 일반화된 고유벡터라 한다.

일반화된 고유공간(generalized eigenspace)

벡터공간 V\mathbf{V} 의 선형연산자 T\operatorname{T}T\operatorname{T} 의 고윳값 λ\lambda 에 대하여 다음 집합을 λ\lambda 에 대응하는 T\operatorname{T} 의 일반화된 고유공간이라 한다.

Kλ={xV:pZ+:(TλI)p(x)=0} \mathbf{K}_{\lambda } = \{x \in \mathbf{V} : \exists p \in \Bbb{Z}^{+} : (\operatorname{T}-\lambda \operatorname{I})^{p}(x) = 0 \}

정리 7.1

벡터공간 V\mathbf{V} 의 선형연산자 T\operatorname{T}T\operatorname{T} 의 고윳값 λ\lambda 에 대하여 다음이 성립한다.

  1. 일반화된 고유공간 Kλ\mathbf{K}_{\lambda} 는 고유공간 Eλ\mathbf{E}_{\lambda} 를 포함하는 T\operatorname{T}-불변 부분공간이다.

  2. T\operatorname{T} 의 임의의 고윳값 μ\muμλ\mu \neq \lambda 이면 KλKμ={0}\mathbf{K}_{\lambda} \cap \mathbf{K}_{\mu } = \{0\} 이다.

  3. 임의의 스칼라 μλ\mu \neq \lambda 에 대하여 (TμI)Kλ(\operatorname{T}-\mu \operatorname{I})_{\mathbf{K}_{\lambda}} 는 전단사이다.

  • 증명

    1:

    0Kλ0 \in \mathbf{K}_{\lambda} 는 자명하다. 일반화된 고유공간의 정의에 의하여 x,yKλx, y \in \mathbf{K}_{\lambda} 에 대하여 다음을 만족하는 양의 정수 p,qp, q 가 존재한다.

    (TλI)p(x)=(TλI)q(y)=0 (\operatorname{T}-\lambda \operatorname{I})^{p}(x) = (\operatorname{T}-\lambda \operatorname{I})^{q}(y) = 0

    다음이 성립한다.

    (TλI)p+q(x+y)=(TλI)p+q(x)+(TλI)p+q(y)=(TλI)q(0)+(TλI)p(0)=0 \begin{align}\begin{split} (\operatorname{T}-\lambda \operatorname{I})^{p+q}(x+y)&=(\operatorname{T}-\lambda \operatorname{I})^{p+q}(x) + (\operatorname{T}-\lambda \operatorname{I})^{p+q}(y) \\ &= (\operatorname{T}-\lambda \operatorname{I})^{q}(0) + (\operatorname{T}-\lambda \operatorname{I})^{p}(0) = 0\\ \end{split}\end{align} \tag*{}

    따라서 x+yKλx + y \in \mathbf{K}_{\lambda} 이다. 즉, Kλ\mathbf{K}_{\lambda} 는 벡터합에 대하여 닫혀있다. Kλ\mathbf{K}_{\lambda} 가 스칼라 곱에 대하여 닫혀있음을 보이는 것은 쉽다. 따라서 정리 1.3 에 의하여 Kλ\mathbf{K}_{\lambda}V\mathbf{V} 의 부분공간이다. ▲

    xKλx \in \mathbf{K}_{\lambda} 에 대하여 (TλI)p(x)=0(\operatorname{T}-\lambda \operatorname{I})^{p}(x) = 0 인 양의 정수 pp 가 존재한다. T\operatorname{T} 에 대한 다항식은 T\operatorname{T} 와 가환적이다. 즉, T(TλI)=(TλI)T\operatorname{T}(\operatorname{T}-\lambda \operatorname{I})=(\operatorname{T}-\lambda \operatorname{I})\operatorname{T} 이므로 다음이 성립한다.

    (TλI)pT(x)=T(TλI)p(x)=T(0)=0 (\operatorname{T}-\lambda \operatorname{I})^{p}\operatorname{T}(x) = \operatorname{T}(\operatorname{T}-\lambda \operatorname{I})^{p}(x) = \operatorname{T}(0) = 0

    즉, T(x)Kλ\operatorname{T}(x) \in \mathbf{K}_{\lambda} 이다. 따라서 Kλ\mathbf{K}_{\lambda}T\operatorname{T}-불변이다. ▲

    고유공간 Eλ\mathbf{E}_{\lambda} 와 일반화된 고유공간 Kλ\mathbf{K}_{\lambda} 의 정의로부터 EλKλ\mathbf{E}_{\lambda}\subset \mathbf{K}_{\lambda} 는 자명하다. ▲

    2:

    wKλKμw\in \mathbf{K}_{\lambda}\cap \mathbf{K}_{\mu } 이면 다음을 만족하는 자연수 p,qp,q 가 존재한다.

    (TλI)p(w)=(TμI)q(w)=0 (\operatorname{T}-\lambda \operatorname{I})^{p}(w) = (\operatorname{T}- \mu \operatorname{I})^{q}(w) = 0

    tt 에 대한 다항식 (tλ)p(t - \lambda )^{p}(tμ)q(t - \mu )^{q} 는 서로소이므로 다음을 만족하는 다항식 q1,q2q_1, q_2 가 존재한다.

    q1(t)(tλ)p+q2(t)(tμ)q=1 q_1(t)(t - \lambda ) ^{p} + q_2(t)(t - \mu )^{q} = 1

    그러면 다음이 성립한다.

    q1(T)(TλI)p+q2(T)(TμI)q=I q_1(\operatorname{T})(\operatorname{T}-\lambda \operatorname{I})^{p} + q_2(\operatorname{T})(\operatorname{T} - \mu \operatorname{I})^{q} = \operatorname{I}
    q1(T)(TλI)p(w)+q2(T)(TμI)q(w)=w=0 q_1(\operatorname{T})(\operatorname{T}-\lambda \operatorname{I})^{p}(w) + q_2(\operatorname{T})(\operatorname{T} - \mu \operatorname{I})^{q}(w) = w = 0

    3:

    1) 에 의하여 Kλ\mathbf{K}_{\lambda}T\operatorname{T}-불변이므로 Kλ\mathbf{K}_{\lambda}(TμI)(\operatorname{T}-\mu \operatorname{I})-불변이다. xKλx \in \mathbf{K}_{\lambda} 에 대하여 T(x)μxKλ\operatorname{T}(x) - \mu x \in \mathbf{K}_{\lambda} 이기 때문이다.

    어떤 wKλw \in \mathbf{K}_{\lambda} 에 대하여 (TμI)(w)=0(\operatorname{T}- \mu \operatorname{I})(w) = 0 이면 wEμKμw \in \mathbf{E}_{\mu } \subset \mathbf{K}_{\mu } 이므로 2) 에 의하여 w=0w = 0 이다. 따라서 정리 2.4 에 의하여 (TμI)Kλ(\operatorname{T}- \mu \operatorname{I})_{\mathbf{K}_{\lambda}} 는 단사이다. ▲

    xKλx \in \mathbf{K}_{\lambda}(TλI)p(x)=0(\operatorname{T}-\lambda \operatorname{I})^{p}(x) = 0 을 만족하는 가장 작은 양의 정수 pp 에 대하여 W\mathbf{W} 를 다음과 같이 정의하자.

    W=span{x,(TλI)(x),,(TλI)p1(x)} \mathbf{W} = \operatorname{span} \{x, (\operatorname{T}-\lambda \operatorname{I})(x), \dots, (\operatorname{T}-\lambda \operatorname{I})^{p-1}(x)\}

    wWw \in \mathbf{W} 를 스칼라 a0,a1,,ap1a_0, a_1, \dots, a _{p-1} 에 대하여 다음과 같이 두자.

    w=a0x+a1(TλI)(x)++ap1(TλI)p1(x)W w = a_0x+ a_1(\operatorname{T}-\lambda \operatorname{I})(x)+ \dots + a _{p-1}(\operatorname{T}-\lambda \operatorname{I})^{p-1}(x) \in \mathbf{W}
        T(w)=a0T(x)+a1(TλI)(T(x))++ap1(TλI)p1(T(x)) \implies \operatorname{T}(w) = a_0 \operatorname{T}(x)+ a_1(\operatorname{T}-\lambda \operatorname{I})(\operatorname{T}(x))+ \dots + a _{p-1}(\operatorname{T}-\lambda \operatorname{I})^{p-1}(\operatorname{T}(x))

    W\mathbf{W} 의 어떤 원소 ϵ\epsilon 을 다음과 같이 정의하자.

    ϵ=a0λI(x)+a1(TλI)(λI(x))++ap1(TλI)p1(λI(x))W \epsilon = a_0 \lambda \operatorname{I}(x) + a_1(\operatorname{T}-\lambda \operatorname{I})( \lambda \operatorname{I}(x)) + \dots + a _{p-1}(\operatorname{T}-\lambda \operatorname{I})^{p-1}(\lambda \operatorname{I}(x)) \in \mathbf{W}

    그러면 정리 2.10 에 의하여 다음이 성립한다.

    T(w)ϵ=a0(TλI)(x)+a1(TλI)2(x)++ap2(TλI)p1(x)+0W \operatorname{T}(w) - \epsilon = a_0 (\operatorname{T} - \lambda \operatorname{I})(x)+ a_1(\operatorname{T}-\lambda \operatorname{I})^{2}(x)+ \dots + a _{p-2}(\operatorname{T}-\lambda \operatorname{I})^{p-1}(x)+ 0 \in \mathbf{W}

    부분공간은 선형공간이므로 덧셈에 대하여 선형이다. 따라서 다음이 성립한다.

    T(w)W \operatorname{T}(w) \in \mathbf{W}

    즉, W\mathbf{W}Kλ\mathbf{K}_{\lambda}T\operatorname{T}-불변 부분공간이다. 그러면 W\mathbf{W}(TμI)(\operatorname{T}-\mu \operatorname{I})-불변이다. wW    T(w)μwWw \in \mathbf{W} \implies \operatorname{T}(w) - \mu w \in \mathbf{W} 이기 때문이다. 즉, (TμI)(W)W(\operatorname{T}-\mu \operatorname{I})(\mathbf{W}) \subset \mathbf{W} 이다. (TμI)Kλ(\operatorname{T}-\mu \operatorname{I})_{\mathbf{K}_{\lambda}} 가 단사이므로 (TμI)W(\operatorname{T}-\mu \operatorname{I})_{\mathbf{W}} 도 단사이다. W\mathbf{W} 는 유한차원이므로 정리 2.5 에 의하여 (TμI)W(\operatorname{T}-\mu \operatorname{I})_{\mathbf{W}} 는 전사이다. xWKλx \in \mathbf{W} \subset \mathbf{K}_{\lambda} 인데 (TμI)W(\operatorname{T}-\mu \operatorname{I})_{\mathbf{W}} 가 전단사이므로 (TμI)(y)=x(\operatorname{T}-\mu \operatorname{I})(y) = xyWKλy \in \mathbf{W} \subset \mathbf{K}_{\lambda} 가 존재한다.

    즉, 위와 같은 논리로 임의의 벡터 vKλv \in \mathbf{K}_{\lambda} 에 대하여 (TμI)(y)=v(\operatorname{T}-\mu \operatorname{I})(y) = vyKλy \in \mathbf{K}_{\lambda} 가 항상 존재한다는 것을 보일 수 있다. 그러면 전사의 정의 에 의하여 (TμI)Kλ(\operatorname{T}-\mu \operatorname{I})_{\mathbf{K}_{\lambda}} 는 전사이다. ■

정리 7.2

유한차원 벡터공간 V\mathbf{V} 의 선형연산자 T\operatorname{T} 의 특성다항식이 완전히 인수분해되면 중복도가 mmT\operatorname{T} 의 고윳값 λ\lambda 에 대하여 다음이 성립한다.

  1. dim(Kλ)m\dim (\mathbf{K}_{\lambda})\leq m

  2. Kλ=ker((TλI)m)\mathbf{K}_{\lambda} = \ker((\operatorname{T}-\lambda \operatorname{I})^{m})

  • 1) 은 정리 5.7 이 일반화된 것이다.

  • 2) 는 고유공간의 정의 가 일반화된 것이다.

  • 증명

    1:

    TKλ\operatorname{T}_{\mathbf{K}_{\lambda}} 의 특성다항식을 h(t)h(t) 로 두자. 정리 7.1-(2) 는 일반화된 고유공간에 다른 일반화된 고유공간의 고유벡터가 존재하지 않는다는 것을 보장해준다. 따라서 TKλ\operatorname{T}_{\mathbf{K}_{\lambda}} 는 유일한 고윳값 λ\lambda 를 갖는다. d=dim(Kλ)d = \dim (\mathbf{K}_{\lambda}) 로 두면 정리 5.3 에 의하여 h(t)=(1)d(tλ)dh(t) = (-1)^{d}(t - \lambda )^{d} 이다. 정리 5.20 에 의하여 TKλ\operatorname{T}_{\mathbf{K}_{\lambda}} 의 특성다항식 h(t)h(t)T\operatorname{T} 의 특성다항식을 나눈다. 따라서 dmd \leq m 이다. ▲

    2:

    ker((TλI)m)\ker((\operatorname{T} - \lambda \operatorname{I})^{m}) 은 일반화된 고유공간 Kλ\mathbf{K}_{\lambda} 에 포함될 조건을 만족하므로 ker((TλI)m)Kλ\ker((\operatorname{T} - \lambda \operatorname{I})^{m}) \subset \mathbf{K}_{\lambda} 이다. ▲

    μλ\mu \neq \lambda 인 고윳값 μ\mu 에 대하여 (tμ)(t - \mu ) 을 곱한 꼴인 g(t)g(t) 에 대하여 T\operatorname{T} 의 특성다항식은 f(t)=(tλ)mg(t)f(t) = (t - \lambda )^{m}g(t) 이다. 정리 7.1-(3) 에 의하여 g(T)Kλg(\operatorname{T})_{\mathbf{K}_{\lambda}} 는 전사이다. 따라서 xKλx \in \mathbf{K}_{\lambda} 에 대하여 g(T)(y)=xg(\operatorname{T})(y) = xyKλy \in \mathbf{K}_{\lambda} 가 항상 존재한다. 케일리-해밀턴 정리 에 의하여 다음이 성립한다.

    (TλI)m(x)=(TλI)mg(T)(y)=f(T)(y)=0 (\operatorname{T}-\lambda \operatorname{I})^{m}(x) = (\operatorname{T}-\lambda \operatorname{I})^{m}g(\operatorname{T})(y) = f(\operatorname{T})(y) = 0

    따라서 xker((TλI)m)    Kλker((TλI)m)x \in \ker((\operatorname{T}-\lambda \operatorname{I})^{m}) \implies \mathbf{K}_{\lambda}\subset \ker((\operatorname{T}-\lambda \operatorname{I})^{m}) 이다. ■

정리 7.3

유한차원 벡터공간 V\mathbf{V} 의 선형연산자 T\operatorname{T} 의 특성다항식이 완전히 인수분해되면 T\operatorname{T} 의 서로 다른 고윳값 λ1,,λk\lambda _1, \dots, \lambda _k 와 임의의 xVx \in \mathbf{V}i{1,,k}i \in \{1, \dots, k\} 에 대하여 다음을 만족하는 벡터 viKλiv_i \in \mathbf{K}_{\lambda_i} 가 유일하게 존재한다.

x=v1+v2++vk x = v_1 + v_2 + \dots + v_k
  • 증명

    T\operatorname{T} 의 특성다항식을 다음과 같이 두자.

    f(t)=(tλ1)n1(tλ2)n2(tλk)nk f(t) = (t - \lambda _1)^{n_1} (t - \lambda _2)^{n_2}\dots (t - \lambda _k)^{n_k}

    j{1,,k}j \in \{1,\dots,k\} 에 대하여 fj(t)f_j(t) 를 다음과 같이 두자.

    fj(t)=iji=1k(tλi)ni f_j(t) = \prod_{\substack{i \neq j \\ i = 1}}^{k}(t - \lambda _i)^{n_i}

    다항식 fi(t)f_i(t) 들은 서로소이므로 서로소 다항식들의 관계 정리에 대하여 다음이 성립한다.

    q1(x)f1(x)+q2(x)f2(x)++qk(x)fk(x)=1 q_1(x)f_1(x) + q_2(x)f_2(x) + \dots + q_k(x)f_k(x) = 1

    따라서 vVv \in \mathbf{V} 에 대하여 다음이 성립한다.

    q1(T)f1(T)(v)+q2(T)f2(T)(v)++qk(T)fk(T)(v)=v q_1(\operatorname{T})f_1(\operatorname{T})(v) + q_2(\operatorname{T})f_2(\operatorname{T})(v) + \dots + q_k(\operatorname{T})f_k(\operatorname{T}) (v) = v

    두 다항식은 가환적이다. vi=qi(T)fi(T)(v)=fi(T)qi(T)(v)v_i = q_i(\operatorname{T})f_i(\operatorname{T})(v) = f_i(\operatorname{T})q_i(\operatorname{T})(v) 라 하면 케일리-해밀턴 정리 에 의하여 다음이 성립한다.

    (TλiI)ni(vi)=(TλiI)nifi(T)qi(T)(v)=f(T)(qi(T)(v))=0 (\operatorname{T}-\lambda _i \operatorname{I})^{n_i}(v_i) = (\operatorname{T}-\lambda _i \operatorname{I})^{n_i}f_i(\operatorname{T})q_i(\operatorname{T})(v) = f(\operatorname{T})(q_i(\operatorname{T})(v)) = 0

    즉, viKλiv_i \in \mathbf{K}_{\lambda_i} 이다. 이로써 v=i=1kviv = \displaystyle \sum_{i=1}^{k}v_i 를 만족하는 viKλiv_i \in \mathbf{K}_{\lambda_i} 들의 존재성이 증명되었다. ▲

    이제 viv_i 들의 유일성을 증명하자. 정리 7.1-(1) 에 의하여 Kλj\mathbf{K}_{\lambda_j}T\operatorname{T}-불변이다. 따라서 각 Kλj\mathbf{K}_{\lambda_j} 들은 fj(T)f_j(\operatorname{T})-불변이다. 정리 7.1-(3) 에 의하여 fj(T)f_j(\operatorname{T})Kλj\mathbf{K}_{\lambda_j} 에서 단사이고 정리 7.2-(2) 에 의하여 iji \neq j 에 대하여 zKλi    fj(T)(z)=0z \in \mathbf{K}_{\lambda_i} \implies f_j(\operatorname{T})(z) = 0 이다. 즉, fj(T)(Kλi)={0}f_j(\operatorname{T})(\mathbf{K}_{\lambda_i}) = \{0\} 이다.

    i{1,,k}i \in \{1,\dots,k\} 에 대한 vi,wiKλiv_i, w_i \in \mathbf{K}_{\lambda_i} 에 대하여 v=i=1kvi=i=1kwi\displaystyle v = \sum_{i=1}^{k}v_i = \sum_{i=1}^{k}w_i 라 하면 j{1,,k}j \in \{1,\dots,k\} 에 대하여 fj(T)f_j(\operatorname{T}) 는 선형이므로 다음이 성립한다.

    fj(T)(v)=i=1kfj(T)(vi)=i=1kfj(T)(wi) f_j(\operatorname{T})(v) = \sum_{i=1}^{k}f_j(\operatorname{T})(v_i) = \sum_{i=1}^{k}f_j(\operatorname{T})(w_i)

    iji \neq j 이면 fj(T)(vi)=fj(T)(wi)=0f_j(\operatorname{T})(v_i) = f_j(\operatorname{T})(w_i) = 0 이므로 fj(T)(vj)=fj(T)(wj)f_j(\operatorname{T})(v_j) = f_j(\operatorname{T})(w_j) 이다. fj(T)f_j(\operatorname{T})Kλj\mathbf{K}_{\lambda_j} 에서 단사이므로 vj=wjv_j = w_j 이다. ■

정리 7.4

유한차원 벡터공간 V\mathbf{V} 의 선형연산자 T\operatorname{T} 의 특성다항식이 다음과 같이 완전히 인수분해된다고 가정하자.

(λ1t)m1(λ2t)m2(λkt)mk (\lambda _1 - t)^{m_1}(\lambda _2 - t)^{m_2}\dots(\lambda _k - t)^{m_k}

i{1,,k}i \in \{1,\dots,k\}Kλi\mathbf{K}_{\lambda_i} 의 순서기저 βi\beta _i 에 대하여 다음이 성립한다.

  1. ji    βiβj=j \neq i \implies \beta _i \cap \beta _j = \varnothing

  2. β=i=1kβi\displaystyle \beta = \bigcup_{i=1}^{k}\beta _iV\mathbf{V} 의 순서기저이다.

  3. dim(Kλi)=mi\dim (\mathbf{K}_{\lambda_i}) = m_i

  • 증명

    1:

    정리 7.1-(2) 에서 바로 나온다. ▲

    2:

    βi\beta _i 의 벡터들의 합을 viv_i 라 하고 β\beta 의 일차결합을 00 이라 하면 다음이 성립한다.

    v1+v2++vk=0 v_1 + v_2 + \dots + v_k = 0

    이 식은 v1=v2==vk=0v_1 = v_2 = \dots = v_k = 0 일 때 성립한다. 정리 7.3 에 의하여 반드시 v1=v2==vk=0v_1 = v_2 = \dots = v_k = 0 이다. βi\beta _i 는 기저이므로 일차독립이고, vi=0v_i = 0 에서 모든 계수가 00 이 된다. 따라서 β\beta 는 일차독립이다. ▲

    정리 7.3 에 의하여 임의의 벡터 vVv \in \mathbf{V} 에 대하여 v=v1+v2++vkv = v_1+v_2+\dots+v_k 인 벡터 viKλiv_i \in \mathbf{K}_{\lambda_i} 가 존재한다. viv_iβi\beta _i 의 일차결합이므로 vvβ\beta 의 일차결합이다. 즉, span(β)=V\operatorname{span} (\beta ) = \mathbf{V} 이다. ▲

    3:

    정리 5.3 에 의하여 T\operatorname{T} 의 특성다항식 f(t)f(t) 에 대하여 dim(V)=deg(f)\dim (\mathbf{V}) = \deg (f) 이다. 따라서 dim(V)=i=1kmi\displaystyle \dim (\mathbf{V}) = \sum_{i=1}^{k}m_i 이다. 한편 2) 는 βi\beta _i 들이 서로 일차독립임을 말해주므로 dim(V)=i=1kdim(Kλi)\displaystyle \dim (\mathbf{V}) = \sum_{i=1}^{k}\dim (\mathbf{K}_{\lambda_i}) 이다. 따라서 i=1k(midim(Kλi))=0\displaystyle \sum_{i=1}^{k}(m_i - \dim (\mathbf{K}_{\lambda_i})) = 0 이다. 정리 7.2-(1) 에 의하여 midim(Kλi)0m_i - \dim (\mathbf{K}_{\lambda_i}) \geq 0 인데 midim(Kλi)>0m_i - \dim (\mathbf{K}_{\lambda_i}) > 0 이면 모순이므로 mi=dim(Kλi)m_i = \dim (\mathbf{K}_{\lambda_i}) 이다. ■

정리 7.4 따름정리

유한차원 벡터공간 V\mathbf{V} 의 선형연산자 T\operatorname{T} 의 특성다항식이 완전히 인수분해되면 다음이 동치이다.

  • T\operatorname{T} 가 대각화가능하다.

  • T\operatorname{T} 의 임의의 고윳값 λ\lambda 에 대하여 Eλ=Kλ\mathbf{E}_{\lambda} = \mathbf{K}_{\lambda} 이다.

  • 증명

    정리 5.8-(1) 은 모든 고윳값 λ\lambda 의 중복도가 dim(Eλ)\dim (\mathbf{E}_{\lambda}) 와 같으면 T\operatorname{T} 가 대각화가능함을 말해준다. 정리 7.4-(3) 은 고윳값의 중복도가 dim(Kλ)\dim (\mathbf{K}_{\lambda}) 와 같으므로 모든 고윳값에 대하여 dim(Eλ)=dim(Kλ)\dim (\mathbf{E}_{\lambda}) = \dim (\mathbf{K}_{\lambda}) 인 것과 T\operatorname{T} 가 대각화가능하다는 것은 동치임을 말해준다.

    T\operatorname{T} 가 대각화가능함을 가정하자. dim(Eλ)=dim(Kλ)\dim (\mathbf{E}_{\lambda}) = \dim (\mathbf{K}_{\lambda}) 이다. EλKλ\mathbf{E}_{\lambda}\subset \mathbf{K}_{\lambda} 이므로 Eλ=Kλ\mathbf{E}_{\lambda}=\mathbf{K}_{\lambda} 이다. ▲

    Eλ=Kλ\mathbf{E}_{\lambda}=\mathbf{K}_{\lambda} 이면 dim(Eλ)=dim(Kλ)\dim (\mathbf{E}_{\lambda}) = \dim (\mathbf{K}_{\lambda}) 이므로 T\operatorname{T} 는 대각화가능하다. ■

The Jordan Canonical Form I

조르당 블록(Jordan block), 조르당 표준형(Jordan canonical form), 조르당 표준기저(Jordan canonical basis)

유한차원 벡터공간 V\mathbf{V} 에서 특성다항식이 완전히 인수분해되는 선형연산자 T\operatorname{T}i{1,,k}i \in \{1,\dots,k\}T\operatorname{T} 의 고윳값 λi\lambda_i 에 대하여 행렬 AiA_i 를 다음과 같이 정의하자.

Ai=(λi)Ai=(λi1000λi0000λi1000λi) A_i = (\lambda _i) \lor A_i = \begin{pmatrix} \lambda_i &1&\dots&0&0\\ 0&\lambda_i &\dots&0&0\\ \vdots &\vdots &\ddots&\vdots &\vdots \\ 0&0&\dots&\lambda_i &1\\ 0&0&\dots&0&\lambda_i \\ \end{pmatrix}

일반화된 고유공간 Kλi\mathbf{K}_{\lambda_i} 의 순서기저 βi\beta _i 를 적절히 선택하여 합집합 β=βi\beta = \bigcup_{}^{}\beta _i 를 만들면 행렬 AiA_i 와 영행렬 OO 에 대하여 다음이 성립한다.

[T]β=(A1OOOA2OOOAk) [\operatorname{T}]_{\beta } = \begin{pmatrix} A_1&O&\dots&O\\ O&A_2&\dots&O\\ \vdots& \vdots& \ddots& \vdots \\ O&O&\dots&A_k\\ \end{pmatrix}
  • 행렬 AiA_i 를 고윳값 λi\lambda_i 에 대응하는 조르당 블록(Jordan block) 이라 한다.

  • 행렬 [T]β[\operatorname{T}]_{\beta }T\operatorname{T} 의 조르당 표준형(Jordan canonical form) 이라 한다.

  • T\operatorname{T} 를 조르당 표준형으로 만드는 순서기저 β\betaT\operatorname{T} 의 조르당 표준기저(Jordan canonical basis) 라 한다.

  • 정리 7.4-(2) 에 의하여 일반화된 고유공간들의 순서기저의 합집합 β\betaV\mathbf{V} 의 순서기저가 된다. 따라서 β\beta 로 선형연산자 T\operatorname{T} 를 행렬표현 할 수 있다.

  • AiA_i 들이 (λ)(\lambda ) 꼴이면 [T]β[\operatorname{T}]_{\beta } 는 대각행렬이 된다.

  • 예시

    C8\Bbb{C}^{8} 의 선형연산자 T\operatorname{T}C8\Bbb{C}^{8} 의 조르당 표준기저 β={v1,v2,,v8}\beta = \{v_1, v_2, \dots, v_8\} 에 대하여 다음 행렬 JJT\operatorname{T} 의 조르당 표준형이다.

    J=[T]β=(2100000002100000002000000002000000003100000003000000000100000000) J = [\operatorname{T}]_{\beta } = \begin{pmatrix} 2 & 1 & 0 & 0 & 0 & 0 & 0 & 0\\ 0 & 2 & 1 & 0 & 0 & 0 & 0 & 0\\ 0 & 0 & 2 & 0 & 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 2 & 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 & 3 & 1 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 3 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\ \end{pmatrix}

    T\operatorname{T} 의 특성다항식은 det(JtI)=(t2)4(t3)2t2\det(J-tI) = (t - 2)^{4}(t - 3)^{2}t ^{2} 이다. 각 고윳값은 그 중복도만큼 JJ 의 대각성분에 등장한다. JJ 는 고윳값 22 에 대한 조르당 블록 A1=(210021002),A2=(2)A_1 = \begin{pmatrix} 2&1&0\\ 0&2&1\\ 0&0&2\\ \end{pmatrix}, A_2 = (2) 와 고윳값 33 에 대한 조르당 블록 A3=(3103)A_3 = \begin{pmatrix} 3&1\\ 0&3\\ \end{pmatrix} 과 고윳값 00 에 대한 조르당 블록 A4=(0100)A_4 = \begin{pmatrix} 0&1\\ 0&0\\ \end{pmatrix} 으로 이루어진 T\operatorname{T} 의 조르당 표준형이다.

    β\beta 의 모든 벡터는 T\operatorname{T} 의 일반화된 고유벡터이고 T\operatorname{T} 의 고유벡터는 v1,v4,v5,v7v_1, v_4, v_5, v_7 이다. 1열, 4열, 5열, 7열만이 유일하게 대각성분만을 지니기 때문에 T(v)=λv\operatorname{T}(v) = \lambda v 꼴이 성립한다. β\beta 의 벡터들이 T\operatorname{T} 의 일반화된 고유벡터의 정의를 만족할까? T(v2)=v1+2v2    (T2I)(v2)=v1\operatorname{T}(v_2) = v_1 + 2v_2 \implies (\operatorname{T}-2 \operatorname{I})(v_2) = v_1 이다. 비슷한 논리로 (T2I)(v3)=v2(\operatorname{T}-2 \operatorname{I})(v_3) = v_2 이다. (T2I)(v1)=(T2I)(v4)=0(\operatorname{T}-2 \operatorname{I})(v_1) = (\operatorname{T}-2 \operatorname{I})(v_4) = 0 이므로 다음이 성립한다.

    (T2I)(v1)=0 (\operatorname{T}-2 \operatorname{I})(v_1) = 0
    (T2I)2(v2)=0 (\operatorname{T}-2 \operatorname{I})^{2}(v_2) = 0
    (T2I)3(v3)=0 (\operatorname{T}-2 \operatorname{I})^{3}(v_3) = 0
    (T2I)(v4)=0 (\operatorname{T}-2 \operatorname{I})(v_4) = 0

    즉, v1,v2,v3,v4v_1, v_2, v_3, v_4T\operatorname{T} 의 일반화된 고유벡터이다. 비슷한 논리로 다음을 얻는다.

    (T3I)(v5)=0 (\operatorname{T}-3 \operatorname{I})(v_5) = 0
    (T3I)2(v6)=0 (\operatorname{T}-3 \operatorname{I})^{2}(v_6) = 0
    (T0I)(v7)=0 (\operatorname{T} - 0 \operatorname{I} )(v_7) = 0
    (T0I)2(v8)=0 (\operatorname{T} - 0 \operatorname{I})^{2}(v_8) = 0
  • 조르당 표준형이 연산자의 특성다항식으로 결정되는 것은 아니다. 가령 위 예시의 β\beta 에 대한 C8\Bbb{C}^{8} 의 선형연산자 T\operatorname{T}' 의 행렬표현(조르당 표준형)이 다음과 같다고 하면 여전히 T\operatorname{T}' 의 특성다항식은 (t2)4(t3)2t2(t-2)^{4}(t-3)^{2}t ^{2} 이지만 조르당 표준형이 JJ 와 다르다.

    J=[T]β=(2000000002000000002000000002000000003000000003000000000000000000) J' = [\operatorname{T}']_{\beta } = \begin{pmatrix} 2 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\ 0 & 2 & 0 & 0 & 0 & 0 & 0 & 0\\ 0 & 0 & 2 & 0 & 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 2 & 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 & 3 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 3 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\ \end{pmatrix}

선형연산자 T\operatorname{T} 의 조르당 표준기저의 벡터 vv 와 이에 대응하는 k×kk \times k 조르당 블록과 그 대각성분 λ\lambda 에 대하여 (TλI)k=0(\operatorname{T}-\lambda \operatorname{I})^{k} = 0 이다.

  • 바로 위의 예시를 가져와서 설명해보자. i{1,2,3,4}i \in \{1,2,3,4\} 에 대하여 (T2I)3(vi)=0(\operatorname{T}-2 \operatorname{I})^{3}(v_i) = 0 이 성립한다. i{5,6}i \in \{5, 6\} 에 대하여 (T3I)2(vi)(\operatorname{T}-3 \operatorname{I})^{2}(v_i) 이다. i{7,8}i \in \{7,8\} 에 대하여 (T0I)2(vi)=0(\operatorname{T}-0 \operatorname{I})^{2}(v_i) = 0 이다.

  • 이 성질로부터 일반화된 고유벡터의 정의가 자연스럽게 유도된다.

cycle

일반화된 고유벡터의 순환(cycle), 순환의 시작벡터(initial vector) 와 종료벡터(end vector), 순환의 길이(length)

벡터공간 V\mathbf{V} 의 선형연산자 T\operatorname{T} 와 고윳값 λ\lambda 에 대응하는 T\operatorname{T} 의 일반화된 고유벡터 xx(TλI)p(x)=0(\operatorname{T}-\lambda \operatorname{I})^{p}(x) = 0 인 가장 작은 자연수 pp 에 대하여 다음 순서집합을 λ\lambda 에 대응하는 T\operatorname{T} 의 일반화된 고유벡터의 순환이라 한다.

{(TλI)p1(x),(TλI)p2(x),,(TλI)(x),x} \{(\operatorname{T} - \lambda \operatorname{I})^{p-1}(x), (\operatorname{T}-\lambda \operatorname{I})^{p-2}(x), \dots, (\operatorname{T}-\lambda \operatorname{I})(x), x\}
  • 벡터 (TλI)p1(x)(\operatorname{T}-\lambda \operatorname{I})^{p-1}(x) 를 순환의 시작벡터라 한다.

  • 벡터 xx 를 순환의 종료벡터라 한다.

  • pp 를 순환의 길이라 한다.

  • 일반화된 고유벡터의 순환은 조르당 연쇄(Jordan chain)이라고도 한다.

  • 조르당 표준기저를 만들기 위해서는 일반화된 고유공간의 순서기저를 "적절히" 선택하면 된다고 했었다. 일반화된 고유공간의 순서기저를 적절히 선택하기만 하면 정리 7.4 에 의하여 조르당 표준기저를 만들 수 있다.

    그렇다면 그 "적절히" 라는 것이 대체 뭘까? 조르당 표준기저 의 예시에서 보았던 조르당 표준기저 β\beta 에 대하여 v1,v2,v3,v4K2v_1, v_2, v_3, v_4 \in \mathbf{K}_{2} 이다. v1,v2,v3v_1, v_2, v_3 는 조르당 블록 A1A_1 을 결정했었는데, 이들 벡터는 다음과 같은 꼴이다. 이때 (T2I)3(v3)=(T2I)2(v2)=(T2I)(v1)=0(\operatorname{T}-2 \operatorname{I})^{3}(v_3) = (\operatorname{T} - 2 \operatorname{I})^{2}(v_2) = (\operatorname{T}-2 \operatorname{I})(v_1) = 0 이다.

    {v1,v2,v3}={(T2I)2(v3),(T2I)(v3),v3} \{v_1, v_2, v_3\} = \{(\operatorname{T}-2 \operatorname{I})^{2}(v_3), (\operatorname{T}-2 \operatorname{I})(v_3), v_3\}

    β\beta 의 서로소 부분집합 β1={v1,v2,v3},β2={v4},β3={v5,v6},β4={v7,v8}\beta _1 = \{v_1,v_2,v_3\}, \beta _2 = \{v_4\}, \beta _3 = \{v_5, v_6\}, \beta _4 = \{v_7, v_8\}T\operatorname{T} 의 일반화된 고유벡터의 순환이다. β\beta 는 이 순환들로 분할된다. 이때 i{1,2,3,4}i \in \{1,2,3,4\} 에 대하여 Wi=span(βi)\mathbf{W}_i = \operatorname{span} (\beta _i) 로 두면 βi\beta _iWi\mathbf{W}_i 의 기저이고 [TWi]βi[\operatorname{T}_{\mathbf{W}_i}]_{\beta _i}T\operatorname{T} 의 조르당 표준형의 ii번째 조르당 블록 AiA_i 가 된다. 즉, [TWi]βi=Ai[\operatorname{T}_{\mathbf{W}_i}]_{\beta _i} = A_i 가 되어 조르당 표준기저를 βi=β\bigcup_{}^{}\beta _i = \beta 로 만들 수 있다.

  • 시작벡터는 순환의 유일한 고유벡터이다. xxT\operatorname{T} 의 고유벡터이면 순환의 길이는 11 이다.

정리 7.5

유한차원 벡터공간 V\mathbf{V} 의 선형연산자 T\operatorname{T} 의 특성다항식이 완전히 인수분해되면 T\operatorname{T} 의 일반화된 고유벡터의 순환의 분할로 표현되는 V\mathbf{V} 의 기저 β\beta 에 대하여 다음이 성립한다.

  1. β\beta 에 속하는 일반화된 고유벡터로 이루어진 임의의 순환 γ\gamma 에 대하여 W=span(γ)\mathbf{W} = \operatorname{span} (\gamma )T\operatorname{T}-불변 부분공간이고 [TW]γ[\operatorname{T}_{\mathbf{W}}]_{\gamma } 는 조르당 블록이다.

  2. β\betaV\mathbf{V} 의 조르당 표준기저이다.

  • 이 정리는 순환을 기반으로 조르당 표준기저를 찾는 방법을 알려준다. 그러나 이 정리를 사용하려면 먼저 일반화된 고유벡터의 순환으로 분할되는 기저의 존재성이 성립해야 한다. 순환으로 분할되는 기저가 존재할 필요충분조건은 특성다항식이 완전히 인수분해된다는 것인데 아래의 정리 7.7 따름정리에서 이를 증명할 것이다.

  • 조르당 표준기저 의 예시에서 순환 {v1,v2,v3}\{v_1, v_2, v_3\} 은 조르당 블록 A1=(210021002)A_1 = \begin{pmatrix} 2&1&0\\ 0&2&1\\ 0&0&2\\ \end{pmatrix} 을 만들었다. 1) 은 임의의 순환, 즉 가령 {v1,v2}\{v_1, v_2\} 를 택해도 조르당 블록 (2102)\begin{pmatrix} 2&1\\ 0&2\\ \end{pmatrix} 이 생성된다는 것을 말해준다. 물론 이런 식으로 조르당 블록을 생성하면 조르당 표준형이 제대로 만들어지지 않는다. 그러나 V\mathbf{V} 의 기저 β\beta 가 순환의 분할로 표현된다는 조건으로 인하여 임의의 순환을 택할 수 없다는 것을 알 수 있다. 반드시 합집합해서 V\mathbf{V} 의 기저가 되는 순환을 택해야 조르당 표준기저를 만들 수 있다. 이는 순환이 되는 극대집합을 택해야 조르당 표준기저를 만들 수 있다는 것을 의미한다. {v1,v2,v3}\{v_1, v_2, v_3\} 은 순환 극대집합이다. {v1}\{v_1\} 이나 {v1,v2}\{v_1, v_2\} 도 순환이지만 극대집합이 아니므로 이것으로 V\mathbf{V} 의 기저를 분할할 수 없다.

  • 증명

    1:

    고윳값 λ\lambda 에 대응하는 길이가 pp 인 순환 γ={v1,v2,,vp}\gamma = \{v_1, v_2, \dots, v_p\}γ\gamma 의 종료벡터 xx 에 대하여 다음이 성립한다.

    i<p    vi=(TλI)pi(x)vp=x i < p \implies v_i = (\operatorname{T}-\lambda \operatorname{I})^{p-i}(x) \land v_p = x

    따라서 (TλI)(v1)=(TλI)(TλI)p1(x)=0(\operatorname{T}-\lambda \operatorname{I})(v_1) = (\operatorname{T}-\lambda \operatorname{I})(\operatorname{T}-\lambda \operatorname{I})^{p-1}(x) = 0 이다. i>1i > 1 일 때는 다음이 성립한다.

    (TλI)(vi)=(TλI)p(i1)(x)=vi1 (\operatorname{T}-\lambda \operatorname{I})(v_i) = (\operatorname{T}-\lambda \operatorname{I})^{p-(i-1)}(x) = v _{i-1}

    즉, 모든 경우에서 (TλI)(\operatorname{T}-\lambda \operatorname{I})W\mathbf{W} 의 기저 γ\gamma 의 벡터를 γ\gamma 의 일차결합으로 사상시킨다. 따라서 W\mathbf{W}(TλI)(\operatorname{T}-\lambda \operatorname{I})-불변이다. 그러면 자명하게 W\mathbf{W}T\operatorname{T}-불변이다. ▲

    T(v1)=λv1\operatorname{T}(v_1) = \lambda v_1 이고 (TλI)(vi)=vi1    T(vi)=vi1+λvi(\operatorname{T}-\lambda \operatorname{I})(v_i) = v _{i-1} \implies \operatorname{T}(v_i) = v _{i-1} + \lambda v_i 이므로 [TW]γ[\operatorname{T}_{\mathbf{W}}]_{\gamma } 는 조르당 블록이다. ▲

    2:

    β\beta 가 순환 β1,β2,,βk\beta _1, \beta _2, \dots, \beta _k 로 분할된다고 하자. 고윳값 λj\lambda _j 에 대응하는 순환 βj={v1j,v2j,,vnj,j}\beta _j = \{v _{1j}, v _{2j}, \dots, v _{n_j,j}\} 에 대하여 1) 에 의하여 다음이 성립한다.

    T(v1j)=λjv1j,T(vij)=vi1,j+λvij \operatorname{T}(v _{1j}) = \lambda _j v _{1j}, \operatorname{T}(v _{ij}) = v _{i-1,j} + \lambda v _{ij}

    즉, 순환 βj\beta _j 은 1) 에 의하여 조르당 블록 AjA_j 를 만든다. 따라서 β\beta 에 대하여 다음이 성립한다.

    [T]β=(A1OOOA2OOOAk) [\operatorname{T}]_{\beta } = \begin{pmatrix} A_1&O&\dots&O\\ O&A_2&\dots&O\\ \vdots& \vdots& \ddots& \vdots \\ O&O&\dots&A_k\\ \end{pmatrix}

    즉, 순환으로 분할되는 V\mathbf{V} 의 기저는 조르당 표준기저이다. ■

문제 7.1-5

고윳값 λ\lambda 에 대응하는 선형연산자 T\operatorname{T} 와 일반화된 고유벡터의 순환 γ1,γ2,,γp\gamma _1, \gamma _2, \dots, \gamma _p 의 시작벡터가 서로 다르면 순환들은 서로소이다.

  • 증명

    순환 γ1,γ2\gamma _1, \gamma _2 의 시작벡터가 서로 다른데도 xγ1,xγ2x \in \gamma _1, x \in \gamma _2 라고 하면 (TλI)q(x)=0(\operatorname{T}-\lambda \operatorname{I})^{q}(x) = 0 를 만족하는 가장 작은 정수 qq 를 찾을 수 있다. 그러면 γ1,γ2\gamma _1, \gamma _2 의 시작벡터는 (TλI)q1(x)(\operatorname{T}-\lambda \operatorname{I})^{q-1}(x) 이다. 이는 모순이다. 따라서 γ1\gamma _1γ2\gamma _2 에 동시에 속하는 원소는 존재하지 않는다. 즉, 시작벡터가 다른 순환들은 서로소이다. ■

정리 7.6

벡터공간의 선형연산자 T\operatorname{T}γ1,γ2,,γq\gamma _1, \gamma _2, \dots, \gamma _{q} 가 각각 T\operatorname{T} 의 고윳값 λ\lambda 에 대한 T\operatorname{T} 의 일반화된 고유벡터의 순환이라 하자. γi\gamma _i 의 시작벡터들이 서로 다르고 시작벡터들의 집합이 일차독립이면 γi\gamma _i 들은 서로소 집합이고 γ=γi\gamma = \bigcup_{}^{}\gamma _i 는 일차독립이다.

  • 증명

    문제 7.1-5 에 의하여 γi\gamma _i 들은 서로소이다. ▲

    γ\gamma 가 일차독립임을 수학적 귀납법으로 보이자. γ=1|\gamma| = 1 이면 자명하다. 자연수 n>1n > 1 에 대하여 γ<n|\gamma | < n 이면 γ\gamma 가 일차독립임을 가정하고 γ=n|\gamma | = n 일 때 일차독립임을 보이면 증명이 끝난다.

    γj={vj,(TλI)(vj),,(TλI)p1(vj)}\gamma_j = \{v_j, (\operatorname{T}-\lambda \operatorname{I})(v_j), \dots, (\operatorname{T}-\lambda \operatorname{I})^{p-1}(v_j)\} 의 꼴이고 (TλI)p(vj)=0(\operatorname{T}-\lambda \operatorname{I})^{p}(v_j) = 0 이다. 즉, γj\gamma_j 에 의해 생성된 부분공간 Wj\mathbf{W}_j(TλI)(\operatorname{T}-\lambda \operatorname{I})-순환 부분공간이다. 문제 5.4-11 에 의하여 Wj\mathbf{W}_j(TλI)(\operatorname{T}-\lambda \operatorname{I})-불변이다. γ=γi\gamma = \bigcup_{}^{}\gamma _i 에 의해 생성된 부분공간을 W\mathbf{W} 로 두면 γi\gamma _i 들이 서로소이므로 W=Wi\mathbf{W} = \bigoplus_{}^{}\mathbf{W}_i 이다. 따라서 wiWiw_i \in \mathbf{W}_i 에 대하여 wW    w=wiw \in \mathbf{W} \iff w = \sum w_i 인데, (TλI)(wi)WiW(\operatorname{T}-\lambda \operatorname{I})(w_i) \in \mathbf{W}_i \subset \mathbf{W} 이고 W\mathbf{W} 는 합에 대하여 닫혀있으므로 다음이 성립한다.

    (TλI)(wi)=(TλI)(wi)=(TλI)(w)W\sum_{}^{}(\operatorname{T}-\lambda \operatorname{I})(w_i) = (\operatorname{T}-\lambda \operatorname{I})\bigg (\sum w_i \bigg ) = (\operatorname{T}-\lambda \operatorname{I})(w) \in \mathbf{W}

    즉, W\mathbf{W}(TλI)(\operatorname{T}-\lambda \operatorname{I})-불변이다. 또한 γ=n|\gamma | = n 이므로 dim(W)n\dim (\mathbf{W}) \leq n 이다. (1)(1)

    U=(TλI)W\operatorname{U} = (\operatorname{T}-\lambda \operatorname{I})_{\mathbf{W}} 라 하고, γi\gamma _i 의 종료벡터를 제거하여 얻은 순환을 γi\gamma '_i 라 하자. γi\gamma _i 의 길이가 11 이면 γi=\gamma '_i = \varnothing 이다. γi\gamma '_i \neq \varnothing 이면 aγi    aU(γi)a \in \gamma '_i \implies a \in \operatorname{U}(\gamma _i) 이다. 반대로 aU(γi){0}    aγia \in \operatorname{U}(\gamma _i) \setminus \{0\} \implies a \in \gamma '_i 이다. 따라서 γ=iγi\gamma ' = \displaystyle \bigcup_{i}^{}\gamma '_i 로 두면 span(γ)=im(U)\operatorname{span} (\gamma ') = \operatorname{im}(\operatorname{U}) 이다. γ=nq|\gamma '| = n - q 이고 γi\gamma_i ' 의 시작벡터는 γi\gamma _i 들의 시작벡터이므로 γi\gamma_i ' 의 시작벡터는 서로 다르다. 그러면 귀납법의 가정에 의하여 γ\gamma ' 은 일차독립이다. 따라서 γ\gamma 'im(U)\operatorname{im}(\operatorname{U}) 의 기저가 된다. 따라서 dim(im(U))=nq\dim (\operatorname{im}(\operatorname{U})) = n - q 이다. (2)(2)

    γi\gamma _i 들의 시작벡터들은 일차독립이고 시작벡터에 U\operatorname{U} 를 한번 더 씌우면 00 가 되므로 시작벡터들은 ker(U)\ker(\operatorname{U}) 에 속한다. 따라서 dim(ker(U))q\dim (\ker(\operatorname{U})) \geq q 이다. (3)(3)

    그러므로 (1),(2),(3)(1), (2), (3)차원정리에 의하여 다음이 성립한다.

    ndim(W)=dim(im(U))+dim(ker(U))(nq)+q=n \begin{align}\begin{split} n &\geq \dim (\mathbf{W}) = \dim (\operatorname{im}(\operatorname{U})) + \dim (\ker(\operatorname{U})) \\ & \geq (n-q) + q = n \\ \end{split}\end{align} \tag*{}

    즉, dim(W)=n\dim (\mathbf{W}) = n 이다. 따라서 γ\gammaW\mathbf{W} 의 기저이고, 곧 일차독립이다. ■

정리 7.6 따름정리

선형연산자의 일반화된 고유벡터의 순환은 일차독립이다.

  • 정리 7.6 의 특수한 경우가 이 정리이다.

정리 7.7

유한차원 벡터공간의 선형연산자 T\operatorname{T}T\operatorname{T} 의 고윳값 λ\lambda 에 대하여 Kλ\mathbf{K}_{\lambda}λ\lambda 에 대응하는 일반화된 고유벡터의 순환으로 분할되는 순서기저를 가진다.

  • 조르당 블록에서의 예시에서 대각성분 2 를 갖는 일반화된 고유공간 K2\mathbf{K}_{2} 의 경우 22 에 대응하는 일반화된 고유벡터의 순환으로 분할되는 순서기저 {v1,v2,v3,v4}\{v_1, v_2, v_3, v_4\} 을 갖는다. 이 순서기저는 순환 {v1,v2,v3}\{v_1, v_2, v_3\} 과 순환 {v4}\{v_4\} 으로 분할된다.

    이 정리는 이렇게 일반화된 고유공간마다 일반화된 고유벡터의 순환으로 분할되는 순서기저가 존재함을 말해준다.

  • 증명

    dim(Kλ)=n\dim (\mathbf{K}_{\lambda}) = n 으로 두고 nn 에 대한 수학적 귀납법으로 증명하자. n=1n = 1 이면 기저의 벡터가 하나이므로 자명하다. ▲

    자연수 n>1n>1 에 대하여 dim(Kλ)<n\dim (\mathbf{K}_{\lambda}) < n 일 때 정리가 성립한다고 가정하자. dim(Kλ)=n\dim (\mathbf{K}_{\lambda}) = n 라 하고, U=(TλI)Kλ\operatorname{U} = (\operatorname{T}-\lambda \operatorname{I})_{\mathbf{K}_{\lambda}} 라 하자.

    정리 7.1-(1) 에 의하여 Kλ\mathbf{K}_{\lambda}T\operatorname{T}-불변이므로 (TλI)(\operatorname{T}-\lambda \operatorname{I})-불변이기도 하고, U\operatorname{U} 의 공역은 Kλ\mathbf{K}_{\lambda} 이다. 따라서 U\operatorname{U}치역 im(U)\operatorname{im}(\operatorname{U})Kλ\mathbf{K}_{\lambda} 의 부분공간이고, dim(im(U))dim(Kλ)\dim (\operatorname{im}(\operatorname{U})) \leq \dim (\mathbf{K}_{\lambda}) 이다. Kλ\mathbf{K}_{\lambda} 의 기저를 β={v1,v2,,vn}\beta = \{v_1, v_2, \dots, v_n\} 로 두면 Kλ\mathbf{K}_{\lambda}U\operatorname{U}-불변이므로

    U(β)β \operatorname{U}(\beta )\subset \beta

    이다. 정리 7.1-(1) 에 의하여 EλKλ\mathbf{E}_{\lambda} \subset \mathbf{K}_{\lambda} 이다. 즉, (TλI)(vi)=0(\operatorname{T}-\lambda \operatorname{I})(v_i) = 0 인 벡터 viEλKλv_i \in \mathbf{E}_{\lambda}\subset \mathbf{K}_{\lambda} 가 존재한다. 따라서 U(β)β\operatorname{U}(\beta ) \subsetneq \beta 가 된다. 그러므로 dim(im(U))<dim(Kλ)\dim (\operatorname{im}(\operatorname{U})) < \dim (\mathbf{K}_{\lambda}) 이다. ▲

    im(U)=(TλI)(Kλ)\operatorname{im}(\operatorname{U}) = (\operatorname{T}-\lambda \operatorname{I})(\mathbf{K}_{\lambda}) 는 연산자 Tim(U)\operatorname{T}_{\operatorname{im}(\operatorname{U})} 의 고윳값 λ\lambda 에 대응하는 일반화된 고유벡터로 이루어진 공간이다. ★ 즉, 귀납법의 가정에 의하여

정리 7.7 따름정리 1

유한차원 벡터공간의 선형연산자 T\operatorname{T} 의 특성다항식이 완전히 인수분해되면 T\operatorname{T} 는 조르당 표준형을 가진다.

  • 이 정리는 선형연산자의 특성다항식이 완전히 인수분해되면 선형연산자가 조르당 표준형을 가진다는 것을 말해준다. 즉, 가정이 성립할 때 조르당 표준기저의 존재성을 보장해준다.

  • 증명

    유한차원 벡터공간을 V\mathbf{V} 라 하자.

    T\operatorname{T} 의 서로 다른 고윳값을 λ1,λ2,,λk\lambda_1, \lambda_2, \dots, \lambda_k 라 하면 정리 7.7 에 의하여 각 ii 에 에 대하여 Kλi\mathbf{K}_{\lambda_i}λi\lambda _i 에 대응하는 일반화된 고유벡터의 순환으로 분할되는 순서기저 βi\beta _i 를 갖는다. β=βi\beta = \bigcup_{}^{}\beta _i정리 7.5(2) 에 의하여 β\betaV\mathbf{V} 의 조르당 표준기저이다.

행렬의 조르당 표준형(Jordan canonical form)

행렬 AFn×nA \in \mathbf{F}^{n \times n} 의 특성다항식이 완전히 인수분해된다고 하자. Fn\mathbf{F}^{n} 의 선형연산자 LA\operatorname{L}_{A} 의 조르당 표준형을 AA 의 조르당 표준형이라 한다.

  • AA 의 특성다항식이 완전히 인수분해되면 LA\operatorname{L}_{A} 의 특성다항식도 완전히 인수분해 된다.

정리 7.7 따름정리 2

n×nn \times n 행렬 AA 의 특성다항식이 완전히 인수분해될 때 다음이 성립한다.

  1. AA 는 조르당 표준형 JJ 를 가진다.
  2. AAJJ 와 닮음이다.
  • 증명

  • 예시

    A=(312105114)R3×3 A = \begin{pmatrix} 3&1&-2\\ -1&0&5\\ -1&-1&4\\ \end{pmatrix} \in \R ^{3 \times 3}

    위 행렬의 특성다항식은 f(t)=det(AtI)=(t3)(t2)2f(t) = \det(A - tI) = -(t-3)(t-2)^{2} 로써 완전히 인수분해된다. 정리 7.4(3) 에 의하여 dim(Kλ1)=1,dim(Kλ2)=2\dim (\mathbf{K}_{\lambda_1}) = 1, \dim (\mathbf{K}_{\lambda_2}) = 2 이다.

    정리 7.2 에 의하여 Kλ1=ker(T3I),Kλ2=ker((T2I)2)\mathbf{K}_{\lambda_1} = \ker(\operatorname{T}-3 \operatorname{I}), \mathbf{K}_{\lambda_2} = \ker((\operatorname{T}-2 \operatorname{I}) ^{2}) 이다. 또한 Eλ1=ker(T3I)=Kλ1\mathbf{E}_{\lambda_1} = \ker(\operatorname{T}-3 \operatorname{I}) = \mathbf{K}_{\lambda_1} 이므로 다음이 성립한다.

    ker(T3I)={(x1x2x3)R3:(012135111)(x1x2x3)=(000)} \ker(\operatorname{T}-3 \operatorname{I}) = \Bigg \{\begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix} \in \R ^{3} : \begin{pmatrix} 0&1&-2\\ -1&-3&5\\ -1&-1&1\\ \end{pmatrix}\begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix} = \begin{pmatrix} 0\\ 0\\ 0\\ \end{pmatrix}\Bigg \}
         \iff
    x22x3=0 x_2 - 2x_3 = 0
    x13x2+5x3=0 -x_1 - 3x_2 + 5x_3 = 0
    x1x2+x3=0 -x_1-x_2+x_3 = 0
         \iff
    x1x3=0    x1=x3 -x_1-x_3 = 0 \implies x_1 = -x_3
         \iff
    (x1x2x3)=(x32x3x3)=(121)x3 \begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix} = \begin{pmatrix} -x_3\\ 2x_3\\ x_3\\ \end{pmatrix} = \begin{pmatrix} -1\\ 2\\ 1\\ \end{pmatrix} x_3

    따라서 β1=(121)\beta _1 = \begin{pmatrix} -1\\ 2\\ 1\\ \end{pmatrix}λ1=3\lambda _1 = 3 에 대응하는 고유벡터이고 Eλ1=Kλ1\mathbf{E}_{\lambda_1} = \mathbf{K}_{\lambda_1} 의 기저이다.

    정리 7.7 에 의하여 Kλ2\mathbf{K}_{\lambda_2} 는 순환으로 분할되는 순서기저를 갖는다. 이 기저는 dim(Kλ2)=2\dim (\mathbf{K}_{\lambda_2}) = 2 이므로 길이가 1 인 두 순환의 합집합이거나 길이가 2 인 순환 하나이다. A2I=(112105114)A - 2I = \begin{pmatrix} 1&1&-2\\ -1&0&5\\ -1&-1&4\\ \end{pmatrix} 의 1행과 3행은 일차종속이다. 따라서 정리 3.6 따름정리 2 에 의하여 A2IA-2I 의 랭크는 22 이다. 그러면 대각화 가능 판정법 정리(2) 에 의하여 dim(Eλ2)=32=1\dim (\mathbf{E}_{\lambda_2}) = 3 - 2 = 1 이다. 만약 기저가 길이가 1 인 두 순환의 합집합이라면 조르당 블록이 (x00x)\begin{pmatrix} x&0\\ 0&x\\ \end{pmatrix} 형태일 것인데 이 경우 dim(Eλ2)=2\dim (\mathbf{E}_{\lambda_2}) = 2 이므로 모순이다. 따라서 기저는 길이가 2 인 한 순환으로 이루어져있다는 결론이 나오며, 다음이 성립한다.

    ker(T2I)={(x1x2x3)R3:(112125112)(x1x2x3)=(000)} \ker(\operatorname{T}-2 \operatorname{I}) = \Bigg \{\begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix} \in \R ^{3} : \begin{pmatrix} 1&1&-2\\ -1&-2&5\\ -1&-1&2\\ \end{pmatrix}\begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix} = \begin{pmatrix} 0\\ 0\\ 0\\ \end{pmatrix}\Bigg \}
         \iff
    x1+x22x3=0 x_1 + x_2 -2 x_3 = 0
    x12x2+5x3=0 -x_1 -2 x_2 +5 x_3 = 0
    x1x2+2x3=0 -x_1 - x_2 +2 x_3 = 0
         \iff
    x2+3x3=0    x2=3x3 -x_2+3x_3 = 0 \implies x_2 = 3x_3
    x1+x3=0    x1=x3 x_1 + x_3 = 0 \implies x_1 = -x_3
    (x1x2x3)=(x33x3x3)=(131)x3 \begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix} = \begin{pmatrix} -x_3\\ 3x_3\\ x_3\\ \end{pmatrix} = \begin{pmatrix} -1\\ 3\\ 1\\ \end{pmatrix}x_3

    따라서 w=(131)w = \begin{pmatrix} -1\\ 3\\ 1\\ \end{pmatrix}λ2\lambda _2 에 대응하는 AA 의 고유벡터이고, 이 벡터를 순환의 시작벡터로 잡으면 (A2I)v=w(A - 2I)v = w 의 임의의 해가 종료벡터가 된다. v=(x1x2x3)v = \begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix} 으로 두면 다음이 성립한다.

    x1+x22x3=1 x_1 + x_2 -2 x_3 = -1
    x12x2+5x3=3 -x_1 -2 x_2 +5 x_3 = 3
    x1x2+2x3=1 -x_1 - x_2 +2 x_3 = 1
         \iff
    x2+3x3=2    x2=3x32 -x_2 + 3x_3 = 2 \implies x_2 = 3x_3 - 2
    x1+3x322x3=1    x1=1x3 x_1 + 3x_3 - 2 -2x_3 = -1 \implies x_1 = 1 - x_3
         \iff
    (x1x2x3)=(1x33x32x3)=v \begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix} = \begin{pmatrix} 1- x_3\\ 3x_3 - 2\\ x_3\\ \end{pmatrix} = v

    가령 x3=0x_3 = 0 으로 두면 v=(120)v = \begin{pmatrix} 1\\ -2\\ 0\\ \end{pmatrix} 가 되므로 λ2=2\lambda _2 = 2 에 대한 일반화된 고유벡터의 순환은 다음과 같다.

    β2={w,v}={(A2I)v,v}={(131),(120)} \beta _2 = \{w, v\} = \{(A-2I)v, v\} = \Bigg \{\begin{pmatrix} -1\\ 3\\ 1\\ \end{pmatrix}, \begin{pmatrix} 1\\ -2\\ 0\\ \end{pmatrix}\Bigg \}

    고유공간의 기저들의 합집합을 구하면 다음과 같다.

    β=β1β2={(121),(131),(120)} \beta = \beta _1 \cup \beta _2 = \Bigg \{\begin{pmatrix} -1\\ 2\\ 1\\ \end{pmatrix}, \begin{pmatrix} -1\\ 3\\ 1\\ \end{pmatrix}, \begin{pmatrix} 1\\ -2\\ 0\\ \end{pmatrix}\Bigg \}

    이는 AA 의 조르당 표준기저이고 다음 행렬 JJAA 의 조르당 표준형이다.

    J=[T]β=(300021002) J = [\operatorname{T}]_{\beta } = \begin{pmatrix} 3&0&0\\ 0&2&1\\ 0&0&2\\ \end{pmatrix}

    정리 5.1 따름정리 에 의하여 β\beta 의 벡터를 열로 가지는 행렬 QQ 에 대하여 J=Q1AQJ = Q ^{-1}AQ 가 성립하므로 JJAA 는 닮음이다.

정리 7.8

유한차원 벡터공간 V\mathbf{V} 의 선형연산자 T\operatorname{T} 의 특성다항식이 완전히 인수분해될 때 V\mathbf{V}T\operatorname{T} 의 일반화된 고유공간의 직합이다.

  • 이는 정리 5.10 을 대각화 불가능한 연산자에 대하여 일반화한 것이다.

  • 증명


        Friedberg, S. H., Insel, A. J., & Spence, L. E. (2018). Linear algebra. Pearson.