Skip to content

InnerProduct Spaces[2/2]

Unitary[Orthogonal] Operators

유니타리 연산자(unitary operator), 직교연산자(orthogonal operator)

유한차원 \(\mathbf{F}\)-내적공간 \(\mathbf{V}\) 의 선형연산자 \(\operatorname{T}\) 에 대하여 다음과 같이 정의한다.

  • \(\mathbf{F}=\Bbb{C}\) 일 때 \(\forall x \in \mathbf{V} : \| \operatorname{T}(x) \| = \|x\|\)\(\operatorname{T}\) 를 유니타리 연산자라 한다.

  • \(\mathbf{F}=\R\) 일 때 \(\forall x \in \mathbf{V} : \| \operatorname{T}(x) \| = \|x\|\)\(\operatorname{T}\) 를 직교연산자라 한다.

  • 지금까지 공간의 구조를 보존하는 여러 함수들을 다루어왔다. 선형연산자는 벡터 합과 스칼라 곱을 보존하고, 동형사상은 벡터공간의 모든 구조를 그대로 보존했다. 이제는 내적공간에서 길이(노름)를 보존하는 선형연산자를 생각해보자. 길이를 보존한다는 것은 모든 \(x \in \mathbf{V}\) 에 대하여 \(\|\operatorname{T}(x)\| = \|x\|\) 가 성립한다는 것이다.

  • 무한차원 벡터공간에서 길이를 보존하는 연산자는 단사이고 등장 사상(isometry) 이라 한다. 등장 사상은 두 거리 공간의 거리를 보존하는 함수이다. 만약 전사이기까지 한다면 유니타리 연산자 또는 직교연산자라고 한다.

  • 예시

    유클리드 공간에서 \(0 < \theta<\pi\) 에 대하여 각도를 \(\theta\) 만큼 회전하는 변환 \(\operatorname{T}: \R ^{2}\to \R ^{2}\) 는 유클리드 노름을 보존한다. 즉, \(\forall x \in \R ^{2} : \|\operatorname{T}(x)\| = \|x\|\) 이다.

내적 보존 연산자(inner product preservation operator)

유한차원 내적공간 \(\mathbf{V}\) 의 선형연산자 \(\operatorname{T}\) 가 임의의 \(x, y \in \mathbf{V}\) 에 대하여 다음을 만족하면 내적을 보존하는 연산자라 한다.

\[ \big <\operatorname{T}(x), \operatorname{T}(y) \big > = \big <x,y \big > \]
  • 정리 6.18 에 의하여 유니타리 연산자와 직교연산자는 내적 보존 연산자이다.

  • 정리 6.18-(3) 을 만족하는 연산자를 내적을 보존하는 연산자라 한다.

노름 보존 연산자(길이 보존 연산자, norm preservation operator)

유한차원 내적공간 \(\mathbf{V}\) 의 선형연산자 \(\operatorname{T}\) 가 임의의 \(x \in \mathbf{V}\) 에 대하여 다음을 만족하면 노름을 보존하는 연산자라 한다.

\[ \|\operatorname{T}(x)\| = \|x\| \]
  • 정의에 의하여 유니타리 연산자와 직교연산자는 노름 보존 연산자이다.

  • 정리 6.18-(6) 을 만족하는 연산자를 노름을 보존하는 연산자라 한다.

보조정리 3(유니타리 연산자)

내적공간 \(\mathbf{V}\) 의 자기수반연산자 \(\operatorname{U}\) 와 임의의 \(x \in \mathbf{V}\) 에 대하여 다음이 성립한다.

\[ \big <x, \operatorname{U}(x) \big > = 0 \implies \operatorname{U}=\operatorname{T}_0 \]
  • 증명

    \(\operatorname{U}(x) \in \mathbf{V}\) 이므로 \(\big <\operatorname{U}(x), \operatorname{U}(x) \big > = 0\) 이다. 내적의 정의에 의하여 \(\operatorname{U}(x) = 0\) 이다. ■

정리 6.18

유한차원 내적공간 \(\mathbf{V}\) 의 선형연산자 \(\operatorname{T}\) 에 대하여 다음은 동치이다.

  1. \(\operatorname{T}^{*}\operatorname{T} = \operatorname{I}\)

  2. \(\operatorname{T}\operatorname{T}^{*}=\operatorname{I}\)

  3. \(\forall x, y \in \mathbf{V} : \big <\operatorname{T}(x), \operatorname{T}(y) \big > = \big <x,y \big >\)

  4. 정규직교기저 \(\beta\) 에 대하여 \(\operatorname{T}(\beta )\) 도 정규직교기저이다.

  5. \(\operatorname{T}(\beta )\) 가 정규직교기저가 되게 하는 정규직교기저 \(\beta\) 가 존재한다.

  6. \(\forall x \in \mathbf{V} : \|\operatorname{T}(x)\| = \|x\|\)

  • 이 6 가지 명제들은 유니타리 연산자 또는 직교연산자의 정의와 동치이다. 1) 과 2) 는 유니타리 연산자와 직교연산자가 정규연산자임을 말해준다.

    3) 은 내적 보존 연산자의 정의, 6) 은 노름 보존 연산자의 정의이다.

  • 증명

    \(\dim (\mathbf{V}) = n\) 를 가정하자.

    \(1 \implies 2\):

    \(\mathbf{V}\) 의 순서기저 \(\beta\) 에 대하여 정리 2.11 따름정리, 정리 6.10 에 의하여 다음이 성립한다.

    \[ [\operatorname{T}^{*}\operatorname{T}]_{\beta }=[\operatorname{I}]_{\beta } = I_n \iff [\operatorname{T}^{*}]_{\beta }[\operatorname{T}]_{\beta } = I_n \iff [\operatorname{T}]^{*}_{\beta }[\operatorname{T}]_{\beta } = I_n \]

    문제 2.4-10 에 의하여 \(([\operatorname{T}]_{\beta })^{-1} = [\operatorname{T}]^{*}_{\beta }\) 이다. 역행렬의 정의 에 의하여 \([\operatorname{T}]_{\beta }[\operatorname{T}^{*}]_{\beta } = I_n\) 이므로 다음이 성립한다.

    \[ [\operatorname{T}\operatorname{T}^{*}]_{\beta }=[\operatorname{I}]_{\beta } \iff \operatorname{T}\operatorname{T}^{*}=\operatorname{I} \tag*{▲} \]

    \(2 \implies 3\):

    이제 2) 를 가정하면 1) 을 가정할 수 있다. 2) 를 가정하고 3) 을 도출하자. 1) 과 정리 6.9 에 의하여 \(x, y \in \mathbf{V}\) 에 대하여 다음이 성립한다.

    \[ \big <x,y \big > = \big <\operatorname{I}(x), y \big > = \big <\operatorname{T}^{*}\operatorname{T}(x), y \big > = \big <\operatorname{T}(x), \operatorname{T}(y) \big > \tag*{▲} \]

    \(3 \implies 4\):

    \(\beta =\{v_1, v_2, \dots, v_n\}\) 에 대하여 \(\operatorname{T}(\beta ) = \{\operatorname{T}(v_1), \operatorname{T}(v_2), \dots, \operatorname{T}(v_n)\}\) 이므로 다음이 성립한다.

    \[ \big <\operatorname{T}(v_i), \operatorname{T}(v_j) \big > = \big <v_i, v_j \big > = \delta _{ij} \]

    따라서 \(\operatorname{T}(\beta )\) 는 정규직교기저이다. ▲

    \(4 \implies 5\):

    4) 를 가정하면 내적공간에는 정규직교기저가 존재하므로 \(\operatorname{T}(\beta )\) 가 정규직교기저인 정규직교기저가 당연히 존재한다. ▲

    \(5 \implies 6\):

    \(x \in \mathbf{V}, \beta = \{v_1, v_2, \dots, v_n\}\) 로 두면 적절한 \(a_i\) 에 대하여 \(\displaystyle x = \sum_{i=1}^{n}a_iv_i\) 가 성립한다. \(\beta\) 가 정규직교이므로 다음이 성립한다.

    \[ \begin{align}\begin{split} \|x\|^{2} &= \bigg <\sum_{i=1}^{n}a_iv_i, \sum_{j=1}^{n}a_jv_j \bigg > = \sum_{i=1}^{n}\sum_{j=1}^{n}a_i \overline{a_j}\big <v_i,v_j \big >\\ &= \sum_{i=1}^{n}\sum_{j=1}^{n}a_i \overline{a_j}\delta _{ij} = \sum_{i=1}^{n}|a_i|^{2} \\ \end{split}\end{align} \tag*{} \]

    위와 같은 계산은 \(\displaystyle \operatorname{T}(x) = \sum_{i=1}^{n}a_i \operatorname{T}(v_i)\) 에도 똑같이 적용된다. \(\operatorname{T}(\beta )\) 가 정규직교이기 때문이다. 즉, \(\displaystyle \|\operatorname{T}(x)\|^{2} = \sum_{i=1}^{n}|a_i|^{2}\) 이다. 따라서 \(\|\operatorname{T}(x)\| = \|x\|\) 이다. ▲

    \(6 \implies 1\):

    임의의 \(x \in \mathbf{V}\) 에 대하여 다음이 성립한다.

    \[ \big <x,x \big > = \|x\| ^{2} = \|\operatorname{T}(x)\| ^{2} = \big <\operatorname{T}(x), \operatorname{T}(x) \big > = \big <x, \operatorname{T}^{*}\operatorname{T}(x) \big > \]

    정리 6.1 은 내적이 두번째 성분에 대한 덧셈의 선형성이 성립함을 말해준다. 따라서 \(\big <x,x \big > = \big <x, \operatorname{T}^{*}\operatorname{T}(x) \big > \iff \big <x, (\operatorname{I}-\operatorname{T}^{*}\operatorname{T})(x) \big > = 0\) 이다. \(\operatorname{U}=\operatorname{I}-\operatorname{T}^{*}\operatorname{T}\) 로 두면 정리 6.11 에 의하여 \(\operatorname{U}\) 가 자기수반연산자임을 쉽게 알 수 있다. 모든 \(x\) 에 대하여 \(\big <x, \operatorname{U}(x) \big > = 0\) 이므로 보조정리에 의하여 \(\operatorname{U}= \operatorname{I}-\operatorname{T}^{*}\operatorname{T}=\operatorname{T}_0\) 이다. 그러므로 \(\operatorname{T}^{*}\operatorname{T}=\operatorname{I}\) 이다. ■

정리 6.18 따름정리 1

유한차원 실내적공간 \(\mathbf{V}\) 의 선형연산자 \(\operatorname{T}\) 에 대하여 다음은 동치이다.

  • 절댓값이 \(1\) 인 고윳값에 대응하는 \(\operatorname{T}\) 의 고유벡터로 이루어진 정규직교기저가 \(\mathbf{V}\) 에 존재한다.

  • \(\operatorname{T}\) 가 자기수반 직교연산자이다.

  • 증명

    모든 \(i\) 에 대하여 \(\mathbf{V}\)\(\operatorname{T}(v_i) = \lambda _iv_i , |\lambda _i| = 1\) 인 정규직교기저 \(\{v_1, v_2, \dots, v_n\}\) 가 존재함을 가정하면 정리 6.17 에 의하여 \(\operatorname{T}\) 는 자기수반이다. 따라서 \((\operatorname{T}\operatorname{T}^{*})(v_i) = \operatorname{T}(\lambda _iv_i) = \lambda _i \lambda _iv_i = \lambda _i ^{2}v_i = v_i\) 이고, 이에 따라 \(\operatorname{T}\operatorname{T}^{*}=\operatorname{I}\) 이다. 정리 6.18-(2) 와 정리 6.18-(6) 은 동치이므로 \(\operatorname{T}\) 는 직교연산자이다. ▲

    \(\operatorname{T}\) 가 자기수반이면 정리 6.17 에 의하여 \(\mathbf{V}\) 에 모든 \(i\) 에 대하여 \(\operatorname{T}(v_i) = \lambda _i v_i\) 인 정규직교기저 \(\{v_1, v_2, \dots, v_n\}\) 가 존재한다. 이제 고윳값 \(\lambda _i\) 의 절댓값이 \(1\) 임을 증명하면 된다. \(\operatorname{T}\) 가 직교연산자이므로 정리 6.2 에 의하여 다음이 성립한다.

    \[ |\lambda _i| \|v_i\| = \|\lambda _iv_i\| = \|\operatorname{T}(v_i)\| = \|v_i\| \implies |\lambda _i| = 1 \tag*{■} \]

정리 6.18 따름정리 2

유한차원 복소내적공간 \(\mathbf{V}\) 의 선형연산자 \(\operatorname{T}\) 에 대하여 다음은 동치이다.

  • 절댓값이 \(1\) 인 고윳값에 대응하는 \(\operatorname{T}\) 의 고유벡터로 이루어진 정규직교기저가 \(\mathbf{V}\) 에 존재한다.

  • \(\operatorname{T}\) 가 유니타리 연산자이다.

  • 증명

    정리 6.18 따름정리 1 의 증명과 같은 논리로 증명 가능하다.

    다만, 따름정리 1 에서는 자기수반이라는 조건이 필요한데 실내적공간의 고유벡터로 이루어진 정규직교기저 존재성을 보장해주는 정리 6.17 을 사용하기 위해서이다. 복소내적공간에서 고유벡터로 이루어진 정규직교기저 존재성을 보장해주는 정리 6.16 은 정규성이라는 조건만 있으면 되는데, 정규성은 정리 6.18 에 의하여 노름 보존 연산자의 정의와 동치이다. 즉, 유니타리 연산자의 정의와 정규성이 동치이기 때문에 정규성이라는 조건이 본 정리에서 불필요하다.

노름 보존 연산자의 고유벡터의 고윳값의 절댓값은 \(1\) 이다.

  • 증명

    유한차원 내적공간의 노름 보존 연산자 \(\operatorname{T}\) 의 고윳값 \(\lambda\) 에 대응하는 고유벡터 \(v\) 에 대하여 직교연산자 또는 유니타리 연산자의 정의와 노름의 성질에 의하여 다음이 성립한다.

    \[ \|v\| = \|\operatorname{T}(v)\| = \|\lambda v\| = |\lambda | \|v\| \implies |\lambda | = 1 \tag*{■} \]

Reflection

대칭변환(reflection)

\(\R ^{2}\) 의 1차원 부분공간 \(\operatorname{L}_{}\) 에 대하여 다음 선형연산자 \(\operatorname{T}\) 를 대칭변환이라 한다.

\[ \operatorname{T}(x) = \begin{cases} x & x \in \operatorname{L}_{} \\ -x & x \in \operatorname{L}^{\perp} \\ \end{cases} \]
  • \(\operatorname{L}_{}\) 은 평면 위 원점을 지나는 직선이다.

  • 예시

    원점을 지나는 직선 \(\operatorname{L}_{}\) 에 대한 \(\R ^{2}\) 의 대칭변환 \(\operatorname{T}\)\(\|v_1\| = \|v_2\| = 1\)\(v_1 \in \operatorname{L}_{}, v_2 \in \operatorname{L}_{}^{\perp}\) 에 대하여 \(\operatorname{T}(v_1) = v_1, \operatorname{T}(v_2) = -v_2\) 이므로 \(v_1, v_2\) 은 고윳값 \(1, -1\) 에 대응하는 \(\operatorname{T}\) 의 고유벡터이다. 또한 \(\{v_1, v_2\}\)\(\R ^{2}\) 의 정규직교기저이다. 정리 6.18 따름정리 1 에 의하여 \(\operatorname{T}\) 는 직교연산자이며 에르미트 연산자이다.

Unitary[Orthogonal] Matrix

직교행렬(orthogonal matrix), 유니타리 행렬(unitary matrix)

정사각행렬 \(A\) 의 모든 열이 정규직교집합을 이루면, 즉, \(A ^{\top}A = AA ^{\top} = I\) 이면 \(A\) 를 직교행렬이라 한다.

\(A ^{*} A = AA ^{*} = I\) 인 정사각행렬 \(A\) 를 유니타리 행렬이라 한다.

  • 실행렬 \(A\)\(A ^{*}=A ^{\top}\) 를 만족하므로 실 유니타리 행렬은 직교행렬이다.

유니타리[직교] 행렬의 성질(properties of unitary[orthogonal] matrix)

\(\mathbf{F}\in \{\R ,\Bbb{C}\}\) 에 대한 정사각행렬 \(A \in \mathbf{F}^{n \times n}\) 에 대하여 다음은 동치이다.

  1. \(AA ^{*} = I\)

  2. \(A ^{*} A = I\)

  3. \(A\) 의 각 행이 표준내적공간 \(\mathbf{F}^{n}\) 의 정규직교기저이다.

  4. \(A\) 의 각 열이 표준내적공간 \(\mathbf{F}^{n}\) 의 정규직교기저이다.

  5. \(A\) 는 유니타리[직교] 행렬이다.

  6. \(A ^{-1} = A ^{*}\)

  • 증명

    \(1 \iff 2\):

    1) 을 가정하면 문제 2.4-10 에 의하여 \(A, A ^{*}\) 는 가역이고, \(A ^{-1} = A ^{*}\) 이다. 따라서 \(A ^{*}A = I\) 이다. 그 역도 같은 논리로 보일 수 있다. ▲

    \(1 \iff 3\):

    \(A\)\(i\)\(A_i\), \(j\)\(A_j\) 으로 두면 표준내적 \(\big <\cdot ,\cdot \big >\) 에 대하여 \(AA ^{*} = I\) 를 가정하면 다음이 성립한다.

    \[ \delta _{ij} = I _{ij} = (AA ^{*})_{ij} = \sum_{k=1}^{n}A _{ik}(A ^{*})_{kj} = \sum_{k=1}^{n}A _{ik}\overline{A} _{jk} = \big <A_i, A_j \big > \]

    \(\big <A_i,A_j \big > = \delta _{ij}\) 에서 \(A\) 의 각 행이 직교하고, 정규벡터임을 알 수 있다. 정리 6.3 따름정리 2 에 의하여 \(A\) 의 각 행은 일차독립이다. 그 역도 비슷한 논리로 보일 수 있다. 따라서 \(AA ^{*}=I\)\(A\) 의 각 행이 \(\mathbf{F}^{n}\) 의 정규직교기저인 것과 동치임을 알 수 있다. ▲

    \(2 \iff 4\):

    \(1 \iff 3\) 의 증명과 같은 논리로 \(A\) 의 각 열이 \(\mathbf{F}^{n}\) 의 정규직교기저인 것과 조건 \(A ^{*}A = I\) 이 동치임을 보일 수 있다. ▲

    \(1 \iff 5\):

    1) 을 가정하면 2) 도 참이므로 유니타리 행렬의 정의가 바로 나온다. 직교 행렬은 실행렬임을 가정하면 바로 나온다. 역으로, 유니타리[직교] 행렬을 가정하면 1) 과 2) 가 바로 나온다. ▲

    \(1 \iff 6\):

    6) 을 가정하면 유니타리 행렬의 정의가 바로 나오고 1) 을 가정하면 2) 도 참이므로 6) 이 바로 나온다. ■

내적공간의 선형연산자 \(\operatorname{T}\) 가 유니타리[직교] 연산자인 것과 정규직교기저 \(\beta\) 에 대하여 \([\operatorname{T}]_{\beta }\) 가 유니타리[직교] 행렬인 것은 동치이다.

  • 증명

    복소내적공간에서 \([\operatorname{T}]_{\beta }\) 가 유니타리행렬이면 다음이 성립한다.

    \[ [\operatorname{T}]_{\beta }[\operatorname{T}]^{*}_{\beta } = [\operatorname{T}]_{\beta }^{*}[\operatorname{T}]_{\beta } = I \]

    정리 6.10 에 의하여 다음이 성립한다.

    \[ [\operatorname{T}]_{\beta }[\operatorname{T}^{*}]_{\beta } = [\operatorname{T}^{*}]_{\beta }[\operatorname{T}]_{\beta } = I \]

    정리 2.11 따름정리 에 의하여 다음이 성립한다.

    \[ [\operatorname{T}\operatorname{T}^{*}]_{\beta } = [\operatorname{T}^{*}\operatorname{T}]_{\beta } = [\operatorname{I}]_{\beta } \implies \operatorname{T}\operatorname{T}^{*}=\operatorname{T}^{*}\operatorname{T}= \operatorname{I} \]

    정리 6.18 에 의하여 \(\|\operatorname{T}(x)\| = \|x\|\) 이다. ▲

    \(\|\operatorname{T}(x)\| = \|x\|\) 를 가정하면 위의 논리의 역순을 그대로 따라감으로써 유니타리 행렬의 정의에 도달한다. ▲

    이제 복소내적공간에서 이루어진 위의 논리를 실내적공간에서 펼치면 하면 직교행렬과 직교연산자가 동치임을 바로 증명할 수 있다. ■

Unitarily[Orthogonally] Equivalent

\(\mathbf{F}\in \{\R ,\Bbb{C}\}\) 에서 성분을 가져온 \(n \times n\) 복소정규[실대칭] 행렬 \(A\) 에 대하여 \(A\) 의 고유벡터로 이루어진 \(\mathbf{F}^{n}\) 의 정규직교기저가 존재한다.

유니타리 동치(unitarily equivalent), 직교 동치(orthogonally equivalent)

두 행렬 \(A, B\) 와 유니타리[직교] 행렬 \(U\) 에 대하여 \(B = U ^{*}AU\) 가 성립하면 \(A, B\) 를 유니타리[직교] 동치라 한다.

문제 6.5-18

유니타리 동치는 \(\Bbb{C} ^{n \times n}\) 에서 동치관계이다.

직교 동치는 \(\R ^{n \times n}\) 에서 동치관계이다.

직교 동치는 \(\R ^{n \times n}\) 에서 동치관계이다.

  • 증명

    항등행렬은 정리 6.11 따름정리 에 의하여 유니타리 행렬이다. 유니타리 행렬로써 항등행렬을 택하면 다시 정리 6.11 따름정리 에 의하여 \(A \in \Bbb{C} ^{n \times n}\) 에 대하여 다음이 성립한다.

    \[ I ^{*}AI = I ^{*}A = IA = A \tag*{▲} \]

    \(A, B \in \Bbb{C} ^{n \times n}\) 에 대하여 \(B = U ^{*}AU\) 를 만족하는 유니타리 행렬 \(U\) 의 존재를 가정하면 다음이 성립한다.

    \[ UBU ^{*} = UU ^{*}AUU ^{*} = IAI = A \]

    \(U ^{*}\) 는 유니타리 행렬이다. ▲

    마지막으로 \(A, B, C \in \Bbb{C} ^{n \times n}\) 에 대하여 \(B = U ^{*}AU\)\(C = {U'}^{*}BU'\) 를 만족하는 유니타리 행렬 \(U, U'\) 의 존재를 가정하면 다음이 성립한다.

    \[ C = {U'}^{*}U ^{*}AUU' \]

    정리 6.11 따름정리 에 의하여 \((UU') ^{*} = {U'}^{*}U ^{*}\) 이다. 동치관계의 조건 을 모두 만족하므로 증명이 끝났다. 직교 동치가 동치관계인 것도 실정사각행렬 공간 \(\R ^{n \times n}\) 에서 같은 논리로 보일 수 있다. ■

정리 6.19

\(n \times n\) 복소행렬 \(A\) 가 정규행렬인 것은 \(A\) 가 대각행렬과 유니타리 동치인 것과 동치이다.

  • 증명

    \(A\) 가 복소정규 행렬이면 \(A\) 의 고유벡터로 이루어진 \(\mathbf{F}^{n}\) 의 정규직교기저 \(\beta\) 가 존재한다. 정리 5.1 따름정리 에 의하여 \(A\) 는 대각화 가능하다. 다시 정리 5.1 따름정리 에 의하여 대각행렬 \(D\)\(\beta\) 의 벡터를 열로 갖는 행렬 \(Q\) 에 대하여 \(D = Q ^{-1}AQ\) 이다. \(Q\) 의 각 열이 \(\mathbf{F}^{n}\) 의 정규직교기저이므로 \(Q\) 는 유니타리 행렬이다. 따라서 \(A\)\(D\) 는 유니타리 동치이다. ▲

    \(A\) 가 유니타리 행렬 \(P\) 와 대각행렬 \(D\) 에 대하여 \(A = P ^{*}DP\) 임을 가정하면 다음이 성립한다.

    \[ AA ^{*} = (P ^{*}DP)(P ^{*}DP) ^{*} = (P ^{*}DP)(P ^{*}D ^{*}P) = P ^{*}DID ^{*}P = P ^{*}DD ^{*}P \]

    같은 논리로 \(A ^{*}A = P ^{*}D ^{*}DP\) 를 얻는다. \(D\) 는 대각행렬이므로 \(DD ^{*} = D ^{*}D\) 이다. 따라서 \(AA ^{*} = A ^{*}A\) 이다. ■

정리 6.20

\(n \times n\) 실행렬 \(A\) 가 대칭행렬인 것은 \(A\) 가 실대각행렬과 직교 동치인 것과 동치이다.

  • 이 정리는 수학과 통계학의 많은 분야에서 사용된다.

  • 증명

    \(A\) 가 실대칭 행렬이면 \(A\) 의 고유벡터로 이루어진 \(\mathbf{F}^{n}\) 의 정규직교기저 \(\beta\) 가 존재한다. 정리 5.1 따름정리 에 의하여 \(A\) 는 대각화 가능하다. 다시 정리 5.1 따름정리 에 의하여 대각행렬 \(D\)\(\beta\) 의 벡터를 열로 갖는 행렬 \(Q\) 에 대하여 \(D = Q ^{-1}AQ\) 이다. \(Q\) 의 각 열이 \(\mathbf{F}^{n}\) 의 정규직교기저이므로 \(Q\) 는 직교 행렬이다. 따라서 \(A\)\(D\) 는 직교 동치이다. ▲

    증명의 후반부는 정리 6.19 와 비슷하다. ■

  • 예시

    실대칭행렬 \(A = \begin{pmatrix} 4&2&2\\ 2&4&2\\ 2&2&4\\ \end{pmatrix} \in \R ^{3 \times 3}\) 는 대각행렬과 직교 동치이다. 즉, 직교행렬 \(Q\) 와 대각행렬 \(D\) 에 대하여 \(Q ^{\top}AQ = D\) 이다. 이제 이 \(Q, D\) 를 구해보자.

    정리의 증명과정에 따라서 \(A\) 의 고유벡터로 이루어진 \(\R ^{3}\) 의 정규직교기저 \(\beta\) 를 구하면 \(\beta\) 의 열로 구성된 \(Q\) 를 알 수 있다. 그러면 \(D\) 도 계산할 수 있다.

    \(A\) 의 특성다항식은 \(f(t) = \det(A - tI_3) = \det \begin{pmatrix} 4-t&2&2\\ 2&4-t&2\\ 2&2&4-t\\ \end{pmatrix}\) 이므로 다음이 성립한다.

    \[ \begin{align}\begin{split} &\det \begin{pmatrix} 4-t&2&2\\ 2&4-t&2\\ 2&2&4-t\\ \end{pmatrix} =\\ &= (4 - t)\{(4-t) ^{2} - 2 ^{2}\} - 2 \{2(4-t) - 2 ^{2}\} + 2\{2 ^{2}-2(4-t)\}\\ &= (4 - t)(t ^{2} - 8t + 12) + 4 \{2 - (4-t)\} + 4\{2 -(4-t)\}\\ &= (4 - t)(t - 2)(t - 6) + 8(t - 2) \\ &= (t - 2)\{-(t - 4)(t - 6) + 8\} = (t - 2)\{-(t ^{2} - 10t + 24) + 8\} \\ &= (t - 2)(-t ^{2} + 10t - 16) = -(t - 2)(t ^{2} - 10t + 16) \\ &= -(t - 2)(t - 2)(t - 8) = -(t - 2) ^{2}(t - 8)\\ \end{split}\end{align} \tag*{} \]

    따라서 \(A\) 의 고윳값은 \(\lambda _1 = 2, \lambda _2 = 8\) 이다. ▲

    고윳값을 찾았으니 고유공간을 구할 차례이다. \(\lambda _1\) 에 대응하는 고유공간은 다음과 같다.

    \[ \mathbf{E}_{\lambda_1} = \{x \in \R ^{3} : (A - 2I)x = 0 \} = \bigg \{ \begin{pmatrix} x_{1}\\ x_{2}\\ x_{3}\\ \end{pmatrix} \in \R ^{3} : \begin{pmatrix} 2&2&2\\ 2&2&2\\ 2&2&2\\ \end{pmatrix}\begin{pmatrix} x_{1}\\ x_{2}\\ x_{3}\\ \end{pmatrix} = \begin{pmatrix} 0\\ 0\\ 0\\ \end{pmatrix}\bigg \} \]

    이 고유공간의 기저를 다음 연립방정식의 해집합으로 구해보자.

    \[ x_1 + x_2 + x_3 = 0 \implies x_1 = -x_2 -x_3 \]
    \[ \begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix} = \begin{pmatrix} -x_2 - x_3\\ x_2\\ x_3\\ \end{pmatrix} = \begin{pmatrix} -x_2\\ x_2\\ 0\\ \end{pmatrix} + \begin{pmatrix} -x_3\\ 0\\ x_3\\ \end{pmatrix} = x_2 \begin{pmatrix} -1\\ 1\\ 0\\ \end{pmatrix} + x_3 \begin{pmatrix} -1\\ 0\\ 1\\ \end{pmatrix} \]

    이렇게 고유공간 \(\mathbf{E}_{\lambda_1}\) 의 기저 \(\{(-1, 1, 0), (-1, 0, 1)\}\) 을 구할 수 있다. 사실은 다음과 같이 또 다른 기저 \(\{(1,-1,0), (0, -1, 1)\}\) 도 구할 수 있다. 어쨌든 기저 \(\{(-1, 1, 0), (-1, 0, 1)\}\) 를 사용할 것이다.

    \[ \begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix} = \begin{pmatrix} x_1\\ -x_1 - x_3\\ x_3\\ \end{pmatrix} = \begin{pmatrix} x_1\\ -x_1\\ 0\\ \end{pmatrix} + \begin{pmatrix} 0\\ -x_3\\ x_3\\ \end{pmatrix} = x_1 \begin{pmatrix} 1\\ -1\\ 0\\ \end{pmatrix} + x_3 \begin{pmatrix} 0\\ -1\\ 1\\ \end{pmatrix} \]

    \(\lambda _2\) 에 대응하는 고유공간은 다음과 같다.

    \[ \mathbf{E}_{\lambda_2} = \{x \in \R ^{3} : (A - 8I)x = 0 \} \]
    \[ = \bigg \{ \begin{pmatrix} x_{1}\\ x_{2}\\ x_{3}\\ \end{pmatrix} \in \R ^{3} : \begin{pmatrix} -4&2&2\\ 2&-4&2\\ 2&2&-4\\ \end{pmatrix}\begin{pmatrix} x_{1}\\ x_{2}\\ x_{3}\\ \end{pmatrix} = \begin{pmatrix} 0\\ 0\\ 0\\ \end{pmatrix}\bigg \} \]

    이 고유공간의 기저를 다음 연립방정식의 해집합으로 구해보자.

    \[ \begin{cases} -2x_1 + x_2 + x_3 = 0 &\\ x_1 - 2x_2 + x_3 = 0 &\\ x_1 + x_2 - 2x_3 = 0 &\\ \end{cases} \implies x_1 = x_2 = x_3 \]
    \[ \begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix} = \begin{pmatrix} x_1\\ x_1\\ x_1\\ \end{pmatrix} = x_1 \begin{pmatrix} 1\\ 1\\ 1\\ \end{pmatrix} \]

    따라서 \(\mathbf{E}_{\lambda_2}\) 의 기저는 \(\{(1,1,1)\}\) 이다. ▲

    사실 \(A\) 가 대각화가능임을 판정할 필요는 없지만 굳이 판정해보면 대각화 가능 판정법 에 의하여 고윳값의 중복도가 \(2\) 이상인 것들이 고유공간의 차원과 같으므로 \(A\) 는 대각화 가능이다. 즉, \(\lambda _1 = 2\) 에 대응하는 고유공간의 차원이 \(2\) 이고 중복도도 \(2\) 이다.

    이제 각 고유공간의 기저를 통해 \(A\) 의 고유벡터로 이루어진 \(\R ^{3}\) 의 정규직교기저를 얻어보자. 일단 먼저 \(\mathbf{E}_{\lambda_1}\) 의 기저 \(\{(-1, -1, 0), (-1, 0, 1)\}\)그람 슈미트 직교화 로 직교화하여 \(\{(-1, 1, 0), - \frac{1}{2}(1, 1, -2)\}\) 를 얻는다.

    정리 6.15 에 의하여 \((1, 1, 1)\)\(\mathbf{E}_{\lambda_1}\) 의 기저의 벡터들과 수직이다. 정리 5.8 에 의하여 두 고유공간의 기저의 합집합은 \(A\) 의 고유벡터로 이루어진 \(\R ^{3}\) 의 직교기저이다. 이제 이 직교기저를 정규화 하면 다음과 같이 \(A\) 의 고유벡터로 이루어진 \(\R ^{3}\) 의 정규직교기저를 얻는다.

    \[ \bigg \{\dfrac{1}{\sqrt[]{2}}(-1, 1, 0), \dfrac{1}{\sqrt[]{6}}(1, 1, -2), \dfrac{1}{\sqrt[]{3}}(1, 1, 1) \bigg \} \tag*{▲} \]

    이제 드디어 \(P, D\) 를 구해보자. 가능한 \(P, D\) 의 한 가지 경우는 다음과 같다.

    \[ P = \begin{pmatrix} - \dfrac{1}{\sqrt[]{2}}&\dfrac{1}{\sqrt[]{6}}&\dfrac{1}{\sqrt[]{3}}\\ \dfrac{1}{\sqrt[]{2}}&\dfrac{1}{\sqrt[]{6}}&\dfrac{1}{\sqrt[]{3}}\\ 0 &-\dfrac{2}{\sqrt[]{6}}&\dfrac{1}{\sqrt[]{3}}\\ \end{pmatrix}, D = \begin{pmatrix} 2&0&0\\ 0&2&0\\ 0&0&8\\ \end{pmatrix} \]

Schur's theorem in Matrix

정리 6.21 슈어의 정리(Schur's theorem)

행렬 \(A \in \mathbf{F}^{n \times n}\) 의 특성다항식이 \(\mathbf{F}\) 위에서 완전히 인수분해되면 다음이 성립한다.

  1. \(\mathbf{F}=\Bbb{C}\) 이면 \(A\) 는 복소 상삼각행렬과 유니타리 동치이다.

  2. \(\mathbf{F}=\R\) 이면 \(A\) 는 실 상각행렬과 직교 동치이다.

  • 이 정리는 선형연산자의 관점으로 서술된 정리 6.14 슈어의 정리 를 행렬의 관점으로 바꾼 것 뿐이다. 이 정리 또한 슈어의 정리라고 부른다. 먼저 정리 6.14 슈어의 정리를 선형연산자 \(\operatorname{L}_{A}\) 의 관점에서 서술해보면 다음과 같다.

    유한차원 내적공간 \(\mathbf{F}^{n}\) 의 선형연산자 \(\operatorname{L}_{A}\) 의 특성다항식이 완전히 인수분해되면 \([\operatorname{L}_{A}]_{\gamma }\) 가 상삼각행렬이 되게 하는 정규직교기저 \(\gamma\) 가 존재한다.

    \(\mathbf{F}^{n}\) 의 선형연산자 \(\operatorname{L}_{A}\) 의 특성다항식은 \(\mathbf{F}^{n}\) 의 순서기저 \(\beta\) 에 대하여 \(\det([\operatorname{L}_{A}]_{\beta }-tI_n)\) 이다. 문제 5.1-13 에 의하여 특성다항식은 벡터공간의 기저의 선택에 관계없으므로 \(\beta\) 를 표준순서기저로 두면 정리 2.15-(1) 에 의하여 \(\det([\operatorname{L}_{A}]_{\beta } - tI_n) = \det(A - tI_n)\) 이다. 그러면 이는 정사각행렬 \(A\) 의 특성다항식 \(\det(A-tI_n)\) 과 같아진다. 즉, \(\operatorname{L}_{A}\) 의 특성다항식이 완전히 인수분해된다 는 것은 \(A\) 의 특성다항식이 완전히 인수분해된다 는 것과 동치이다.

    정리 2.23 따름정리는 좌측곱변환을 임의의 기저로 표현하는 방법을 말해준다. 즉, \(\gamma\) 의 벡터로 열을 구성한 행렬 \(Q\) 에 대하여 \([\operatorname{L}_{A}]_{\gamma } = Q ^{-1}AQ\) 이다. \(Q\)정규직교기저를 열로 구성한 행렬이므로 유니타리 행렬이다. 따라서 \(A\) 는 복소 상삼각행렬 \([\operatorname{L}_{A}]_{\gamma }\) 와 유니타리 동치이다. 즉, \([\operatorname{L}_{A}]_{\gamma }\) 가 상삼각행렬이 되게 하는 정규직교기저 \(\gamma\) 가 존재한다 는 것은 \(A\) 가 복소상삼각행렬과 유니타리 동치라는 것 과 동치이다.

    이상의 논의를 정리하면 \(A \in \Bbb{C} ^{n \times n}\) 의 특성다항식이 \(\Bbb{C}\) 위에서 완전히 인수분해되면 \(A\) 가 복소 상삼각행렬과 유니타리 동치라고 말할 수 있다.

    한편, \(\operatorname{L}_{A}\) 의 특성다항식이 완전히 인수분해되면 \(A\) 가 복소상삼각행렬과 유니타리 동치이라고 말할 수도 있고, \(A\) 의 특성다항식이 완전히 인수분해되면 \([\operatorname{L}_{A}]_{\gamma }\) 가 상삼각행렬이 되게 하는 정규직교기저 \(\gamma\) 가 존재한다고 말할 수도 있다.

Isometry

등장사상(isometry, 강체운동, rigid motion)

실내적공간 \(\mathbf{V}\) 와 모든 \(x,y \in \mathbf{V}\) 에 대하여 다음을 만족하는 함수 \(f: \mathbf{V}\to \mathbf{V}\) 를 등장사상이라 한다.

\[ \|f(x) - f(y)\| = \|x - y\| \]
  • 강체운동은 물리학에서 모든 점 간의 길이가 보존되는 운동을 뜻한다. 이것을 수학에서는 등장사상, 등거리변환이라 한다.

  • 노름 보존 연산자, 즉 직교 연산자는 자동으로 등장사상이 된다. 그러나 등장사상이라고 해서 노름 보존 연산자라는 보장은 없다. 노름공간과 거리공간의 관계를 다시 확인해보면 바로 알 수 있다.

평행이동(translation)

실내적공간 \(\mathbf{V}\) 에서 모든 \(x \in \mathbf{V}\) 에 대하여 \(g(x) = x + v_0\) 인 벡터 \(v_0 \in \mathbf{V}\) 가 존재하는 함수 \(g: \mathbf{V}\to \mathbf{V}\)\(v_0\) 에 의한 평행이동이라 한다.

  • 평행이동은 강체운동의 한 예시이다.

정리 6.22

유한차원 실내적공간 \(\mathbf{V}\) 와 등장사상 \(f: \mathbf{V}\to \mathbf{V}\) 에 대하여 \(f = g \circ \operatorname{T}\) 를 만족하는 직교연산자 \(\operatorname{T}\) 와 평행이동 \(g\) 가 유일하게 존재한다.

  • 이 정리는 존재하는 모든 등장사상을 직교연산자와 평행이동의 합성으로 표현할 수 있다는 것을 말해준다. 즉, 등장사상 \(f\) 에 대하여 다음을 만족하는 직교연산자 \(\operatorname{T}\)\(v\) 에 의한 평행이동 \(g\) 가 유일하게 존재한다.

    \[ \forall x \in \mathbf{V} : \boxed{f(x) = \operatorname{T}(x) + v} \]

    한편, 임의의 직교연산자는 영벡터 \(0\) 에 의한 평행이동인 항등사상의 특수한 경우이다. 임의의 평행이동도 직교연산자가 항등변환인 특수한 경우이다.

  • 또한 이 정리는 등장사상에 관한 모든 문제를 직교연산자에 관한 문제로 환원시킬 수 있음을 말해준다.

  • 증명

    함수 \(\operatorname{T}:\mathbf{V}\to \mathbf{V}, x \mapsto f(x) - f(0)\) 을 정의하고 평행이동 \(g: \mathbf{V}\to \mathbf{V}, x \to x + f(0)\) 을 정의하면 다음이 성립한다.

    \[ \begin{align}\begin{split} (g \circ \operatorname{T})(x) &= g(\operatorname{T}(x)) = g(f(x) - f(0)) \\ &= f(x) - f(0) + f(0) = f(x) \\ \end{split}\end{align} \tag*{} \]

    따라서 \(f = g \circ \operatorname{T}\) 이다. ▲

    임의의 \(x, y \in \mathbf{V}\) 에 대하여 다음이 성립하므로 \(\operatorname{T}\) 는 노름을 보존한다.

    \[ \|\operatorname{T}(x)\| = \|f(x) - f(0)\| = \|x - 0\| = \|x\| \]

    그러면 \(\operatorname{T}\) 는 자명하게 거리도 보존한다. 즉, \(\operatorname{T}\) 는 등장사상이 되어 다음이 성립한다.

    \[ \|\operatorname{T}(x) - \operatorname{T}(y)\| = \|x - y\| \]

    그러면 다음이 성립하므로 \(\operatorname{T}\) 는 내적도 보존한다.

    \[ \begin{align}\begin{split} \|x - y\|^{2} = \|\operatorname{T}(x) - \operatorname{T}(y)\| ^{2} &= \|\operatorname{T}(x)\|^{2} - 2 \big <\operatorname{T}(x), \operatorname{T}(y) \big > + \|\operatorname{T}(y)\| ^{2} \\ &= \|x\|^{2} -2 \big <\operatorname{T}(x), \operatorname{T}(y) \big > + \|y\|^{2} \\ \end{split}\end{align} \tag*{} \]
    \[ \begin{align}\begin{split} & \|x - y\| ^{2} = \|x\|^{2} - 2 \big <\operatorname{T}(x), \operatorname{T}(y) \big > + \|y\|^{2} \\ & \iff \|x\|^{2} -2 \big <x,y \big > + \|y\|^{2} = \|x\|^{2} - 2 \big <\operatorname{T}(x), \operatorname{T}(y) \big > + \|y\|^{2} \\ & \iff \big <x,y \big > = \big <\operatorname{T}(x), \operatorname{T}(y) \big >\\ \end{split}\end{align} \tag*{}\]

    이제 \(\operatorname{T}\) 가 선형변환임을 보일 준비가 다 되었다. 스칼라 \(a \in \R\) 에 대하여 내적의 정의에 의하여 다음이 성립한다.

    \[ \begin{align}\begin{split} & \|\operatorname{T}(x + ay) - \operatorname{T}(x) - a \operatorname{T}(y) \| \\ &= \|[\operatorname{T}(x + ay) - \operatorname{T}(x)] - a \operatorname{T}(y)\| ^{2} \\ &= \|\operatorname{T}(x + ay) - \operatorname{T}(x)\| ^{2} + a ^{2}\|\operatorname{T}(y)\| ^{2} -2a \big <\operatorname{T}(x + ay) - \operatorname{T}(x), \operatorname{T}(y) \big > \\ &= \|x + ay - x\| ^{2} + a ^{2} \|y\| ^{2} -2a[ \big <\operatorname{T}(x + ay), \operatorname{T}(y) \big > - \big <\operatorname{T}(x), \operatorname{T}(y) \big >] \\ &= a ^{2}\|y\|^{2} + a ^{2}\|y\|^{2} -2a[ \big <x+ay,y \big >-\big <x,y \big >] \\ &= 2a ^{2}\|y\| ^{2} -2a[\big <x,y \big >a \|y\|^{2} - \big <x,y \big >] = 0 \end{split}\end{align} \tag*{} \]

    즉, 노름의 정의 에 의하여 \(\|\operatorname{T}(x + ay) - \operatorname{T}(x) - a \operatorname{T}(y)\| = 0 \implies \operatorname{T}(x + ay) = \operatorname{T}(x) + a \operatorname{T}(y)\) 이므로 선형변환의 충분조건 에 의하여 \(\operatorname{T}\) 는 선형변환이다. \(\operatorname{T}\) 가 선형연산자이고 노름 보존 연산자이므로 직교 연산자이다. ▲

    \(\operatorname{T}\) 의 존재성을 보였으니 \(\operatorname{T}\) 의 유일성과 평행이동 \(g\) 의 유일성을 보이면 된다. \(v \in \mathbf{V}\) 에 의한 평행이동 \(g_1\)\(u \in \mathbf{V}\) 에 의한 평행이동 \(g_2\) 와 직교연산자 \(\operatorname{T}, \operatorname{U}\) 에 대하여 \(f = g_1 \circ \operatorname{T} = g_2 \circ \operatorname{U}\) 를 가정하면 다음이 성립한다.

    \[ f(x) = (g_1 \circ \operatorname{T})(x) = g_1(\operatorname{T}(x)) = \operatorname{T}(x) + v \]
    \[ f(x) = (g_2 \circ \operatorname{U})(x) = g_2(\operatorname{U}(x)) = \operatorname{U}(x) + u \]

    선형변환의 \(0\) 의 상은 \(0\) 이므로 \(x = 0 \implies v = u\) 이다. 따라서 평행이동은 유일하다. 또한 이에 따라 위 두 식의 뺄셈을 하면 \(0 = \operatorname{T}(x) - \operatorname{U}(x) \implies \operatorname{T}(x) = \operatorname{U}(x)\) 을 얻는다. 따라서 \(\operatorname{T}=\operatorname{U}\) 이다. ■

정리 6.23

\(\R ^{2}\) 의 직교연산자 \(\operatorname{T}\) 와 표준순서기저 \(\beta\) 에 대한 행렬 \(A = [\operatorname{T}]_{\beta }\) 에 대하여 다음 중 하나만 성립한다.

  1. \(\operatorname{T}\) 는 회전변환이고 \(\det(A) = 1\) 이다.

  2. \(\operatorname{T}\) 는 원점을 지나는 대칭변환이고 \(\det(A) = -1\) 이다.

  • 정리 6.22 에 의하여 등장사상에 관한 문제는 직교연산자의 문제로 환원된다. 이 정리는 \(\R ^{2}\) 의 직교연산자를 분류해줌으로써 직교연산자를 명확하게 규명해준다. 일반적인 공간에 대한 직교연산자 분류 또한 할 수 있다.

  • 증명

    \(\operatorname{T}\) 가 직교연산자이므로 정리 6.18 에 의하여 \(\operatorname{T}(\beta ) = \{\operatorname{T}(e_1), \operatorname{T}(e_2)\}\) 는 정규직교기저이다. \(\operatorname{T}\) 가 노름 보존 연산자이므로 \(\operatorname{T}(e_1)\) 는 단위벡터이고, \(0 \leq \theta < 2 \pi\) 에 대하여 \(\operatorname{T}(e_1) = (\cos \theta, \sin \theta)\) 를 만족하는 \(\theta\) 가 유일하게 존재한다. \(\operatorname{T}(e_2)\) 도 단위벡터이고 \(\operatorname{T}(e_1)\) 와 직교하므로 \(\operatorname{T}(e_2)\) 는 다음을 만족한다.

    \[ \operatorname{T}(e_2) = (- \sin \theta, \cos \theta) \lor \operatorname{T}(e_2) = (\sin \theta, - \cos \theta) \tag*{▲} \]

    \(\operatorname{T}(e_2) = (- \sin \theta, \cos \theta)\) 를 가정하면 \(A = \begin{pmatrix} \cos \theta& - \sin \theta\\ \sin \theta& \cos \theta\\ \end{pmatrix}\) 이므로 \(\operatorname{T}\) 는 각 \(\theta\) 에 대한 회전변환이다. 즉, \(0 < \theta' < \pi\) 에 대하여 선형연산자 \(\operatorname{L}_{A}: \R ^{2} \to \R ^{2}\) 는 벡터를 반시계방향으로 \(\theta'\) 만큼 회전시킨다. 또한 다음이 성립한다.

    \[ \det(A) = \cos ^{2} \theta + \sin ^{2} \theta = 1 \tag*{▲} \]

    \(\operatorname{T}(e_2) = (\sin \theta, - \cos \theta)\) 를 가정하면 \(A = \begin{pmatrix} \cos \theta& \sin \theta\\ \sin \theta& -\cos \theta\\ \end{pmatrix}\) 이므로 \(\operatorname{T}\)\(x\)축의 양의 방향과 \(\dfrac{\theta}{2}\) 의 각을 이루는 직선 \(\operatorname{L}_{}\) 에 대한 대칭변환이다. 또한 다음이 성립한다.

    \[ \det(A) = - \cos ^{2}\theta-\sin ^{2}\theta=-1 \tag*{■} \]

정리 6.23 따름정리

\(\R ^{2}\) 의 임의의 등장사상은 다음의 둘 중 하나이다.

  1. 회전변환과 평행이동의 합성

  2. 원점을 지나는 직선에 대한 대칭변환과 평행이동의 합성

  • 증명

    정리 6.22 와 6.23 에 의하여 본 정리와 같이 \(\R ^{2}\) 의 등장사상을 완전히 분류할 수 있다. ■

  • 예시

Projection

사영(projection)

벡터공간 \(\mathbf{V}\)\(\mathbf{V} = \mathbf{W}_1 \oplus \mathbf{W}_2\) 인 부분공간 \(\mathbf{W}_1, \mathbf{W}_2\) 에 대하여 다음과 같이 정의된 함수 \(\operatorname{T}:\mathbf{V}\to \mathbf{V}\)\(\mathbf{W}_2\) 에 대한 \(\mathbf{W}_1\) 위로의 \(\mathbf{V}\) 의 사영이라 한다.

\[ x_1 \in \mathbf{W}_1, x_2 \in \mathbf{W}_2 : x = x_1 + x_2 \implies \operatorname{T}(x) = x_1 \]
  • 문제 2.3-17 에 의하여 사영을 \(\operatorname{T}=\operatorname{T}^{2}\) 를 만족하는 선형연산자 \(\operatorname{T}\) 로 정의해도 된다.

  • \(\operatorname{T}\) 를 단순히 \(\mathbf{W}_1\) 으로의 (\(\mathbf{V}\) 의) 사영이라고도 한다.

문제 2.1-27

벡터공간 \(\mathbf{V}\)\(\mathbf{V} = \mathbf{W}_1 \oplus \mathbf{W}_2\) 인 부분공간 \(\mathbf{W}_1, \mathbf{W}_2\)\(\mathbf{W}_2\) 에 대한 \(\mathbf{W}_1\) 위로의 \(\mathbf{V}\) 의 사영 \(\operatorname{T}:\mathbf{V}\to \mathbf{V}\) 에 대하여 다음이 성립한다.

  1. \(\operatorname{T}\) 는 선형이다.

  2. \(\mathbf{W}_1 = \{x \in \mathbf{V} : \operatorname{T}(x) = x\}\)

  3. \(\mathbf{W}_1 = \operatorname{im}(\operatorname{T})\)

  4. \(\mathbf{W}_2 = \ker(\operatorname{T})\)

  5. \(\mathbf{V} = \operatorname{im}(\operatorname{T}) \oplus \ker(\operatorname{T})\)

  6. \(\mathbf{W}_1 = \mathbf{V} \implies \operatorname{T}(x) = x\)

  7. \(\mathbf{W}_1 = \{0\} \implies \operatorname{T} = \operatorname{T}_0\)

  • 증명

    1:

    \(x = x_1 + x_2 \in \mathbf{V}\) 를 만족하는 \(x_1 \in \mathbf{W}_1, x_2 \in \mathbf{W}_2\)\(y = y_1 + y_2 \in \mathbf{V}\) 를 만족하는 \(y_1 \in \mathbf{W}_1, y_2 \in \mathbf{W}_2\) 와 스칼라 \(a\) 에 대하여 다음이 성립한다.

    \[ \begin{align}\begin{split} \operatorname{T}(ax + y) &= \operatorname{T}(ax_1 + ax_2 + y_1 + y_2) \\ &= ax_1 + y_1 = a \operatorname{T}(x) + \operatorname{T}(y)\\ \end{split}\end{align} \tag*{} \]

    따라서 \(\operatorname{T}\) 는 선형이다. ▲

    2:

    \(x \in \mathbf{W}_1\) 이면 \(\operatorname{T}(x) = x\) 이므로 \(x \in \{x \in \mathbf{V} : \operatorname{T}(x) = x\}\) 이다. \(\operatorname{T}(x) = x\) 이면 \(x_1 = x\) 이므로 \(x \in \mathbf{W}_1\) 이다. ▲

    3:

    먼저 \(\mathbf{W}_1\) 로의 사영 \(\operatorname{T}\) 의 모든 상이 그 정의에 의하여 반드시 \(\mathbf{W}_1\) 에 속한다. 즉, \(\operatorname{im}(\operatorname{T}) \subset \mathbf{W}_1\) 이다.

    \(x \in \mathbf{W}_1\) 이면 \(\operatorname{T}(x) = x\) 이므로 \(x \in \operatorname{im}(\operatorname{T})\) 이다. 따라서 \(\operatorname{im}(\operatorname{T}) = \mathbf{W}_1\) 이다. ▲

    4:

    \(x \in \mathbf{W}_2\) 이면 \(\operatorname{T}(x) = 0\) 이므로 \(x \in \{x \in \mathbf{V}: \operatorname{T}(x) = 0\}\) 이다. \(\operatorname{T}(x) = 0\) 이면 \(x_2 = x\) 이므로 \(x \in \mathbf{W}_2\) 이다. ▲

    5:

    3), 4) 에 의하여 바로 증명된다. ▲

    6:

    2) 에 의하여 \(\mathbf{V} = \mathbf{W}_1 = \{x \in \mathbf{V} : \operatorname{T}(x) = x\}\) 이면 \(\mathbf{V}\) 의 모든 원소에 대한 \(\operatorname{T}\) 의 대응규칙이 항등이라는 것이므로 \(\operatorname{T}\) 는 항등변환이다. ▲

    7:

    \(\mathbf{W}_1 = \{0\}\) 이면 \(\operatorname{T}(x) = 0\) 임이 자명하다. ■

문제 1.6-29-(a)

유한차원 벡터공간 \(\mathbf{V}\) 의 부분공간 \(\mathbf{W}_1, \mathbf{W}_2\) 에 대하여 \(\mathbf{W}_1 + \mathbf{W}_2\) 는 유한차원이고, 다음이 성립한다.

\[ \dim (\mathbf{W}_1 + \mathbf{W}_2) = \dim (\mathbf{W}_1) + \dim (\mathbf{W}_2) - \dim (\mathbf{W}_1 \cap \mathbf{W}_2) \]
  • 증명

    \(\mathbf{W}_1 \cap \mathbf{W}_2\) 의 기저를 \(\alpha = \{v_1, v_2, \dots, v_k\}\) 로 두면 정리 1.10 따름정리 2 에 의하여 \(\alpha \subset \mathbf{W}_1\) 이고 \(\alpha \subset \mathbf{W}_2\) 이므로 \(\alpha\) 를 확장하여 \(\mathbf{W}_1\) 의 기저 \(\beta\)\(\mathbf{W}_2\) 의 기저 \(\gamma\) 를 만들 수 있다.

    \[ \beta = \{v_1, v_2, \dots, v_k, u_1, u_2, \dots, u_m\} \]
    \[ \gamma = \{v_1, v_2, \dots, v_k, w_1, w_2, \dots, w_p\} \]

    임의의 \(x \in \mathbf{W}_1 + \mathbf{W}_2\) 에 대하여 \(x = x_1 + x_2\)\(x_1 \in \mathbf{W}_1, x_2 \in \mathbf{W}_2\) 가 존재한다. 따라서 적절한 스칼라에 대하여 다음이 성립한다.

    \[ \begin{align}\begin{split} x = x_1 + x_2 &= (a_1v_1 + a_2 v_2 + \dots + a_k v_k + b_1 u_1 + b_2 u_2 + \dots + b_m u_m) \\ & \qquad + (c_1v_1 + c_2 v_2 + \dots + c_k v_k + d_1 w_1 + d_2 w_2 + \dots + d_p w_p)\\ & = e_1v_1 + e_2 v_2 + \dots + e_k v_k + b_1 u_1 + b_2 u_2 \\ & \qquad + \dots + b_m u_m + d_1 w_1 + d_2 w_2 + \dots + d_p w_p \\ \end{split}\end{align} \tag*{} \]

    \(u_1, u_2, \dots, u_m\)\(w_1, w_2, \dots, w_p\) 들은 서로 일차독립이다. 만약 \(u_1\)\(w_1\) 이 서로의 스칼라곱으로 표현된다면 \(u_1\) 로 생성되는 벡터와 \(w_1\) 로 생성되는 벡터가 서로 같으므로 \(u_1, w_1 \in \mathbf{W}_1 \cap \mathbf{W}_2\) 이다. 그러나 이는 모순이다. 따라서 \(\mathbf{W} = \mathbf{W}_1 + \mathbf{W}_2\) 의 기저는 다음과 같다.

    \[ \{v_1, v_2, \dots, v_k, u_1, u_2, \dots, u_m, w_1, w_2, \dots, w_p\} \]

    이제 각 벡터공간의 기저의 기수를 계산하면 \(\mathbf{W}_1+\mathbf{W}_2\) 이 유한차원인 것과 정리의 결론을 얻을 수 있다. ■

  • 예시

    \[ \begin{align}\begin{split} &\dim (\mathbf{W}_1 + \mathbf{W}_2 + \mathbf{W}_3)\\ &= \dim (\mathbf{W}_1 + \mathbf{W}_2) + \dim (\mathbf{W}_3) - \dim ((\mathbf{W}_1+\mathbf{W}_2) \cap \mathbf{W}_3) \\ &= \dim (\mathbf{W}_1) + \dim (\mathbf{W}_2) - \dim (\mathbf{W}_1 \cap \mathbf{W}_2) + \dim (\mathbf{W}_3) \\ &\qquad - \dim ((\mathbf{W}_1 \cap \mathbf{W}_3) + (\mathbf{W}_2 + \mathbf{W}_3)) \\ &= \dim (\mathbf{W}_1) + \dim (\mathbf{W}_2) + \dim (\mathbf{W}_3) \\ &\qquad - \dim (\mathbf{W}_1 \cap \mathbf{W}_2) - \dim (\mathbf{W}_2 \cap \mathbf{W}_3) - \dim (\mathbf{W}_1 \cap \mathbf{W}_3) \\ &\qquad + \dim (\mathbf{W}_1 \cap \mathbf{W}_2 \cap \mathbf{W}_3) \\ \end{split}\end{align} \tag*{} \]

문제 1.6-29-(b)

벡터공간 \(\mathbf{V}\) 의 부분공간 \(\mathbf{W}_1, \mathbf{W}_2\) 가 유한차원이면 다음이 성립한다.

\[ \mathbf{V} = \mathbf{W}_1 \oplus \mathbf{W}_2 \iff \dim (\mathbf{V}) = \dim (\mathbf{W}_1) + \dim (\mathbf{W}_2) \]
  • 증명

    \(\mathbf{V} = \mathbf{W}_1 \oplus \mathbf{W}_2\) 를 가정하는 것은 \(\mathbf{W}_1 \cap \mathbf{W}_2 = \{0\}\) 를 가정하는 것이므로 문제 1.6-29-(a) 에 의하여 다음이 성립한다.

    \[ \dim (\mathbf{V}) = \dim (\mathbf{W}_1 + \mathbf{W}_2) \]
    \[ = \dim (\mathbf{W}_1) + \dim (\mathbf{W}_2) + \dim (\mathbf{W}_1 \cap \mathbf{W}_2) = \dim (\mathbf{W}_1) + \dim (\mathbf{W}_2) \tag*{▲} \]

    \(\dim (\mathbf{V}) = \dim (\mathbf{W}_1 + \mathbf{W}_2) = \dim (\mathbf{W}_1) + \dim (\mathbf{W}_2)\) 를 가정하는 것은 다시 문제 1.6-29-(a) 에 의하여 \(\dim (\mathbf{W}_1 \cap \mathbf{W}_2) = 0\) 을 가정하는 것이므로 \(\mathbf{W}_1 \cap \mathbf{W}_2 = \{0\}\) 이다. 따라서 \(\mathbf{W}_1 \oplus \mathbf{W}_2 = \mathbf{V}\) 이다. ■

벡터공간 \(\mathbf{V}\) 의 부분공간 \(\mathbf{W}_1, \mathbf{W}_2, \dots, \mathbf{W}_k\) 가 유한차원이면 다음이 성립한다.

\[ \mathbf{V} = \bigoplus_{i=1}^{k} \mathbf{W}_i \implies \dim (\mathbf{V}) = \sum_{i=1}^{k}\dim (\mathbf{W}_i) \]
  • 증명

    문제 1.6-29-(b) 에 의하여 다음이 성립한다.

    \[ \begin{align}\begin{split} \dim (\mathbf{V})&= \dim \bigg (\bigoplus_{i=1}^{k}\mathbf{W}_i \bigg ) = \dim \bigg (\bigoplus_{i=1}^{k-1}\mathbf{W}_i \bigg ) + \dim (\mathbf{W}_k) \\ &= \dim \bigg (\bigoplus_{i=1}^{k-2}\mathbf{W}_i \bigg ) + \dim (\mathbf{W} _{k-1}) + \dim (\mathbf{W}_k) \\ &\qquad \vdots \\ &= \sum_{i=1}^{k}\dim (\mathbf{W}_i) \\ \end{split}\end{align} \tag*{} \]

문제 2.1-36

유한차원 벡터공간 \(\mathbf{V}\) 와 선형변환 \(\operatorname{T}:\mathbf{V}\to \mathbf{V}\) 에 대하여 다음이 성립한다.

  1. \(\mathbf{V}=\operatorname{im}(\operatorname{T}) + \ker(\operatorname{T}) \implies \mathbf{V} = \operatorname{im}(\operatorname{T}) \oplus \ker(\operatorname{T})\)

  2. \(\operatorname{im}(\operatorname{T}) \cap \ker(\operatorname{T}) = \{0\} \implies \mathbf{V} = \operatorname{im}(\operatorname{T}) \oplus \ker(\operatorname{T})\)

  • 증명

    1:

    차원정리와 문제 1.6-29-(a) 에 의하여 다음이 성립한다.

    \[ \begin{align}\begin{split} \dim (\mathbf{V}) &= \dim (\operatorname{im}(\operatorname{T}) + \ker(\operatorname{T})) \\ &= \dim (\operatorname{im}(\operatorname{T})) + \dim (\ker(\operatorname{T})) - \dim (\operatorname{im}(\operatorname{T}) \cap \ker(\operatorname{T}))\\ &= \dim (\mathbf{V}) - \dim (\operatorname{im}(\operatorname{T}) \cap \ker(\operatorname{T})) \\ \end{split}\end{align} \tag*{} \]

    따라서 \(\dim (\operatorname{im}(\operatorname{T}) \cap \ker(\operatorname{T})) = 0 \implies \operatorname{im}(\operatorname{T}) \cap \ker(\operatorname{T}) = \{0\}\) 이다. ▲

    2:

    \(\operatorname{im}(\operatorname{T}) \cap \ker(\operatorname{T}) = \{0\}\) 을 가정하면 문제 1.6-29-(a), (b) 에 의하여 증명이 바로 끝난다. ■

유한차원 벡터공간 \(\mathbf{V}\) 와 선형연산자 \(\operatorname{T}\) 에 대하여 다음이 성립한다.

\[ \operatorname{rank} (\operatorname{T}) = \operatorname{rank} (\operatorname{T}^{2}) \iff \operatorname{nullity} (\operatorname{T}) = \operatorname{nullity} (\operatorname{T}^{2}) \]
  • 증명

    \(\operatorname{nullity} (\operatorname{T}) = \operatorname{nullity} (\operatorname{T}^{2})\) 를 가정하면 차원정리에 의하여 다음이 성립한다.

    \[ \operatorname{nullity} (\operatorname{T}) + \operatorname{rank} (\operatorname{T}) = \dim (\mathbf{V}) \]
    \[ \operatorname{nullity} (\operatorname{T}^{2}) + \operatorname{rank} (\operatorname{T}^{2}) = \dim (\mathbf{V}) \]
    \[ \implies \operatorname{rank} (\operatorname{T}) = \operatorname{rank} (\operatorname{T}^{2}) \]

    그 역도 같은 논리로 쉽게 증명할 수 있다. ■

문제 2.3-16

유한차원 벡터공간 \(\mathbf{V}\) 와 선형연산자 \(\operatorname{T}\) 에 대하여 다음이 성립한다.

  1. \(\operatorname{rank} (\operatorname{T}) = \operatorname{rank} (\operatorname{T}^{2}) \implies \operatorname{im}(\operatorname{T}) \cap \ker(\operatorname{T}) = \{0\}, \mathbf{V} = \operatorname{im}(\operatorname{T}) \oplus \ker(\operatorname{T})\)

  2. \(\exists k \in \N : \mathbf{V} = \operatorname{im}(\operatorname{T}^{k}) \oplus \ker(\operatorname{T}^{k})\)

  • 증명

    1:

    \(a \neq 0, a \in \mathbf{V}\) 에 대하여 \(a \in \ker(\operatorname{T})\cap \operatorname{im}(\operatorname{T})\) 를 가정하면 \(\operatorname{T}(a) = 0\) 이고 \(b \neq 0, \operatorname{T}(b) = a\)\(b \in \mathbf{V}\) 가 존재한다. 따라서 다음이 성립한다.

    \[ \operatorname{T}(\operatorname{T}(b)) = \operatorname{T}(b) \implies \operatorname{T}(a) = a \implies 0 = a \]

    이는 모순이다. 따라서 \(\ker(\operatorname{T}) \cap \operatorname{im}(\operatorname{T}) = \{0\}\) 이다. 문제 2.1-36 에 의하여 \(\mathbf{V}=\operatorname{im}(\operatorname{T})\oplus \ker(\operatorname{T})\) 도 유도된다. ▲

    2:

    적절한 자연수 \(k\) 에 대하여 선형연산자 \(\operatorname{T}^{k}\)\(\operatorname{rank} (\operatorname{T}^{k}) = \operatorname{rank} (\operatorname{T}^{2k})\) 를 만족함을 보이면 1) 에 의하여 증명이 끝난다. 다음이 성립한다.

    \[ \forall s \in \N : \operatorname{T}^{s + 1}(\mathbf{V}) = \operatorname{T}^{s}(\operatorname{im}(\operatorname{T})) \subset \operatorname{T}^{s}(\mathbf{V}) \implies \operatorname{rank} (\operatorname{T}^{s+1}) \leq \operatorname{rank} (\operatorname{T}^{s}) \]

    이때 선형연산자 \(\operatorname{T}^{s}:\mathbf{V}\to \mathbf{V}\) 의 상공간의 차원은 반드시 \(0 \leq \operatorname{rank} (\operatorname{T}^{s}) \leq \dim (\mathbf{V})\) 를 만족한다. 그러므로 어떤 자연수 \(k\) 가 존재하여 \(\operatorname{rank} (\operatorname{T}^{k+1}) = \operatorname{rank} (\operatorname{T}^{k})\) 를 만족한다. 왜냐하면 다음과 같이 무한히 늘어져있는 자연수들의 부등식에 하계와 상계가 정해져있기 때문이다.

    \[ \dim (\mathbf{V}) \geq \operatorname{rank} (\operatorname{T}) \geq \dots \geq \operatorname{rank} (\operatorname{T}^{s}) \geq \operatorname{rank} (\operatorname{T}^{s+1}) \geq \dots \geq 0 \]

    그래서 \(\operatorname{T}^{k+1}(\mathbf{V}) \subset \operatorname{T}^{k}(\mathbf{V})\) 인데 이 둘의 차원이 같으므로 \(\operatorname{T}^{k+1}(\mathbf{V}) = \operatorname{T}^{k}(\mathbf{V})\) 이다. 따라서 \(t \geq k\) 인 자연수 \(t\) 에 대하여 다음이 성립한다.

    \[ \operatorname{T}^{\top}(\mathbf{V}) = (\operatorname{T} \circ \operatorname{T} \circ \dots \circ \operatorname{T}^{k})(\mathbf{V}) = \operatorname{T}^{k}(\mathbf{V}) \]

    따라서 \(2k \geq k\) 인 자연수 \(2k\) 에 대하여 \(\operatorname{T}^{2k}(\mathbf{V}) = \operatorname{T}^{k}(\mathbf{V})\) 이고, 이에 따라 \(\operatorname{rank} (\operatorname{T}^{k}) = \operatorname{rank} (\operatorname{T}^{2k})\) 이다. ■

문제 2.3-17

벡터공간 \(\mathbf{V}\) 와 선형연산자 \(\operatorname{T}\) 에 대하여 다음은 동치이다.

  1. \(\operatorname{T} = \operatorname{T}^{2}\)

  2. \(\operatorname{T}\)\(\ker(\operatorname{T})\) 에 대한 \(\mathbf{W}_1 = \{x : \operatorname{T}(x) = x\}\) 로의 사영이다.

  • 문제 2.1-27 은 벡터공간 \(\mathbf{V}\) 의 부분공간 \(\mathbf{W}_1, \mathbf{W}_2\) 에 대하여 \(\mathbf{W}_2\) 에 대한 \(\mathbf{W}_1\) 로의 사영 \(\operatorname{T}\) 가 정의되면 반드시 \(\mathbf{W}_1 = \{x : \operatorname{T}(x) = x\}, \mathbf{W}_2 = \ker(\operatorname{T})\) 가 됨을 말해준다. 따라서 조건 2) 가 말하는 사영이란 어떤 특수한 사영이 아니라 임의의 모든 사영을 칭하는 것이다.

    그러므로 이 정리는 \(\operatorname{T}\) 가 사영이기 위한 필요충분조건이 \(\operatorname{T} = \operatorname{T}^{2}\) 임을 말해준다.

  • 증명

    1) 을 가정하면 문제 2.3-16 에 의하여 \(\mathbf{V} = \operatorname{im}(\operatorname{T}) \oplus \ker(\operatorname{T})\) 이고, 다음이 성립한다.

    \[ x_1 \in \mathbf{W}_1, x_2 \in \ker(\operatorname{T}) : x = x_1 + x_2 \implies \operatorname{T}(x) = \operatorname{T}(x_1) + \operatorname{T}(x_2) = x_1 \]

    사영의 정의 에 의하여 \(\operatorname{T}\)\(\ker(\operatorname{T})\) 에 대한 \(\mathbf{W}_1\) 의 사영이다. ▲

    이제 2) 를 가정하고 1) 를 도출해보자. 사영의 정의에 의하여 \(\mathbf{V} = \ker(\operatorname{T})\oplus \mathbf{W}_1\) 이므로 다음이 성립한다.

    \[ \forall x \in \mathbf{V}, \exists x_1 \in \mathbf{W}_1, \exists \in \ker(\operatorname{T}) : x = x_1 + x_2 \]
    \[ \qquad \implies \operatorname{T}(x) = x_1 \implies \operatorname{T}(\operatorname{T}(x)) = \operatorname{T}(x_1) = x_1 \]

    \(\mathbf{V}\) 의 임의의 벡터에서 \(\operatorname{T}\)\(\operatorname{T}^{2}\) 의 상이 같으므로 \(\operatorname{T} = \operatorname{T}^{2}\) 이다. ■

Orthogonal Projection

정사영(orthogonal projection)

내적공간 \(\mathbf{V}\) 에 대한 사영 \(\operatorname{T}: \mathbf{V}\to \mathbf{V}\)\(\operatorname{im}(\operatorname{T})^{\perp} = \ker(\operatorname{T}), \ker(\operatorname{T})^{\perp} = \operatorname{im}(\operatorname{T})\) 를 만족하면 정사영이라 한다.

  • 문제 2.3-17 은 사영의 필요충분조건이 \(\operatorname{T} = \operatorname{T}^{2}\) 임을 말해준다. 또한 그 증명과정은 \(\operatorname{T}\) 가 사영이면 문제 2.3-16 에 의하여 \(\mathbf{V} = \operatorname{im}(\operatorname{T})\oplus \ker(\operatorname{T})\) 가 성립함을 말해준다. 따라서 또 다른 \(\mathbf{V}\) 의 사영 \(\operatorname{U}\) 가 존재하면 다음이 성립한다.

    \[ \mathbf{V} = \operatorname{im}(\operatorname{T})\oplus \ker(\operatorname{T}) = \operatorname{im}(\operatorname{U}) \oplus \ker(\operatorname{U}) \]

    이때 \(\operatorname{im}(\operatorname{T}) = \operatorname{im}(\operatorname{U})\) 를 가정해도 \(\ker(\operatorname{T})\)\(\ker(\operatorname{U})\) 가 서로 다른 기저를 가지고 있을 수도 있다. 따라서 \(\ker(\operatorname{T}) = \ker(\operatorname{U})\) 는 보장되지 않는다. 쉽게 말해서 사영은 치역에 의하여 유일하게 결정되지 않는다. 치역이 같아도 서로 다른 사영이 존재할 수도 있는 것이다.

    그러나 정사영은 치역에 의하여 유일하게 결정된다. 치역이 같으면 반드시 서로 같은 사영이 되는 것이 정사영이다.

  • 문제 6.2-13\(\operatorname{im}(\operatorname{T})^{\perp} = \ker(\operatorname{T}) \iff \ker(\operatorname{T})^{\perp} = \operatorname{im}(\operatorname{T})\) 을 말해준다.

  • 정리 6.6 에 의하여 내적공간 \(\mathbf{V}\) 와 부분공간 \(\mathbf{W}\) 와 임의의 벡터 \(y \in \mathbf{V}\) 에 대하여 \(y = u + z\) 를 만족하는 \(u \in \mathbf{W}, z \in \mathbf{W}^{\perp}\) 가 유일하게 존재한다. 함수 \(\operatorname{T}: \mathbf{V}\to \mathbf{V}, y \to u\) 로 정의하면 \(\operatorname{T}\)\(\mathbf{W}\) 로의 \(\mathbf{V}\) 의 정사영이된다. 그러면 \(\mathbf{W}\) 로의 정사영과 사영은 어떻게 다를까? 정리 6.6 의 그림을 다시 가져와서 보자.

    정리 6.6 은 부분공간 \(\mathbf{W}\) 에 대하여 벡터공간 \(\mathbf{V}\) 의 임의의 벡터 \(y \in \mathbf{V}\)\(y = u + z\) 로 표현하는 \(u \in \mathbf{W}, z \in \mathbf{W}^{\perp}\) 가 유일함을 말해준다. 반면 점 \(P\) 와 굳이 수직해야 한다는 조건을 없앤다면 \(y = u + z\) 를 만족하는 \(u \in \mathbf{W}, z \in \mathbf{W}^{\perp}\) 는 유일하지 않고 무한히 많이 존재할 것이다. 이것이 정사영과 사영의 차이이다.

  • 예시

    image

    이제 \(\mathbf{V} = \R ^{2}, \mathbf{W} = \operatorname{span} \{(1, 1)\}\) 로 두고 \(\mathbf{W}\) 로의 정사영 \(\operatorname{T}\)\(\mathbf{W}\) 로의 어떤 사영 \(\operatorname{U}\) 를 위와 같이 정의하자. \(\operatorname{T}(v)\)\(v\) 에서 직선 \(y = x\) 에 내린 수선의 발이고 \(\operatorname{U}(a_1, a_2) = (a_1, a_1)\) 이다. 이처럼 정사영은 유일하지만, 사영은 무한히 많이 존재한다.

정사영의 유일성(uniqueness of orthogonal projection)

내적공간에서 유한차원 부분공간으로의 정사영은 유일한다.

  • 증명

    정리 6.6 에 의하여 내적공간 \(\mathbf{V}\) 와 부분공간 \(\mathbf{W}\) 와 임의의 벡터 \(y \in \mathbf{V}\) 에 대하여 \(y = u + z\) 를 만족하는 \(u \in \mathbf{W}, z \in \mathbf{W}^{\perp}\) 가 유일하게 존재한다. 함수 \(\operatorname{T}: \mathbf{V}\to \mathbf{V}, y \to u\) 로 정의하면 \(\operatorname{T}\)\(\mathbf{W}\) 로의 정사영이된다.

    \(\operatorname{T}\)\(\operatorname{U}\)\(\mathbf{W}\) 로의 정사영이면 문제 2.17-27 에 의하여 \(\operatorname{im}(\operatorname{T}) = \mathbf{W}=\operatorname{im}(\operatorname{U})\) 이다. 따라서 \(\ker(\operatorname{T}) = \operatorname{im}(\operatorname{T})^{\perp} = \operatorname{im}(\operatorname{U})^{\perp} = \ker(\operatorname{U})\) 이다. 정사영은 치역 또는 영공간에 의하여 유일하게 결정되므로 \(\operatorname{T}=\operatorname{U}\) 이다. ■

정사영의 최적 근사성(approximation property of orthogonal projection)

내적공간 \(\mathbf{V}\) 에서 유한차원 부분공간 \(\mathbf{W}\) 로의 정사영 \(\operatorname{T}\) 는 임의의 \(v \in \mathbf{V}, w \in \mathbf{W}\) 에 대하여 다음을 만족한다.

\[ \|w - v\| \geq \|\operatorname{T}(v) - v \| \]
  • 이 정리는 벡터공간의 벡터를 부분공간으로 사영시키는 함수 중 정사영이 가장 짧은 거리로 사영시킨다는 것을 말해준다. 정사영의 정의에서 보았던 그림들만 보더라도 정사영이 벡터를 가장 짧은 노름으로 사영시킨다는 것을 직관적으로 알 수 있다. 증명은 정리 6.6 따름정리 에 의하여 바로 나온다.

    이 성질을 최적 근사성(approximation property)이라 하며, 이 성질이 정사영의 가장 중요한 성질이다.

정리 6.24

내적공간 \(\mathbf{V}\) 와 선형연산자 \(\operatorname{T}\) 에 대하여 다음은 동치이다.

  1. \(\operatorname{T}\) 가 정사영이다.

  2. \(\operatorname{T}\) 의 수반연산자 \(\operatorname{T}^{*}\) 가 존재하고, \(\operatorname{T}^{2} = \operatorname{T} = \operatorname{T}^{*}\) 이다.

  • 이 정리는 정사영의 가장 중요한 대수적 성질을 말해준다. \(\operatorname{T}\) 가 정사영이면 에르미트 연산자이다.

  • 정리 6.9 는 유한차원 내적공간의 선형연산자가 수반연산자를 갖는다는 것을 말해주지만, 무한차원 내적공간에서의 존재성은 보장해주지 않는다. 이 정리는 임의의 내적공간의 정사영이 반드시 수반연산자를 갖는다는 것을 말해준다.

  • 증명

    \(1 \implies 2\):

    1) 을 가정하면 \(\operatorname{T}\) 는 사영이므로 문제 2.3-17 에 의하여 \(\operatorname{T}=\operatorname{T}^{2}\) 이다. 따라서 문제 2.3-16 에 의하여 \(\mathbf{V} = \operatorname{im}(\operatorname{T})\oplus \ker(\operatorname{T})\) 이고, \(\operatorname{im}(\operatorname{T})^{\perp}=\ker(\operatorname{T})\) 이다. 이에 따라 내적의 정의 에 의하여 \(x_1, x_2 \in \operatorname{im}(\operatorname{T}), x_2, y_2 \in \ker(\operatorname{T})\) 에 대한 \(x = x_1 + x_2, y = y_1 + y_2 \in \mathbf{V}\) 에 대하여 다음이 성립한다.

    \[ \big <x, \operatorname{T}(y) \big > = \big <x_1+x_2,y_1 \big >= \big <x_1,y_1 \big > + \big <x_2,y_1 \big > = \big <x_1,y_1 \big > \]
    \[ \big <\operatorname{T}(x), y \big > = \big <x_1,y_1+y_2 \big >= \big <x_1,y_1 \big > + \big <x_1,y_2 \big > = \big <x_1,y_1 \big > \]
    \[ \implies \forall x, y \in \mathbf{V} : \big <x, \operatorname{T}(y) \big > = \big <\operatorname{T}(x), y \big > \]

    정리 6.9 에 의하여 \(\big <\operatorname{T}(x), y \big > = \big <x, \operatorname{U}(y) \big >\) 꼴을 만족하는 \(\operatorname{U}\)\(\operatorname{T}\) 의 수반연산자 \(\operatorname{U} = \operatorname{T}^{*}\) 이다. 즉, \(\operatorname{T} = \operatorname{T}^{*}\) 이다. 이로써 수반연산자 \(\operatorname{T}^{*}\) 의 존재성도 증명되었다. ▲

    \(2 \implies 1\):

    \(\operatorname{T}^{2}=\operatorname{T}=\operatorname{T}^{*}\) 를 가정하면 문제 2.3-17 에 의하여 \(\operatorname{T}\) 는 사영이다. \(x \in \operatorname{im}(\operatorname{T}), y \in \ker(\operatorname{T})\) 에 대하여 \(x = \operatorname{T}(x) = \operatorname{T}^{*}(x)\) 이므로 다음이 성립한다.

    \[ \big <x,y \big > = \big <\operatorname{T}^{*}(x), y \big > = \big <x, \operatorname{T}(y) \big > = \big <x,0 \big > = 0 \]

    즉, \(x \in \ker(\operatorname{T})^{\perp}\) 이므로 \(\operatorname{im}(\operatorname{T}) \subset \ker(\operatorname{T})^{\perp}\) 이다. ▲

    \(x \in \ker(\operatorname{T})^{\perp}\) 을 가정하면 내적의 정의 에 의하여 다음이 성립한다.

    \[ \begin{align}\begin{split} \|x - \operatorname{T}(x)\| ^{2} &= \big <x - \operatorname{T}(x), x - \operatorname{T}(x) \big > \\ &= \big <x, x - \operatorname{T}(x) \big > - \big <\operatorname{T}(x), x - \operatorname{T}(x) \big > \\ \end{split}\end{align} \tag*{} \]

    \(x - \operatorname{T}(x) = x - x = 0 \in \ker(\operatorname{T})\) 이므로 \(\big <x, x - \operatorname{T}(x) \big > = 0\) 이다. 또한 다음이 성립한다.

    \[ \big <\operatorname{T}(x), x - \operatorname{T}(x) \big > = \big <x, \operatorname{T}^{*}(x - \operatorname{T}(x)) \big > = \big <x, \operatorname{T}(x - \operatorname{T}(x)) \big > = \big <x, 0 \big > = 0 \]

    따라서 다음이 성립한다.

    \[ \|x - \operatorname{T}(x)\| ^{2} = 0 \implies x = \operatorname{T}(x) \in \operatorname{im}(\operatorname{T}) \]

    즉, \(\ker(\operatorname{T})^{\perp}\subset \operatorname{im}(\operatorname{T})\) 이다. 그러므로 \(\operatorname{im}(\operatorname{T}) = \ker(\operatorname{T})^{\perp}\) 이다. 문제 6.2-13 에 의하여 \(\operatorname{im}(\operatorname{T})^{\perp} = \ker(\operatorname{T})\) 이다. ■

Spectral Theorem

스펙트럼(spectrum, 고유 스펙트럼, eigenspectrum)

유한차원 내적공간의 선형연산자의 서로 다른 고윳값 집합이다.

  • 함수해석학에서 유계 선형연산자(또는 더 일반적으로 무계 선형연산자)의 스펙트럼은 그 고윳값 집합을 일반화한 개념이다.

정리 6.25 스펙트럼 정리(spectral theorem)

유한차원 \(\mathbf{F}\)-내적공간 \(\mathbf{V}\) 의 선형연산자 \(\operatorname{T}\) 의 스펙트럼을 \(\{\lambda _1, \lambda _2, \dots, \lambda _k\}\) 라 하고, \(i \in \{1,\dots,k\}\) 에 대하여 고윳값 \(\lambda _i\) 의 고유공간 \(\mathbf{E}_{\lambda_i}\) 로의 정사영을 \(\operatorname{T}_i\) 라 하자. \(\mathbf{F}=\Bbb{C}\) 이면 \(\operatorname{T}\) 가 정규연산자, \(\mathbf{F}=\R\) 이면 \(\operatorname{T}\) 가 자기수반연산자라고 가정하면 다음이 성립한다.

  1. \(\mathbf{V} = \displaystyle \bigoplus_{i=1}^{k}\mathbf{E}_{\lambda_i}\)

  2. \(\displaystyle \bigoplus_{j \neq i}\mathbf{E}_{\lambda_j} = \mathbf{E}_{\lambda_i} ^{\perp}\)

  3. \(i, j \in \{1, \dots, k\} : \operatorname{T}_i \operatorname{T}_j = \delta _{ij}\operatorname{T}_i\)

  4. \(\operatorname{I} = \displaystyle \sum_{i=1}^{k}\operatorname{T}_i\) (resolution of the identity operator)

  5. \(\operatorname{T} = \displaystyle \sum_{i=1}^{k}\lambda _i \operatorname{T}_i\) (spectral decomposition)

  • 이 정리는 내적공간의 가장 중요한 결론들 중 하나이다. 스펙트럼 정리가 가정하는 것은 단지 선형연산자가 복소내적공간이면 정규연산자이고, 실내적공간이면 에르미트 연산자라는 것이다.

    1) 은 정리 6.16정리 6.17의 결과를 통합하여 서술한 것이다. 즉, 스펙트럼 정리처럼 가정했을 때 선형연산자는 대각화 가능하다.

    4) 의 \(\operatorname{I} = \operatorname{T}_1 + \dots + \operatorname{T}_k\)\(\operatorname{T}\) 로 유도된 항등연산자 분해(resolution of the identity operator) 라 한다.

    5) 의 \(\operatorname{T} = \lambda _1 \operatorname{T}_1 + \dots + \lambda _k \operatorname{T}_k\)\(\operatorname{T}\) 의 스펙트럼 분해(spectral decomposition) 이라 한다. 고윳값 배열 순서를 무시하면 \(\operatorname{T}\) 의 스펙트럼 분해는 유일한다.

  • \(\operatorname{T}\) 를 대각화 해보자. \(\mathbf{E}_{\lambda_i}\) 의 정규직교기저의 합집합을 \(\beta\), \(\mathbf{E}_{\lambda_i}\) 의 차원을 \(m_i\) 라 하면 다음이 성립한다. 참고로 \(m_i\) 는 고윳값 \(\lambda _i\) 의 중복도이다.

    \[ [\operatorname{T}]_{\beta } = \begin{pmatrix} \lambda _1I_{m_1}&O&\dots&O\\ O&\lambda _2I_{m_2}&\dots&O\\ \vdots& \vdots& \ddots& \vdots \\ O&O&\dots&\lambda _kI_{m_k}\\ \end{pmatrix} \]
  • 증명

    1:

    정리 6.16정리 6.17 에 의하여 \(\operatorname{T}\) 는 대각화가능하다. 그러면 정리 5.10 에 의하여 \(\mathbf{V}\)\(\operatorname{T}\) 의 고유공간의 직합이다. ▲

    2:

    \(\displaystyle \bigoplus_{j \neq i}\mathbf{E}_{\lambda_j} = \mathbf{E}'_i\) 로 두자. \(i \neq j\) 에 대하여 \(x \in \mathbf{E}_{\lambda_i}, y \in \mathbf{E}_{\lambda_j}\) 라 하면 정리 6.15-(4) 에 의하여 \(\big <x,y \big >= 0\) 이다. 그러면 \(y_j \in \mathbf{E}_{\lambda_j}\) 에 대한 \(v = \displaystyle \sum_{i \neq j}^{}y_j \in \mathbf{E}'_i\) 에 대하여 다음이 성립한다.

    \[ \big <v,x \big > = \bigg < \sum _{i \neq j}y_j, x \bigg > = \sum _{i \neq j}\big <y_j,x \big > = 0 \]

    즉, \(v \in \mathbf{E}_{\lambda_i} ^{\perp}\) 이다. 따라서 \(\mathbf{E}'_i \subset \mathbf{E}^{\perp} _i\) 이다. ▲

    1) 이 성립하므로 문제 1.6-29-(b) 의 일반화 에 의하여 다음이 성립한다.

    \[ \dim (\mathbf{V}) = \sum_{i=1}^{k}\mathbf{E}_{\lambda_i} \]
    \[ \iff \dim (\mathbf{E}'_i) = \sum _{j \neq i}\dim (\mathbf{E}_{\lambda_j}) = \dim (\mathbf{V}) - \dim (\mathbf{E}_{\lambda_i}) \]

    정리 6.7-(3) 에 의하여 \(\dim (\mathbf{E}^{\perp}_i) + \dim (\mathbf{E}_{\lambda_i}) = \dim (\mathbf{V}) \iff \dim (\mathbf{E}^{\perp}_{i}) = \dim (\mathbf{V}) - \dim (\mathbf{E}_{\lambda_i})\) 이다. 따라서 \(\dim (\mathbf{E}'_i) = \dim (\mathbf{E}^{\perp}_{i})\) 이다. 그러므로 \(\mathbf{E}'_i = \mathbf{E}^{\perp}_i\) 이다. ▲

    3:

    \(x_i \in \mathbf{E}_{\lambda_i}\) 에 대하여 \(x = \displaystyle \sum_{i=1}^{k}x_i\) 을 정사영 \(\operatorname{T}_i\)\(\operatorname{T}_j\) 에 먹이면 다음과 같다.

    \[ \operatorname{T}_i(x) = x_i, \operatorname{T}_j(x) = x_j \]

    따라서 다음이 성립한다.

    \[ (\operatorname{T}_i \circ \operatorname{T}_j)(x) = \operatorname{T}_i(\operatorname{T}_j(x)) = \operatorname{T}_i(x_j) = \begin{cases} x_i & i = j\\ 0 & i \neq j\\ \end{cases} = \delta _{ij}\operatorname{T}_i \tag*{▲} \]

    4:

    1) 에 의하여 \(x \in \mathbf{V}, x_i \in \mathbf{E}_{\lambda_i} : x = \displaystyle \sum_{i=1}^{k}x_i\) 이므로 다음이 성립한다.

    \[ \sum_{i=1}^{k}\operatorname{T}_i(x) = \sum_{i=1}^{k}x_i = x \tag*{▲} \]

    5:

    \(x \in \mathbf{V}, x_i \in \mathbf{E}_{\lambda_i} : x = \displaystyle \sum_{i=1}^{k}x_i\) 에 대하여 함수의 합과 스칼라 곱 에 의하여 다음이 성립한다.

    \[ \begin{align}\begin{split} \operatorname{T}(x)&= \sum_{i=1}^{k}\operatorname{T}(x_i) = \sum_{i=1}^{k}\lambda _ix_i = \sum_{i=1}^{k}\lambda _i \operatorname{T}_i(x) \\ &= \lambda _1 \operatorname{T}_1(x) + \dots + \lambda k \operatorname{T}_k(x) \\ &= (\lambda _1 \operatorname{T}_1 + \dots + \lambda_k \operatorname{T}_k)(x) = \bigg (\sum_{i=1}^{k}\lambda _i \operatorname{T}_i \bigg )(x) \end{split}\end{align} \tag*{} \]

문제 6.6-7

유한차원 복소내적공간 \(\mathbf{V}\) 와 정규연산자 \(\operatorname{T}\)\(\operatorname{T}\) 의 스펙트럼 분해 \(\operatorname{T} = \displaystyle \sum_{i=1}^{k}\lambda _i \operatorname{T}_i\) 에 대하여 다음이 성립한다.

  1. 다항식 \(g\) 에 대하여 \(g(\operatorname{T}) = \displaystyle \sum_{i=1}^{k}g(\lambda _i)\operatorname{T}_i\) 이다.
  • 다항식에 선형연산자가 입력된 형태의 정의를 참고하자.

  • 증명

    1:

    \(\lambda _1, \dots, \lambda _k\) 에 대한 라그랑주 다항식 \(f_1, \dots, f_k\) 에 대하여 라그랑주 보간법에 의하여 다음이 성립한다.

    \[ g(\operatorname{T}) = \sum_{i=1}^{k}g( \lambda _i)f_i(\operatorname{T}) \]

    스펙트럼 정리와 \(\operatorname{T}\) 의 스펙트럼 분해와 \(\operatorname{T}\) 로 유도된 \(\operatorname{I}\) 의 분해와 적당한 상수 \(c_i \in \mathbf{F}\) 에 대하여 다음이 성립한다.

    \[ \begin{align}\begin{split} f_i(\operatorname{T}) &= \prod_{\substack{j=1\\j \neq i}}^{k}\dfrac{\operatorname{T} - \lambda _j \operatorname{I}}{\lambda _i - \lambda _j} = \prod_{\substack{j=1\\j \neq i}}^{k} \dfrac{\sum_{s=1}^{k}\lambda _s \operatorname{T}_s - \lambda _j\sum_{s=1}^{k}\operatorname{T}_s }{\lambda _i - \lambda _j} \\ &= \prod_{\substack{j=1\\j \neq i}}^{k} \dfrac{\sum_{s=1}^{k}(\lambda _s - \lambda _j) \operatorname{T}_s }{\lambda _i - \lambda _j} = \prod_{\substack{j=1\\j \neq i}}^{k} \dfrac{\sum_{s \neq j}^{}(\lambda _s - \lambda _j) \operatorname{T}_s }{\lambda _i - \lambda _j} \\ &= \prod_{\substack{j=1\\j \neq i}}^{k} \overbrace{(c_1 \operatorname{T}_1 + \dots + \operatorname{T}_i + \dots + c_k \operatorname{T}_k)}^{\text{ no }\operatorname{T}_j} = \operatorname{T}_{i}^{k-1} = \operatorname{T}_i\\ \end{split}\end{align} \tag*{}\]

    마지막 줄에서 연산 결과가 \(\operatorname{T}_i ^{k-1}\) 가 되는 이유는 \(\operatorname{T}_i\) 를 제외한 정사영 \(\operatorname{T}_1, \dots, \operatorname{T}_{i-1}, \operatorname{T}_{i+1}, \dots, \operatorname{T}_k\) 들은 반드시 다른 정사영과 곱해지기 때문에 스펙트럼 정리에 의하여 \(0\) 이 되기 때문이다. 따라서 다음이 성립한다.

    \[ \therefore g(\operatorname{T}) = \sum_{i=1}^{k}g(\lambda _i)\operatorname{T}_i \tag*{▲} \]

문제 5.4-13

벡터공간 \(\mathbf{V}\) 의 선형연산자 \(\operatorname{T}\) 와 벡터 \(v \in \mathbf{V}\setminus \{0\}\) 에 의해 생성된 \(\operatorname{T}\)-순환 부분공간 \(\mathbf{W}\) 와 임의의 \(w \in \mathbf{V}\) 에 대하여 다음은 동치이다.

  • \(w \in \mathbf{W}\)

  • \(w = g(\operatorname{T})(v)\) 인 다항식 \(g(t)\) 가 존재한다.

  • 증명

    \(w \in \mathbf{W}\) 이면 \(w\)\(\{v, \operatorname{T}(v), \operatorname{T}^{2}(v), \dots\}\) 의 일차결합이다. 따라서 \(w = g(\operatorname{T})(v)\) 인 다항식 \(g\) 가 존재한다. ▲

    \(w = g(\operatorname{T})(v)\) 인 다항식 \(g\) 가 존재하면 \(w\)\(\{v, \operatorname{T}(v), \operatorname{T}^{2}(v), \dots\}\) 의 일차결합이다. ■

문제 5.4-20

벡터공간 \(\mathbf{V}\) 의 선형연산자 \(\operatorname{T}\) 에 대하여 \(\mathbf{V}\)\(v \in \mathbf{V}\) 에 의해 생성된 \(\operatorname{T}\)-순환 부분공간이면 \(\mathbf{V}\) 의 선형연산자 \(\operatorname{U}\) 에 대하여 다음이 동치이다.

  • \(\operatorname{U}\operatorname{T}=\operatorname{T}\operatorname{U}\)

  • \(\operatorname{U}=g(\operatorname{T})\) 인 다항식 \(g(t)\) 가 존재한다.

  • 증명

    \(\operatorname{U}=g(\operatorname{T})\) 을 가정하자. 다음이 성립한다.

    \[ \operatorname{T}(\operatorname{T}^{k}) = (\operatorname{T}^{k})(\operatorname{T}) = \operatorname{T}^{k+1} \]

    \(\operatorname{T}\) 는 선형이므로 위 식의 \(\operatorname{T}^{k}\)\(\operatorname{T}\) 에 대한 다항식 \(g(\operatorname{T})\) 로 치환해도 된다. 즉, \(\operatorname{T}g(\operatorname{T}) = g(\operatorname{T})\operatorname{T}\) 이다. 따라서 \(\operatorname{U}\operatorname{T}=\operatorname{T}\operatorname{U}\) 이다. ▲

    \(\operatorname{U}\operatorname{T}=\operatorname{T}\operatorname{U}\) 를 가정하자. \(\mathbf{V}\)\(v\) 에 의해 생성된 \(\operatorname{T}\)-순환 부분공간이므로 다음과 같은 기저를 갖는다.

    \[ \beta = \{v, \operatorname{T}(v), \operatorname{T}^{2}(v), \dots, \operatorname{T}^{k}(v)\} \]

    따라서 \(\operatorname{U}(v)\)\(\beta\) 의 일차결합이고, 이는 적절한 다항식 \(g\) 에 대하여 \(\operatorname{U}(v) = g(\operatorname{T})(v)\) 임을 뜻한다. 이제 정리 2.6 따름정리 에 의하여 \(\forall w \in \beta : \operatorname{U}(w) = g(\operatorname{T})(w)\) 를 보임으로써 \(\operatorname{U} = g(\operatorname{T})\) 를 보이려 한다. 다음이 성립한다.

    \[ \forall m \in \Bbb{Z}^{+} : \operatorname{U}(\operatorname{T}^{m}(v)) = \operatorname{T}^{m}(\operatorname{U}(v)) = (\operatorname{T}^{m}\circ g(\operatorname{T}))(v) = g(\operatorname{T})(\operatorname{T}^{m}(v)) \]

Simultaneously Diagonalizable

동시에 대각화가능(simultaneously diagonalizable)

유한차원 벡터공간 \(\mathbf{V}\) 의 선형연산자 \(\operatorname{T}\)\(\operatorname{U}\) 에 대하여 \([\operatorname{T}]_{\beta }\)\([\operatorname{U}]_{\beta }\) 가 대각행렬이 되게 하는 \(\mathbf{V}\) 의 순서기저 \(\beta\) 가 존재하면 \(\operatorname{T}\)\(\operatorname{U}\) 를 동시에 대각화가능하다고 한다.

두 행렬 \(A, B \in \mathbf{F}^{n \times n}\) 에 대하여 \(Q ^{-1}AQ\)\(Q ^{-1}BQ\) 가 모두 대각행렬이 되게 하는 가역행렬 \(Q \in \mathbf{F}^{n \times n}\) 가 존재하면 \(A\)\(B\) 를 동시에 대각화가능하다고 한다.

문제 5.2-18

유한차원 벡터공간 \(\mathbf{V}\) 의 선형연산자 \(\operatorname{T}\)\(\operatorname{U}\) 가 동시에 대각화가능하면 임의의 순서기저 \(\beta\) 에 대하여 \([\operatorname{T}]_{\beta }\)\([\operatorname{U}]_{\beta }\) 가 동시에 대각화가능하다.

\(A, B\) 가 동시에 대각화가능한 행렬이면 \(\operatorname{L}_{A}, \operatorname{L}_{B}\) 는 동시에 대각화가능하다.

  • 증명

    \(\operatorname{T}\)\(\operatorname{U}\) 를 동시에 대각화하는 순서기저를 \(\alpha\) 라 하고, \(\alpha\) 좌표를 \(\beta\) 좌표로 변환하는 행렬을 \(Q = [\operatorname{I}_{\mathbf{V}}]^{\beta }_{\alpha }\) 로 두면 정리 2.23 에 의하여 다음이 성립한다.

    \[ [\operatorname{T}]_{\alpha } = Q ^{-1}[\operatorname{T}]_{\beta }Q \]
    \[ [\operatorname{U}]_{\alpha } = Q ^{-1}[\operatorname{U}]_{\beta }Q \]

    \(A, B\) 를 동시에 대각화하는 가역행렬을 \(Q\) 로 두면 정리 5.1 따름정리 에 의하여 \(Q\) 의 열벡터로 구성된 기저 \(\beta\) 를 만들 수 있다. \(\alpha\) 를 표준기저로 두면 \(\beta\) 좌표를 \(\alpha\) 좌표로 변환하는 행렬 \([\operatorname{I}]^{\alpha }_{\beta }\) 에 대하여 다음이 성립한다.

    \[ [\mathbf{\operatorname{L}_{A}}]_{\beta } = [\operatorname{I}]^{\beta }_{\alpha }[\mathbf{\operatorname{L}_{A}}]_{\alpha }[\operatorname{I}]^{\alpha }_{\beta } \]

    선형변환의 행렬표현 에 의하여 \([\operatorname{I}]^{\alpha } _{\beta } = Q\) 이다. 또한 \(\operatorname{I}^{-1}\operatorname{I} = \operatorname{I} \operatorname{I}^{-1} = \operatorname{I}\) 인 것과 정리 2.18 에 의하여 \([\operatorname{I}]^{\beta }_{\alpha } = ([\operatorname{I}]^{\alpha }_{\beta })^{-1}\) 이다. 또한 정리 2.15 에 의하여 \([\operatorname{L}_{A}]_{\alpha } = A\) 이다. 따라서 \([\operatorname{I}]^{\beta }_{\alpha }[\mathbf{\operatorname{L}_{A}}]_{\alpha }[\operatorname{I}]^{\alpha }_{\beta } = Q ^{-1}AQ\) 이고, 다음이 성립한다.

    \[ [\mathbf{\operatorname{L}_{A}}]_{\beta } = Q ^{-1}AQ \]

    같은 논리로 다음을 얻을 수 있다.

    \[ [\mathbf{\operatorname{L}_{B}}]_{\beta } = Q ^{-1}BQ \]

문제 5.2-19

유한차원 벡터공간의 선형연산자 \(\operatorname{T}, \operatorname{U}\) 가 동시에 대각화가능하면 \(\operatorname{T}\)\(\operatorname{U}\) 는 가환적이다.

\(A, B \in \mathbf{F}^{n \times n}\) 가 동시에 대각화가능하면 \(A\)\(B\) 는 가환적이다.

  • 증명

    \(\operatorname{T}\)\(\operatorname{U}\) 를 동시에 대각화하는 기저를 \(\beta\) 로 두자. 대각행렬은 가환적이므로 다음이 성립한다.

    \[ [\operatorname{T}]_{\beta }[\operatorname{U}]_{\beta } = [\operatorname{U}]_{\beta }[\operatorname{T}]_{\beta } \]

    정리 2.11 따름정리 에 의하여 다음이 성립한다.

    \[ [\operatorname{T}\operatorname{U}]_{\beta } = [\operatorname{U}\operatorname{T}]_{\beta } \iff \operatorname{T}\operatorname{U}= \operatorname{U}\operatorname{T} \]

    \(A, B\) 를 동시에 대각화하는 가역행렬 \(Q\) 가 존재하면 \(Q ^{-1}AQ, Q ^{-1}BQ\) 는 대각행렬이다. 대각행렬은 가환적이므로 다음이 성립한다.

    \[ (Q ^{-1}AQ)(Q ^{-1}BQ) = (Q ^{-1}BQ)(Q ^{-1}AQ) \]
    \[ \iff Q ^{-1}ABQ = Q ^{-1}BAQ \]
    \[ \iff Q Q ^{-1}ABQ Q ^{-1} = Q Q ^{-1}BAQ Q ^{-1}\]
    \[ \iff AB = BA \]

문제 5.1-16

벡터공간 \(\mathbf{V}\) 의 선형연산자 \(\operatorname{T}\) 와 고윳값 \(\lambda\) 에 대응하는 \(\operatorname{T}\) 의 고유벡터 \(x\) 는 임의의 \(m \in \N\) 에 대하여 고윳값 \(\lambda ^{m}\) 에 대응하는 \(\operatorname{T}^{m}\) 의 고유벡터이다.

행렬에 대하여 같은 결과가 성립한다.

  • 증명

    선형변환의 정의에 의하여 스칼라를 바깥으로 빼낼 수 있고, 정리 2.10 에 의하여 스칼라를 합성함수의 바깥으로도 뺴낼 수 있다. 따라서 다음이 성립한다.

    \[ \operatorname{T}^{m}(x) = \operatorname{T}^{m-1}(\lambda v) = \lambda \operatorname{T}^{m-1}(v) = \dots = \lambda ^{m}v \tag*{▲} \]

    행렬 \(A\) 의 고윳값 \(\lambda\) 에 대응하는 고유벡터 \(x\) 가 존재하면 정리 2.12 에 의하여 다음이 성립한다.

    \[ A ^{m}x = A ^{m-1}\lambda x = \lambda A ^{m-1}x = \dots = \lambda ^{m}x \tag*{■}\]

문제 5.2-20

유한차원 벡터공간의 선형연산자 \(\operatorname{T}\) 가 대각화가능하면 임의의 \(m \in \N\) 에 대하여 \(\operatorname{T}\)\(\operatorname{T}^{m}\) 가 동시에 대각화가능하다.

  • 증명

    문제 5.1-16 에 의하여 \(\operatorname{T}\) 의 고유벡터는 \(\operatorname{T}^{m}\) 의 고유벡터이다. ■

문제 5.4-23

유한차원 벡터공간 \(\mathbf{V}\) 의 선형연산자 \(\operatorname{T}\)\(\operatorname{T}\)-불변 부분공간 \(\mathbf{W}\)\(\operatorname{T}\) 의 서로 다른 고윳값에 대응하는 고유벡터 \(v_1, v_2, \dots, v_k\) 에 대하여 \(\displaystyle \sum_{i=1}^{k}v_i \in \mathbf{W}\) 이면 \(\forall i \in \{1,\dots,k\} : v_i \in \mathbf{W}\) 이다.

  • 증명

    \(k = 1\) 이면 자명하다. ▲

    \(k = n -1\) 에서 정리가 성립하면 \(k = n\) 에서 정리가 성립한다는 것을 증명하면 증명이 끝난다. \(u = \displaystyle \sum_{i=1}^{n}v_i \in \mathbf{W}\) 이면 \(\mathbf{W}\)\(\operatorname{T}\)-불변이므로 다음이 성립한다.

    \[ \operatorname{T}(u) = \sum_{i=1}^{n}\lambda _iv_i \in \mathbf{W} \]

    \(\mathbf{W}\) 는 부분공간이므로 스칼라곱에 대하여 닫혀있고, 따라서 \(\lambda _nu \in \mathbf{W}\) 이다. 벡터 합에 대하여서도 닫혀있으므로 다음이 성립한다.

    \[ \operatorname{T}(u) - \lambda _n u = \sum_{i=1}^{n-1}(\lambda _i - \lambda _n)v_i \in \mathbf{W} \]

    서로 다른 고윳값이라는 가정에 의하여 \(\lambda _i - \lambda _n \neq 0\) 이고 귀납법의 가정에 의하여 \(i \in \{1, \dots, n-1\} : (\lambda _i - \lambda _n)v_i \in \mathbf{W}\) 이다. 따라서 \(i \in \{1, \dots, n-1\} : v_i \in \mathbf{W}\) 이다. 따라서 다음을 얻는다.

    \[ \therefore v_n = u - \sum_{i=1}^{n-1}v_i \in \mathbf{W} \tag*{■} \]

문제 5.4-24

대각화가능한 선형연산자 \(\operatorname{T}\) 를 점공간이 아닌 임의의 \(\operatorname{T}\)-불변 부분공간으로 제한해도 대각화가능하다.

  • 증명

    벡터공간 \(\mathbf{V}\) 의 선형연산자 \(\operatorname{T}\) 와 점공간이 아닌 \(\operatorname{T}\)-불변 부분공간 \(\mathbf{W}\) 을 가정하자. \(\operatorname{T}\) 의 고윳값 \(\lambda\) 에 대응하는 고유공간을 \(\mathbf{E}_{\lambda}\) 로 두자. \(\operatorname{T}_{\mathbf{W}}\) 의 고윳값 \(\lambda\) 에 대응하는 고유공간을 \(\mathbf{W}_{\lambda } = \mathbf{E}_{\lambda} \cap \mathbf{W}\) 라고 정의한다.

    \(\mathbf{W}_{\lambda }\) 의 기저 \(\beta _{\lambda }\) 에 대하여 \(\beta = \displaystyle \bigcup_{\lambda }^{}\beta _{\lambda }\)\(\mathbf{W}\) 의 기저가 됨을 보이자. 정리 5.5 에 의하여 \(\beta\) 는 일차독립이다. \(\operatorname{T}\) 가 대각화가능하므로 정리 5.8 에 의하여 \(\operatorname{T}\) 의 고유벡터로 이루어진 \(\mathbf{V}\) 의 기저가 존재하고, 이에따라 모든 벡터를 \(\operatorname{T}\) 의 고유벡터의 일차결합으로 표현할 수 있다. \(\mathbf{W}\) 의 벡터도 마찬가지로 \(\operatorname{T}\) 의 고유벡터의 일차결합으로 표현할 수 있다. 그러면 문제 5.4-23 에 의하여 \(\mathbf{W}\) 의 벡터를 일차결합으로 표현하는 \(\operatorname{T}\) 의 고유벡터들은 \(\mathbf{W}\) 에 속한다. 이는 \(\beta\) 의 일차결합으로 표현되는 모든 벡터가 \(\mathbf{W}\) 에 속함을 뜻하고, 따라서 \(\beta\)\(\operatorname{T}\) 의 고유벡터로 이루어진 \(\mathbf{W}\) 의 기저가 된다.

    정리 5.1 에 의하여 \(\beta\)\(\operatorname{T}_{\mathbf{W}}\) 를 대각화 할 수 있다. ■

문제 5.4-25

유한차원 벡터공간의 대각화가능한 선형연산자 \(\operatorname{T}\)\(\operatorname{U}\) 가 가환적이면 \(\operatorname{T}\)\(\operatorname{U}\) 는 동시에 대각화가능하다.

\(A, B \in \mathbf{F}^{n \times n}\) 가 가환적이면 \(A, B\) 를 동시에 대각화가능하다.

  • 증명

    \(\operatorname{T}\) 의 고윳값 \(\lambda\) 에 대응하는 고유공간 \(\mathbf{E}_{\lambda}\) 에 대하여 다음이 성립한다.

    \[ \forall v \in \mathbf{E}_{\lambda} : \operatorname{T}(\operatorname{U}(v)) = \operatorname{U}(\operatorname{T}(v)) = \operatorname{U}(\lambda v) = \lambda \operatorname{U}(v) \]

    즉, \(\operatorname{U}(\mathbf{E}_{\lambda})\)\(\lambda\) 에 대응하는 \(\operatorname{T}\) 의 고유벡터이다. 따라서 \(\operatorname{U}(\mathbf{E}_{\lambda} ) \in \mathbf{E}_{\lambda}\) 이고, 이는 \(\mathbf{E}_{\lambda}\)\(\operatorname{U}\)-불변임을 뜻한다. 문제 5.4-24 에 의하여 대각화가능인 \(\operatorname{U}\)\(\operatorname{U}\)-불변 부분공간 \(\mathbf{E}_{\lambda}\) 로 제한한 \(\operatorname{U}_{\mathbf{E}_{\lambda} }\) 도 대각화가능이다. 즉, \([\operatorname{U}_{\mathbf{E}_{\lambda} }]_{\beta _{\lambda }}\) 가 대각행렬인 \(\mathbf{E}_{\lambda}\) 의 기저 \(\beta _{\lambda }\) 가 존재한다.

    \(\beta = \displaystyle \bigcup_{\lambda }^{}\beta _{\lambda }\) 로 두면 \(\beta\) 에 의하여 \(\operatorname{T}\)\(\operatorname{U}\) 를 둘 다 대각화 할 수 있다. ▲

    위 논리를 선형연산자 \(\operatorname{L}_{A}, \operatorname{L}_{B}\) 에 대하여 그대로 펼치면 증명이 끝난다. ■

유한차원 벡터공간의 선형연산자 \(\operatorname{T}\)\(\operatorname{U}\) 에 대하여 다음은 동치이다.

  • \(\operatorname{T}\)\(\operatorname{U}\) 가 가환적이다.

  • \(\operatorname{T}\)\(\operatorname{U}\) 는 동시에 대각화가능하다.

행렬 \(A, B \in \mathbf{F}^{n \times n}\) 에 대하여 다음은 동치이다.

  • \(A, B\) 가 가환적이다.

  • \(A, B\) 를 동시에 대각화가능하다.

  • 증명

    문제 5.4-25 와 문제 5.2-19 를 결합하면 증명이 바로 끝난다. ■

문제 5.4-26

\(n\)차원 벡터공간 \(\mathbf{V}\) 의 선형연산자 \(\operatorname{T}\)\(n\)개의 서로 다른 고윳값을 가지면 \(\mathbf{V}\) 는 자기 자신에 대한 \(\operatorname{T}\)-순환 부분공간이다.

  • 증명

    \(n\)개의 고윳값에 대응하는 고유벡터로 이루어진 집합 \(\beta = \{v_1, v_2, \dots, v_n\}\) 를 정하면 \(v = \displaystyle \sum_{i=1}^{n}v_i\) 를 정의할 수 있다. \(\mathbf{W}\)\(v\) 에 의해 생성된 \(\operatorname{T}\)-순환 부분공간이라 하자. 문제 5.4.23 에 의하여 \(\forall i \in \{1,\dots,n\} : v_i \in \mathbf{W}\) 이다. 정리 5.5 에 의하여 \(\beta\) 는 일차독립이므로 \(\dim (\mathbf{W}) = n\) 이다. 그러면 정리 5.21 에 의하여 다음은 \(\mathbf{W}\) 의 기저이다.

    \[ \{v, \operatorname{T}(v), \dots, \operatorname{T}^{n-1}(v)\} \]

    부분공간이 원래의 벡터공간과 차원이 같으므로 정리 1.11 에 의하여 \(\mathbf{V} = \mathbf{W}\) 이다. 즉, \(\mathbf{V}\) 는 자기 자신에 대한 \(\operatorname{T}\)-순환 부분공간이 된다. ■

Spectral Theorem's Corollary

\(n\)차원 벡터공간의 선형연산자 \(\operatorname{T}\) 가 서로 다른 \(n\)개의 고윳값을 가지면 \(\operatorname{T}\) 와 가환인 선형연산자는 \(\operatorname{T}\) 에 대한 다항식이다.

  • Hoffman and Kuzen 의 6.5.3 문제이다.

  • 이 정리는 선형연산자 \(\operatorname{T}\) 의 가환자가 \(\operatorname{T}\) 에 대한 다항식임을 말해준다. 이 성질은 특성다항식과 최소다항식이 같다는 성질과도 같다. 또한 이 성질은 닮은 행렬이 companion 행렬과 같다는 것과 같다.

  • 증명 (https://math.stackexchange.com/questions/422356/an-operator-that-commutes-with-another-operator-t-with-distinct-characteristic)

    \(\operatorname{T}\)\(\operatorname{U}\) 가 가환이면 동시에 대각화가능하다. 동시에 대각화하는 기저 \(\beta = \{v_1, v_2, \dots, v_n\}\) 에 대하여 \(\operatorname{T} = \operatorname{diag} (\lambda _1, \dots, \lambda _n), \operatorname{U} = \operatorname{diag} (\mu _1, \dots, \mu _n)\) 으로 두자. 스칼라 \(\lambda _1, \dots, \lambda _n\) 에 대한 라그랑주 다항식 \(f\) 에 대한 라그랑주 보간법에 의하여 다음과 같은 \(n\)차 다항식 \(g\) 가 존재한다.

    \[ f_j(x) = \prod_{i \neq j}^{}\dfrac{x - \lambda _i}{\lambda _j - \lambda _i} \]
    \[ g(x) = \sum_{j=1}^{n}g(\lambda _j)f_j(x) = \sum_{j=1}^{n}\mu _jf_j(x) \]

    \(g\)\(\operatorname{T}\) 의 고윳값을 입력받고 \(\operatorname{U}\) 의 고윳값을 출력하는 다항식이다. 그러면 다음이 성립한다.

    \[ \begin{align}\begin{split} f_j(\operatorname{T})(v_k) &= \bigg ( \prod_{i \neq j}^{}\dfrac{\operatorname{T} - \lambda _i \operatorname{I}}{\lambda _j - \lambda _i} \bigg )(v_k) = \bigg ( \prod_{\substack{i=1 \\ i \neq j}}^{n-1}\dfrac{\operatorname{T} - \lambda _i \operatorname{I}}{\lambda _j - \lambda _i}\bigg )\bigg ( \dfrac{\operatorname{T} - \lambda _n \operatorname{I}}{\lambda _j - \lambda _n}\bigg )(v_k) \\ & = \bigg ( \prod_{\substack{i=1 \\ i \neq j}}^{n-1}\dfrac{\operatorname{T} - \lambda _i \operatorname{I}}{\lambda _j - \lambda _i}\bigg )\bigg ( \dfrac{(\lambda _k - \lambda _n)v_k}{\lambda _j - \lambda _n}\bigg ) \\ & = \bigg ( \dfrac{\lambda _k - \lambda _n}{\lambda _j - \lambda _n}\bigg )\bigg ( \prod_{\substack{i=1 \\ i \neq j}}^{n-1}\dfrac{\operatorname{T} - \lambda _i \operatorname{I}}{\lambda _j - \lambda _i}\bigg )(v_k) = \bigg (\prod_{i \neq j}^{}\frac{\lambda _k - \lambda _i}{\lambda _j - \lambda _i} \bigg )v_k \\ &= \begin{cases} 0 &j \neq k\\ v_k & j = k\\ \end{cases} =\delta _{jk}v_k \\ \end{split}\end{align} \tag*{} \]

    따라서 \(\displaystyle g(\operatorname{T})(v_k) = \sum_{j=1}^{n}\mu _jf_j(\operatorname{T})(v_k) = \sum_{j=1}^{n}\mu _j \delta _{jk}v_k = \mu _kv_k\) 이다. 그러므로 \(g(\operatorname{T}) = \operatorname{diag} (\mu _1, \dots, \mu _n) = \operatorname{U}\) 이다. 즉, \(\operatorname{T}\) 와 가환인 선형연산자 \(\operatorname{U}\)\(\operatorname{T}\) 에 대한 다항식이다. ▲

    \(\operatorname{T}\) 에 대한 다항식이 \(\operatorname{T}\) 와 가환인 선형연산자임을 보이는 것은 쉽다. ■

정리 6.25 스펙트럼 정리(spectral theorem) 따름정리 1

유한차원 복소내적공간의 선형연산자 \(\operatorname{T}\) 에 대하여 다음은 동치이다.

  • \(\operatorname{T}\) 가 정규연산자이다.

  • 적절한 다항식 \(g\) 에 대하여 \(\operatorname{T}^{*} = g(\operatorname{T})\) 이다.

  • 증명

    \(\operatorname{T}\) 가 복소내적공간에서 정규연산자이면 대각화 가능이고, 스펙트럼 정리가 유효하다. \(\operatorname{T}\) 의 스펙트럼 분해를 \(\operatorname{T} = \displaystyle \sum_{i=1}^{k}\lambda _k \operatorname{T}_k\) 로 두자. 이 식의 양변에 수반연산자를 취하면 수반연산자의 성질 과 정사영이 에르미트 연산자라는 것을 말해주는 정리 6.24 에 의하여 \(\operatorname{T}^{*}= \displaystyle \sum_{i=1}^{k}\overline{\lambda _k}\operatorname{T}_k\) 이다.

    라그랑주 보간법 에 의하여 \(i \in \{1, \dots, k\}\) 에 대하여 \(g(\lambda _i) = \overline{\lambda _i}\) 인 다항식 \(g\) 를 쉽게 찾을 수 있다. 문제 6.6-7-(1) 에 의하여 다음이 성립한다.

    \[ g(\operatorname{T}) = \sum_{i=1}^{k}g(\lambda _i)\operatorname{T}_i = \sum_{i=1}^{k}\overline{\lambda _i}\operatorname{T}_i = \operatorname{T}^{*} \tag*{▲} \]

    이제 어떤 다항식 \(g\)\(\operatorname{T}^{*} = g(\operatorname{T})\) 를 만족한다고 가정하자. \(\operatorname{T}\)\(\operatorname{T}\) 에 대한 다항식과 가환이다. 따라서 \(\operatorname{T}\)\(\operatorname{T}^{*}\) 와 가환이다. 즉, \(\operatorname{T}\operatorname{T}^{*}=\operatorname{T}^{*}\operatorname{T}\) 이다. 따라서 \(\operatorname{T}\) 는 정규연산자이다. ■

정리 6.25 스펙트럼 정리(spectral theorem) 따름정리 2

유한차원 복소내적공간의 선형연산자 \(\operatorname{T}\) 에 대하여 다음은 동치이다.

  • \(\operatorname{T}\) 가 유니타리이다.

  • \(\operatorname{T}\) 가 정규연산자이고 \(\operatorname{T}\) 의 모든 고윳값 \(\lambda\) 에 대하여 \(|\lambda | = 1\) 이다.

  • 증명

    정리 6.18 에 의하여 \(\operatorname{T}\) 가 유니타리이면 정규연산자이다. 정리 6.18 따름정리 2 에 의하여 \(\operatorname{T}\) 의 모든 고윳값은 \(1\) 이다. ▲

    \(\operatorname{T}\) 가 정규연산자임을 가정하면 스펙트럼 정리가 유효하다. \(\operatorname{T}\) 의 스펙트럼 분해를 \(\operatorname{T}= \displaystyle \sum_{i=1}^{k}\lambda _i \operatorname{T}_i\) 라 하자. 스펙트럼 정리정리 6.24\(|\lambda | = 1\) 인 것에 의하여 다음이 성립한다.

    \[ \begin{align}\begin{split} \operatorname{T}\operatorname{T}^{*}&=(\lambda _1 \operatorname{T}_1 + \dots + \lambda _k \operatorname{T}_k)(\overline{\lambda _1}\operatorname{T}_1 + \dots + \overline{\lambda _k}\operatorname{T}_k) \\ &= |\lambda _1|^{2}\operatorname{T}_1 + \dots + |\lambda _k|^{2}\operatorname{T}_k = \sum_{i=1}^{k}\lambda _k = \operatorname{I}\\ \end{split}\end{align} \tag*{} \]

    그러면 정리 6.18 에 의하여 \(\operatorname{T}\) 는 유니타리이다. ■

정리 6.25 스펙트럼 정리(spectral theorem) 따름정리 3

유한차원 복소내적공간의 선형연산자 \(\operatorname{T}\) 에 대하여 다음은 동치이다.

  • \(\operatorname{T}\) 가 자기수반연산자이다.

  • \(\operatorname{T}\) 가 정규연산자이고 \(\operatorname{T}\) 의 모든 고윳값이 실수이다.

  • 증명

    \(\operatorname{T}\) 가 정규연산자이면 스펙트럼 정리가 유효하다. \(\operatorname{T}\) 의 스펙트럼 분해를 \(\displaystyle \operatorname{T}=\sum_{i=1}^{k}\lambda _i \operatorname{T}_i\) 라 하면 정리 6.11 와 고윳값들이 실수인 것에 의하여 다음이 성립한다.

    \[ \operatorname{T}^{*} = \sum_{i=1}^{k}\overline{\lambda _i}\operatorname{T}_k = \sum_{i=1}^{k}\lambda _i \operatorname{T}_k = \operatorname{T} \]

    즉, \(\operatorname{T}\) 는 에르미트이다. ▲

    \(\operatorname{T}\) 가 에르미트이면 \(\operatorname{T}\) 는 정규연산자이고 정리 6.17 보조정리 에 의하여 모든 고윳값이 실수이다. ■

정리 6.25 스펙트럼 정리(spectral theorem) 따름정리 4

유한차원 내적공간의 선형연산자 \(\operatorname{T}\) 의 스펙트럼 분해가 \(\operatorname{T} = \displaystyle \sum_{i=1}^{k}\lambda _k \operatorname{T}_k\) 이면 \(\operatorname{T}_j\)\(\operatorname{T}\) 에 대한 다항식이다.

  • 증명

    라그랑주 보간법에 의하여 \(i, j \in \{1, \dots, k\}\) 에 대하여 \(g_j(\lambda _i) = \delta _{ij}\) 인 다항식 \(g\) 를 찾을 수 있다. 문제 6.6-7-(1) 에 의하여 다음이 성립한다.

    \[ g_j(\operatorname{T}) = \sum_{i=1}^{k}g_j(\lambda _i)\operatorname{T}_i = \sum_{i=1}^{k}\delta _{ij}\operatorname{T}_i = \operatorname{T}_j \]

Singular Value Decomposition

Rank of Adjoint

수반행렬의 랭크(rank of adjoint)

임의의 행렬 \(A\) 에 대하여 \(\operatorname{rank} (A) = \operatorname{rank} (A ^{*})\) 이다.

  • 증명

    임의의 행렬 \(A\) 에 대하여 \(\operatorname{rank} (A) = \operatorname{rank} (A ^{*})\) 를 증명하자. 정리 3.6 따름정리 2 에 의하여 \(\operatorname{rank} (A ^{\top}) = \operatorname{rank} (A)\) 이므로 \(\operatorname{rank} (A) = \operatorname{rank} (\overline{A})\) 만 증명하면 된다.

    정리 3.5 에 의하여 행렬의 랭크는 열벡터로 구성된 극대 일차독립 집합의 기수이다. \(A\) 의 열벡터 \(v_i\) 에 대하여 \(\overline{v_i}\) 는 각각의 성분에 켤레복소수를 취한 것이다. 또한 \(0 = \overline{0}\) 이다. 따라서 다음이 성립한다.

    \[ \sum_{i \in I}^{} a_iv_i = 0 = \overline{\sum_{i \in I}^{} a_iv_i} = \sum_{i \in I}^{} \overline{a_iv_i} \]

    이는 \(A\) 의 열벡터 집합 \(\{v_i\}_{i \in I}\) 가 일차독립인 것이 \(\{\overline{v_i}\}_{i \in I}\) 가 일차독립인 것과 동치라는 뜻이다. 따라서 \(A\) 의 일차독립 열벡터의 개수는 \(\overline{A}\) 의 일차독립 열벡터의 개수와 같다. 그러므로 \(\operatorname{rank} (A) = \operatorname{rank} (\overline{A})\) 이고, 이에 따라 \(\operatorname{rank} (A) = \operatorname{rank} (A ^{*})\) 이다. ■

문제 6.3-13

유한차원 내적공간 \(\mathbf{V}\) 의 선형연산자 \(\operatorname{T}\) 에 대하여 다음이 성립한다.

  1. \(\ker(\operatorname{T}^{*}\operatorname{T}) = \ker(\operatorname{T})\)

  2. \(\operatorname{rank} (\operatorname{T}^{*}\operatorname{T}) = \operatorname{rank} (\operatorname{T})\)

  3. \(\operatorname{rank} (\operatorname{T}) = \operatorname{rank} (\operatorname{T}^{*})\)

  4. \(\operatorname{rank} (\operatorname{T}\operatorname{T}^{*}) = \operatorname{rank} (\operatorname{T})\)

  5. 임의의 \(n \times n\) 행렬 \(A\) 에 대하여 \(\operatorname{rank} (A ^{*}A) = \operatorname{rank} (AA ^{*}) = \operatorname{rank} (A)\) 이다.

  • 증명

    1:

    \(x \in \ker(\operatorname{T}^{*}\operatorname{T})\) 이면 \(\operatorname{T}^{*}\operatorname{T}(x) = 0\) 이고 다음이 성립한다.

    \[ 0 = \big <\operatorname{T}^{*}\operatorname{T}(x), x \big > = \big <\operatorname{T}(x), \operatorname{T}(x) \big > \]

    따라서 \(\operatorname{T}(x) = 0\) 이고, \(x \in \ker(\operatorname{T})\) 이다. ▲

    역으로 \(x \in \ker(\operatorname{T})\) 이면 \(\operatorname{T}^{*}\operatorname{T}(x) = \operatorname{T}^{*}(0) = 0\) 이므로 \(x \in \ker(\operatorname{T}^{*}\operatorname{T})\) 이다. ■

    2:

    \(\mathbf{V}\) 가 유한차원이므로 문제 6.3-12 에 의하여 다음이 성립한다.

    \[ \operatorname{im}(\operatorname{T}^{*}\operatorname{T}) = \ker(\operatorname{T}^{*}\operatorname{T}) ^{\perp} = \ker(\operatorname{T})^{\perp} = \operatorname{im}(\operatorname{T}^{*}) \]

    따라서 \(\operatorname{rank} (\operatorname{T}^{*}\operatorname{T}) = \operatorname{rank} (\operatorname{T}^{*})\) 이고, 앞으로 증명할 3) 에 의하여 \(\operatorname{rank} (\operatorname{T}^{*})=\operatorname{rank} (\operatorname{T})\) 이다. 따라서 \(\operatorname{rank} (\operatorname{T}^{*}\operatorname{T}) = \operatorname{rank} (\operatorname{T})\) 이다. ■

    3:

    위의 수반행렬의 랭크 정리에 의하여 \(\operatorname{rank} (A) = \operatorname{rank} (A ^{*})\) 이다. 정리 6.10 에 의하여 정규직교기저 \(\beta\) 에 대하여 \([\operatorname{T}]^{*}_{\beta } = [\operatorname{T}^{*}]_{\beta }\) 이므로 다음이 성립한다.

    \[ \operatorname{rank} ([\operatorname{T}]_{\beta }) = \operatorname{rank} ([\operatorname{T}]^{*}_{\beta }) = \operatorname{rank} ([\operatorname{T}^{*}]_{\beta }) \]

    정리 3.3 에 의하여 다음이 성립한다.

    \[ \operatorname{rank} (\operatorname{T}) = \operatorname{rank} (\operatorname{T}^{*}) \]

    4:

    정리 6.11(4) 과 2) 와 3) 에 의하여 다음이 성립한다.

    \[ \operatorname{rank} (\operatorname{T}\operatorname{T}^{*}) = \operatorname{rank} (\operatorname{T}^{**}\operatorname{T}^{*}) = \operatorname{rank} (\operatorname{T}^{*}) = \operatorname{rank} (\operatorname{T}) \]

    5:

    지금까지의 논의에 [정리 6.10 따름정리] 를 더하면 도출된다. ■

정리 6.5 따름정리의 일반화

정규직교기저 \(\beta = \{v_1, v_2, \dots, v_n\}\) 와 내적 \(\big <\cdot ,\cdot \big >_{1}\) 을 갖는 유한차원 내적공간 \(\mathbf{V}\), 정규직교기저 \(\gamma = \{u_1, u_2, \dots, u_m\}\) 와 내적 \(\big <\cdot ,\cdot \big > _{2}\) 를 갖는 유한차원 내적공간 \(\mathbf{W}\) 와 선형변환 \(\operatorname{T}:\mathbf{V}\to \mathbf{W}\) 에 대하여 \(A = [\operatorname{T}]^{\gamma}_{\beta}\) 로 두면 임의의 \(i, j\) 에 대하여 \(A _{ij} = \big <\operatorname{T}(v_j), u_i \big > _{2}\) 이다.

  • 증명

    정리 6.5 에 의해 \(\operatorname{T}(v_j) = \displaystyle \sum_{i=1}^{n}\big <\operatorname{T}(v_j), u_i \big >_{2} u_i \in \mathbf{W}\) 이다. 즉, \(A _{ij} = \big <\operatorname{T}(v_j), u_i \big > _{2}\) 이다.

Adjoint of Linear Transformation

선형변환의 수반연산자(adjoint of linear transformation)

유한차원 내적공간 \(\mathbf{V},\mathbf{W}\) 에 각각 내적 \(\big <\cdot ,\cdot \big >_{1}, \big <\cdot ,\cdot \big >_{2}\) 이 주어져 있을 때 선형변환 \(\operatorname{T}:\mathbf{V}\to \mathbf{W}\) 에 대하여 다음을 만족하는 함수 \(\operatorname{T}^{*}:\mathbf{W}\to \mathbf{V}\)\(\operatorname{T}\) 의 수반연산자라 한다.

\[ \forall x \in \mathbf{V}, \forall y \in \mathbf{W} : \big <\operatorname{T}(x), y \big >_{2} = \big <x, \operatorname{T}^{*}(y) \big >_{1} \]

문제 6.3-15

유한차원 내적공간 \(\mathbf{V}, \mathbf{W}\) 에 각각 내적 \(\big <\cdot ,\cdot \big >_{1}, \big <\cdot ,\cdot \big >_{2}\) 이 주어지면 선형변환 \(\operatorname{T}:\mathbf{V}\to \mathbf{W}\) 에 대하여 다음이 성립한다.

  1. \(\operatorname{T}\) 의 수반연산자 \(\operatorname{T}^{*}\) 가 유일하게 존재하고 \(\operatorname{T}^{*}\) 는 선형이다.

  2. \(\mathbf{V}\) 의 정규직교기저 \(\beta\)\(\mathbf{W}\) 의 정규직교기저 \(\gamma\) 에 대하여 \([\operatorname{T}^{*}]^{\beta}_{\gamma} = ([\operatorname{T}]^{\gamma}_{\beta} )^{*}\) 이다.

  3. \(\operatorname{rank} (\operatorname{T}^{*}) = \operatorname{rank} (\operatorname{T})\)

  4. \(\forall x \in \mathbf{W}, \forall y \in \mathbf{V} : \big <\operatorname{T}^{*}(x), y \big > _{1} = \big <x, \operatorname{T}(y) \big >_{2}\)

  5. \(\forall x \in \mathbf{V} : \operatorname{T}^{*}\operatorname{T}(x) = 0 \iff \operatorname{T}(x) = 0\)

  • 증명

    1:

    \(y \in \mathbf{W}\) 에 대하여 함수 \(\operatorname{g}_{y}:\mathbf{V}\to \mathbf{F}\)\(\operatorname{g}_{y}(x) = \big <\operatorname{T}(x), y \big >_{2}\) 라 정의하자. \(\operatorname{T}\) 가 선형이고 내적은 첫번째 성분에 대하여 선형이므로 \(\operatorname{g}_{y}\) 는 선형이다. ▲

    정리 6.8 에 의하여 \(\operatorname{g}_{y}(x) = \big <x, y' \big >_{1}\)\(y'\) 가 유일하게 존재한다. 따라서 언제나 함수 \(\operatorname{T}^{*}:\mathbf{W}\to \mathbf{V}\)\(\operatorname{T}^{*}(y) = y'\) 로 잘 정의된다. 즉, \(\operatorname{T}\) 의 수반사상 \(\operatorname{T}^{*}\) 가 존재한다. ▲

    \(\big <x, \operatorname{T}^{*}(y) \big >_{1} = \big <x, \operatorname{U}(y) \big >_{1}\) 인 함수 \(\operatorname{U}\) 가 존재하면 이는 \(\operatorname{T}^{*}= \operatorname{U}\) 를 뜻하므로 \(\operatorname{T}^{*}\) 는 유일하다. ▲

    다음이 성립하므로 \(\operatorname{T}^{*}\) 는 선형이다.

    \[ \begin{align}\begin{split} \big <x, \operatorname{T}^{*}(y + cz) \big >_{1}&= \big <\operatorname{T}(x), y+cz \big >_{2} = \big <\operatorname{T}(x),y \big >_{2}+ \overline{c}\big <\operatorname{T}(x), z \big >_{2} \\ &= \big <x, \operatorname{T}^{*}(y) \big >_{1}+\overline{c}\big <x, \operatorname{T}^{*}(x) \big >_{1} = \big <x, \operatorname{T}^{*}(y) \big >_{1}+\big <x, c\operatorname{T}^{*}(x) \big >_{1} \\ &= \big <x, \operatorname{T}^{*}(y) + c \operatorname{T}^{*}(z) \big >_{1} \end{split}\end{align} \tag*{} \]

    2:

    \(\beta = \{v_1, v_2, \dots, v_m\}, \gamma =\{u_1, u_2, \dots, u_n\}\) 라고 하자. 또한 \(\displaystyle \operatorname{T}(v_j) = \sum_{i=1}^{n}A _{ij}u_i\) 라고 하고, \(\displaystyle \operatorname{T}^{*}(u_j) = \sum_{i=1}^{m}B _{ij}v_i\) 라고 하자.

    정리 6.5 따름정리의 일반화에 의하여 다음이 성립한다.

    \[ A _{ij} = \big <\operatorname{T}(v_j), u_i \big >_{2} \]
    \[ B _{ij} = \big <\operatorname{T}^{*}(u_j), v_i \big >_{1} \]

    따라서 다음이 성립한다.

    \[ \overline{B _{ji}} = \big <v_j, \operatorname{T}^{*}(u_i) \big >_{1} = \big <\operatorname{T}(v_j), u_i \big > _{2} = A _{ij} \]

    그러므로 \([\operatorname{T}^{*}]^{\beta}_{\gamma} = ([\operatorname{T}]^{\gamma}_{\beta} )^{*}\) 이다. ■

    3:

    문제 6.3-13 과 같은 논증으로 증명된다. ■

    4:

    \[ \big <\operatorname{T}^{*}(x), y \big > _{1} = \overline{\big <y, \operatorname{T}^{*}(x)\big > _{1} } = \overline{\big <\operatorname{T}^{*}(y), x \big >_{2}} = \big <x, \operatorname{T}^{*}(y) \big >_{2} \tag*{■}\]

    5:

    \(\operatorname{T}(x) = 0\) 이면 \(\operatorname{T}^{*}\operatorname{T}(x) = \operatorname{T}^{*}(0) = 0\) 이다. ▲

    \(\operatorname{T}^{*}\operatorname{T}(x) = 0\) 이면 다음이 성립한다.

    \[ 0 = \big <x, \operatorname{T}^{*}\operatorname{T}(x) \big >_{1} = \big <\operatorname{T}(x), \operatorname{T}(x) \big > _{2} \implies \operatorname{T}(x) = 0 \]

Definite, Semidefinite

양의 정부호(positive definite), 양의 준정부호(positive semidefinite)

유한차원 내적공간의 자기수반 선형연산자 \(\operatorname{T}\) 에 대하여 다음과 같이 정의한다.

  • 모든 \(x \neq 0\) 에 대하여 \(\big <\operatorname{T}(x), x \big > > 0\) 이면 양의 정부호라 한다.

  • 모든 \(x \neq 0\) 에 대하여 \(\big <\operatorname{T}(x), x \big > \geq 0\) 이면 양의 준정부호라 한다.

  • \(\operatorname{L}_{A}\) 가 양의 정부호를 가질 때 \(\mathbf{F}\in \{\R ,\Bbb{C}\}\) 에 대하여 \(A \in \mathbf{F}^{n \times n}\) 를 양의 정부호라 한다.

  • \(\operatorname{L}_{A}\) 가 양의 준정부호를 가질 때 \(\mathbf{F}\in \{\R ,\Bbb{C}\}\) 에 대하여 \(A \in \mathbf{F}^{n \times n}\) 를 양의 정부호라 한다.

문제 6.4-4

내적공간 \(\mathbf{V}\) 의 자기수반연산자 \(\operatorname{T}\)\(\operatorname{U}\) 에 대하여 \(\operatorname{T}\operatorname{U}\) 가 자기수반연산자인 것과 \(\operatorname{T}\operatorname{U}=\operatorname{U}\operatorname{T}\) 인 것은 동치이다.

  • 증명

    \((\operatorname{T}\operatorname{U})^{*}=\operatorname{U}^{*}\operatorname{T}^{*}=\operatorname{U}\operatorname{T}\) 이므로 바로 증명된다. ■

유한차원 내적공간 \(\mathbf{V}\) 의 자기수반 선형연산자 \(\operatorname{T}\) 의 고윳값 \(\lambda _i\) 에 대응하는 고유벡터 \(v_i\) 로 이루어진 정규직교기저 \(\alpha = \{v_1, v_2, \dots, v_n\}\) 와 임의의 \(x = \displaystyle \sum_{i=1}^{n}a_iv_i \in \mathbf{V}\) 에 대하여 다음이 성립한다.

\[ \big <\operatorname{T}(x), x \big > = \sum_{i}^{} |a_i|^{2} \lambda _i \]
  • 증명

    정리 6.16정리 6.17 에 의하여 고윳값 \(\lambda _i\) 에 대응하는 고유벡터 \(v_i\) 로 이루어진 정규직교기저 \(\alpha = \{v_1, v_2, \dots, v_n\}\) 가 존재한다. 따라서 임의의 \(x \in \mathbf{V}\) 에 대하여 다음이 성립한다.

    \[ x = \sum_{i=1}^{n}a_iv_i \]
    \[ \operatorname{T}(x) = \operatorname{T}\bigg (\sum_{i=1}^{n} a_iv_i \bigg ) = \sum_{i=1}^{n}\operatorname{T}(a_iv_i) = \sum_{i=1}^{n} a_i \lambda _iv_i \]

    따라서 다음이 성립한다. (복소수의 절댓값)

    \[ \begin{align}\begin{split} \big <\operatorname{T}(x), x \big > &= \bigg < \sum_i a_i \lambda _i v_i, \sum_j a_j v_j\bigg > = \sum_{i}^{}\bigg <a_i \lambda _i v_i, \sum_{j}^{}a_jv_j \bigg > \\ &= \sum_{i}^{}\sum_{j}^{}\big <a_i \lambda _i v_i, a_jv_j \big > = \sum_{i}^{}a_i \lambda _i \overline{a_i}\big <v_i, v_i \big > \\ &= \sum_{i}^{} |a_i|^{2} \lambda _i \end{split}\end{align} \tag*{} \]

문제 6.4-17

\(n\)차원 내적공간 \(\mathbf{V}\) 의 자기수반 선형연산자 \(\operatorname{T}\)\(\operatorname{U}\), 정규직교기저 \(\beta\), \(A = [\operatorname{T}]_{\beta }\) 에 대하여 다음이 성립한다.

  1. \(\operatorname{T}\) 가 양의 정부호[양의 준정부호]인 것은 모든 고윳값이 양수[음이 아닌]인 것과 동치이다.

  2. \(\operatorname{T}\) 가 양의 정부호인 것은 영이 아닌 임의의 \(n\)순서쌍 \((a_1, a_2, \dots, a_n)\) 에 대하여 \(\displaystyle \sum_{i,j}^{}A _{ij}a_j \overline{a_i} > 0\) 인 것과 동치이다.

  3. \(\operatorname{T}\) 가 양의 준정부호인 것은 \(A = B ^{*}B\) 인 정사각행렬 \(B\) 가 존재하는 것이다.

  4. \(\operatorname{T}\)\(\operatorname{U}\)\(\operatorname{T}^{2} = \operatorname{U}^{2}\) 인 양의 준정부호인 연산자이면 \(\operatorname{T}=\operatorname{U}\) 이다.

  5. \(\operatorname{T}\)\(\operatorname{U}\)\(\operatorname{T}\operatorname{U}=\operatorname{U}\operatorname{T}\) 인 양의 정부호인 연산자이면 \(\operatorname{T}\operatorname{U}\) 는 양의 정부호이다.

  6. \(\operatorname{T}\) 가 양의 정부호[양의 준정부호]인 것은 \(A\) 가 양의 정부호[양의 준정부호] 인 것과 동치이다.

  • 6) 에 의하여 1) ~ 5) 를 행렬로 표현해도 성립한다.

  • 증명

    1:

    정리 6.16정리 6.17 에 의하여 고윳값 \(\lambda _i\) 에 대응하는 고유벡터 \(v_i\) 로 이루어진 정규직교기저 \(\alpha = \{v_1, v_2, \dots, v_n\}\) 가 존재한다. 따라서 임의의 \(x \in \mathbf{V}\) 에 대하여 다음이 성립한다.

    \[ x = \sum_{i=1}^{n}a_iv_i \]
    \[ \operatorname{T}(x) = \operatorname{T}\bigg (\sum_{i=1}^{n} a_iv_i \bigg ) = \sum_{i=1}^{n}\operatorname{T}(a_iv_i) = \sum_{i=1}^{n} a_i \lambda _iv_i \]

    따라서 다음이 성립한다. (복소수의 절댓값)

    \[ \begin{align}\begin{split} \big <\operatorname{T}(x), x \big > &= \bigg < \sum_i a_i \lambda _i v_i, \sum_j a_j v_j\bigg > = \sum_{i}^{}\bigg <a_i \lambda _i v_i, \sum_{j}^{}a_jv_j \bigg > \\ &= \sum_{i}^{}\sum_{j}^{}\big <a_i \lambda _i v_i, a_jv_j \big > = \sum_{i}^{}a_i \lambda _i \overline{a_i}\big <v_i, v_i \big > \\ &= \sum_{i}^{} |a_i|^{2} \lambda _i \end{split}\end{align} \tag*{} \]

    이 값은 고윳값이 0 보다 크면 0 보다 크고, 0 과 같거나 크면 0 과 같거나 크다. ■

    2:

    \(\beta = \{v_1, v_2, \dots, v_n\}\) 로 두면 \(x \in \mathbf{V}\) 에 대하여 \(\displaystyle x = \sum_{i}^{}a_iv_i\) 이다. 선형변환의 행렬표현 에 의하여 다음이 성립한다.

    \[ \operatorname{T}(v_j) = \sum_{i=1}^{n}A _{ij}v_i \]
    \[ \operatorname{T}(x) = \operatorname{T}\bigg (\sum_{j}^{}a_jv_j \bigg ) = \sum_{j}^{}a_j\operatorname{T}(v_j) = \sum_{j}^{}a_j \bigg (\sum_{i}^{}A _{ij}v_i\bigg ) \]

    내적의 조건내적의 성질Summation 의 결합법칙 에 의하여 다음이 성립한다.

    \[ \begin{align}\begin{split} \big <\operatorname{T}(x), x \big > &= \bigg < \sum_{j}^{}a_j\bigg (\sum_{i}^{}A _{ij}v_i\bigg ), \sum_{k}^{}a_kv_k \bigg > \\ &= \sum_{j}^{}a_j \bigg < \sum_{i}^{}A _{ij}v_i, \sum_{k}^{}a_kv_k \bigg > = \sum_{j}^{}a_j \sum_{i}^{}A _{ij}\bigg < v_i, \sum_{k}^{}a_kv_k \bigg > \\ &= \sum_{j}^{}a_j \sum_{i}^{}A _{ij}\sum_{k}^{}\overline{a_k}\big < v_i, v_k \big > = \sum_{j}^{}a_j \sum_{i}^{}A _{ij}\overline{a_i} = \sum_{i,j}^{}A _{ij}a_j \overline{a_i}\\ \end{split}\end{align} \tag*{} \]

    3:

    \(\operatorname{T}\) 가 자기수반이므로 정리 6.16정리 6.17 에 의하여 \(\operatorname{T}\) 의 고유벡터로 이루어진 정규직교기저가 존재한다. 정리 5.1 따름정리 에 의하여 \(A\) 의 고유벡터이면서 정규직교기저인 벡터들을 열로 갖는 행렬 \(P\) 와 대각행렬 \(D\) 에 대하여 \(D = P ^{-1}AP\) 이다. 유니타리 행렬의 성질 에 의하여 \(P ^{-1} = P ^{*}\) 이므로 \(A = P DP ^{*}\) 이다.

    \(\operatorname{T}\) 가 양의 준정부호이면 1) 에 의하여 모든 고윳값이 음이 아니다. 대각행렬 \(D\) 의 대각성분은 \(\operatorname{T}\) 의 고윳값이므로 음이 아니다. 대각행렬 \(E _{ii} = \sqrt[]{D _{ii}}\) 를 정의하면 \(E^2=D\) 를 이고 \(A = (P E)(EP ^{*})\) 이다. \(B = EP ^{*}\) 로 두면 문제 6.3-5-(b) 에 의하여 \(A = B ^{*}B\) 이다. ▲

    이제 \(A = B ^{*}B\) 를 가정하자. \(y = (a_1, a_2, \dots, a_n) \in \mathbf{F}^{n}\) 로 두면 2) 에 의하여 \(y ^{*}Ay = \sum_{i,j}^{}A _{ij}a_j \overline{a_i}\)\(0\) 보다 크면 \(\operatorname{T}\) 가 양의 준정부호가 된다. 다음이 성립한다.

    \[ y ^{*}Ay = y ^{*}B ^{*}By = (By)^{*}By \]

    \(By = \begin{pmatrix} c_{1}\\ c_{2}\\ \vdots\\ c_{n}\\ \end{pmatrix}\) 로 두면 복소수의 절댓값 \((By)^{*}By = \sum_{i}c_i \overline{c_i} = \sum_{i}^{}|c_i|^{2} \geq 0\) 이다. 따라서 \(\operatorname{T}\) 는 양의 준정부호이다. ■

    4:

    \(\operatorname{T}\)\(\operatorname{U}\) 가 자기수반이므로 고유벡터로 이루어진 정규직교기저 \(\alpha = \{v_1, v_2, \dots, v_n\}\) 를 갖는다. \(\operatorname{T}\)\(\operatorname{U}\) 가 양의 준정부호이므로 1) 에 의하여 \(\operatorname{T}\) 의 고유벡터 \(\lambda _i\)\(\operatorname{U}\) 의 고유벡터 \(\sigma _i\) 는 음이 아니고, \(\operatorname{T}^{2}(v_i) = \lambda _i ^{2}v_i, \operatorname{U}^{2}(v_i) = \sigma _i ^{2}v_i\) 이므로 다음이 성립한다.

    \[ \operatorname{T}^{2} = \operatorname{U}^{2} \implies \operatorname{T}^{2}(v_i) = \operatorname{U}^{2}(v_i) \implies \lambda _i ^{2}v_i = \sigma _i ^{2}v_i \]
    \[ \implies \lambda _i ^{2} = \sigma _i ^{2} \implies \lambda _i = \sigma _i \]

    따라서 \(\operatorname{T}(v_i) = \lambda v_i = \operatorname{U}(v_i)\) 이므로 정리 2.6 따름정리 에 의하여 \(\operatorname{U}=\operatorname{T}\) 이다. ■

    5:

    \(\operatorname{T}\)\(\operatorname{U}\) 는 자기수반이므로 대각화가능하다. 또한 \(\operatorname{U}\operatorname{T}=\operatorname{T}\operatorname{U}\) 이므로 문제 5.4-25 에 의하여 \(\operatorname{T}\)\(\operatorname{U}\) 를 동시에 대각화하는 기저 \(\beta\) 가 존재한다. \(\beta\)\(\operatorname{T}\)\(\operatorname{U}\) 의 고유벡터로 이루어져있으므로 \(x \in \beta\) 에 대응 하는 \(\operatorname{T}\)\(\operatorname{U}\) 의 고윳값을 각각 \(\lambda , \mu\) 라고 할 수 있다.

    \(\operatorname{T}\)\(\operatorname{U}\) 가 양의 정부호이므로 \(\lambda > 0, \mu > 0\) 이다. \(\operatorname{T}\operatorname{U}\) 의 모든 고윳값은 \(\operatorname{T}\operatorname{U}(x) = \lambda \mu x > 0\) 이므로 양수이다.

    또한 \(\operatorname{T}\operatorname{U} = \operatorname{U}\operatorname{T}\) 이므로 문제 6.4-4 에 의하여 \(\operatorname{T}\operatorname{U}\) 는 자기수반연산자이다. 따라서 \(\operatorname{T}\operatorname{U}\) 는 양의 정부호이다. ■

    6:

문제 6.4-18

유한차원 내적공간 \(\mathbf{V}\), \(\mathbf{W}\) 와 선형변환 \(\operatorname{T}: \mathbf{V}\to \mathbf{W}\) 에 대하여 다음이 성립한다.

  1. \(\operatorname{T}^{*}\operatorname{T}\)\(\operatorname{T}\operatorname{T}^{*}\) 가 양의 준정부호이다.

  2. \(\operatorname{rank} (\operatorname{T}^{*}\operatorname{T}) = \operatorname{rank} (\operatorname{T}\operatorname{T}^{*}) = \operatorname{rank} (\operatorname{T})\)

  • 증명

    1:

    정리 6.11(3) 에 의하여 \(\operatorname{T}^{*}\operatorname{T}\) 는 자기수반연산자이므로 정리 6.16 와 정리 6.17 에 의하여 이 연산자의 고유벡터로 이루어진 정규직교기저 \(\beta\) 가 존재한다. 고윳값 \(\lambda\) 에 대응하는 고유벡터 \(x \in \beta\) 에 대하여 다음이 성립한다.

    \[ \big <\operatorname{T}^{*}\operatorname{T}(x), x \big > = \big <\lambda x, x \big > = \lambda \big <x, x \big > = \lambda = \big <\operatorname{T}(x), \operatorname{T}(x) \big > \geq 0 \]

    그러면 문제 6.4-17(1) 에 의하여 \(\operatorname{T}^{*}\operatorname{T}\) 는 양의 준정부호이다. ▲

    \(\operatorname{T}\operatorname{T}^{*}\) 의 경우도 같은 논리로 증명된다. ■

    2:

    \(x \in \ker(\operatorname{T}^{*}\operatorname{T})\) 이면 다음이 성립한다.

    \[ \big <\operatorname{T}^{*}\operatorname{T}(x), x \big > = \big <\operatorname{T}(x), \operatorname{T}(x) \big > = 0 \]

    따라서 \(\operatorname{T}(x) = 0 \implies x \in \ker(\operatorname{T})\) 이다. 반대로 \(x \in \ker(\operatorname{T})\) 이면 \(\operatorname{T}^{*}\operatorname{T}(x) = \operatorname{T}^{*}(0) = 0\) 이므로 \(x \in \ker(\operatorname{T}^{*}\operatorname{T})\) 이다. 따라서 \(\ker(\operatorname{T}) = \ker(\operatorname{T}^{*}\operatorname{T})\) 이다.

    그러므로 \(\operatorname{nullity} (\operatorname{T}^{*}\operatorname{T}) = \operatorname{nullity} (\operatorname{T})\) 이고 차원 정리에 의하여 다음이 성립한다.

    \[ \dim (\mathbf{V}) = \operatorname{nullity} (\operatorname{T}) + \operatorname{rank} (\operatorname{T}) = \operatorname{nullity} (\operatorname{T}^{*}\operatorname{T}) + \operatorname{rank} (\operatorname{T}^{*}\operatorname{T}) \]

    따라서 \(\operatorname{rank} (\operatorname{T}^{*}\operatorname{T}) = \operatorname{rank} (\operatorname{T})\) 이다. ▲

    \(\operatorname{T}^{**}=\operatorname{T}\) 이고 \(\operatorname{rank} (\operatorname{T}^{*}\operatorname{T}) = \operatorname{rank} (\operatorname{T})\) 이므로 문제 6.3-15(3) 에 의하여 다음이 성립한다.

    \[ \operatorname{rank} (\operatorname{T}\operatorname{T}^{*}) = \operatorname{rank} (\operatorname{T}^{**}\operatorname{T}) = \operatorname{rank} (\operatorname{T}^{*}) = \operatorname{rank} (\operatorname{T}) \]

    따라서 \(\operatorname{rank} (\operatorname{T}) = \operatorname{rank} (\operatorname{T}^{*}\operatorname{T}) = \operatorname{rank} (\operatorname{T}\operatorname{T}^{*})\) 이다. ■

Singular Value Theorem

정리 6.26 선형변환의 특잇값 정리(Singular Value Theorem for Linear Transformations)

유한차원 내적공간 \(\mathbf{V}\)\(\mathbf{W}\), \(\operatorname{rank} (\operatorname{T}) = r\) 인 선형변환 \(\operatorname{T}:\mathbf{V}\to \mathbf{W}\) 을 잡으면 다음을 만족하는 \(\mathbf{V}\) 의 정규직교기저 \(\{v_1, v_2, \dots, v_n\}\), \(\mathbf{W}\) 의 정규직교기저 \(\{u_1, u_2, \dots, u_m\}\) 와 양의 스칼라 \(\sigma _1 \geq \sigma _2 \geq \dots \geq \sigma _r (>0)\) 이 존재한다.

\[ \operatorname{T}(v_i) = \begin{cases} \sigma _iu_i & 1 \leq i \leq r\\ 0 & i > r\\ \end{cases} \]

\(1 \leq i \leq n\) 에 대하여 \(v_i\)\(1 \leq i \leq r\) 일 때 고윳값 \(\sigma _i ^{2}\) 에 대응하는 \(\operatorname{T}^{*}\operatorname{T}\) 의 고유벡터이고 \(i > r\) 일 때 고윳값 \(0\) 에 대응하는 \(\operatorname{T}^{*}\operatorname{T}\) 의 고유벡터이다. 즉, 스칼라 \(\sigma _1, \dots, \sigma _r\)\(\operatorname{T}\) 에 의하여 유일하게 결정된다.

  • 증명

    먼저 기저와 스칼라의 존재성을 보이려 한다. 문제 6.4-18 과 문제 6.3-15(4) 에 의하여 \(\operatorname{T}^{*}\operatorname{T}\) 는 양의 준정부호인 \(\mathbf{V}\) 의 선형연산자이고, \(\operatorname{rank} (\operatorname{T}^{*}\operatorname{T}) = r\) 이다.

    \((\operatorname{T}^{*}\operatorname{T})^{*} = \operatorname{T}^{*}\operatorname{T}\) 이므로 \(\operatorname{T}^{*}\operatorname{T}\) 는 자기수반이고 이에 따라 정규연산자이기도 하다. 그러므로 정리 6.16정리 6.17 에 의하여 유한차원 내적공간 \(\mathbf{V}\)\(\operatorname{T}^{*}\operatorname{T}\) 의 고유벡터로 이루어진 정규직교기저 \(\{v_1, v_2, \dots, v_n\}\) 가 존재하며, 이에 대응하는 고윳값은 \(\lambda _1 \geq \lambda _2 \geq \dots \geq \lambda _r > 0\)\(i > r\) 에 대하여 \(\lambda _i = 0\) 이다. 이는 차원정리에 의하여 \(\mathbf{V}\) 의 기저 중 \(n - r\) 개의 벡터는 영공간의 기저를 형성하고 \(r\) 개의 벡터는 상공간으로 가는 기저를 형성하기 때문이다.

    \(1 \leq i \leq r\) 에 대하여 \(\sigma _i = \sqrt[]{\lambda _i}\) 를 정의하고, \(u_i = \dfrac{1}{\sigma _i}\operatorname{T}(v_i)\) 를 정의하자. 이제 \(\{u_1, u_2, \dots, u_r\}\)\(\mathbf{W}\) 의 정규직교 부분집합임을 보이려 한다. \(1 \leq i,j \leq r\) 에 대하여 다음이 성립한다.

    \[ \begin{align}\begin{split} \left< u_i, u_j \right>&= \left< \frac{1}{\sigma _i}\operatorname{T}(v_i), \frac{1}{\sigma _j}\operatorname{T}(v_j) \right> = \frac{1}{\sigma _i \sigma _j}\left< \operatorname{T}^{*}\operatorname{T}(v_i), v_j \right>\\ &= \frac{1}{\sigma _i \sigma _j} \left< \lambda _i v_i, v_j \right> = \dfrac{\sigma _i ^{2}}{\sigma _i \sigma _j}\left< v_i, v_j \right> = \delta _{ij}\\ \end{split}\end{align} \tag*{} \]

    따라서 \(\{u_1, u_2, \dots, u_r\}\) 은 정규직교집합이다. 그러면 정리 6.7(1) 에 의하여 이 집합을 \(\mathbf{W}\) 의 정규직교기저 \(\{u_1, u_2, \dots, u_r, \dots , u_m\}\) 으로 확장할 수 있다. 이제 \(1 \leq i \leq r\) 에 대하여 \(\operatorname{T}(v_i) = \sigma _iu_i\) 이고 \(i > r\) 에 대하여 \(\operatorname{T}^{*}\operatorname{T}(v_i) = 0\) 이므로 문제 6.3-15(5) 에 의하여 \(\operatorname{T}(v_i) = 0\) 이다. ▲

    존재성이 입증되었으니 이제 \(\sigma _i\) 의 유일성을 보이려 한다. 이를 위하여 위 조건을 만족하는 \(\{v_1, v_2, \dots, v_n\}\)\(\{u_1, u_2, \dots, u_m\}\)\(\sigma _1 \geq \sigma _2 \geq \dots \geq \sigma _r > 0\) 을 두자. 그러면 \(1 \leq i \leq m\)\(1 \leq j \leq n\) 에 대하여 다음이 성립한다.

    \[ \begin{align}\begin{split} \left< \operatorname{T}^{*}(u_i), v_j \right>&= \left< u_i, \operatorname{T}(v_j) \right> = \left< u_i, \sigma _ju_j \right>\\ &= \begin{cases} \sigma _i & i = j \leq r\\ 0 & \text{ else }\\ \end{cases} \\ \end{split}\end{align} \tag*{} \]

    그러므로 \(1 \leq i \leq m\) 에 대하여 정리 6.3 따름정리 1 에 의하여 다음이 성립한다.

    \[ \operatorname{T}^{*}(u_i) = \sum_{j=1}^{n}\left< \operatorname{T}^{*}(u_i), v_j \right>v_j = \begin{cases} \sigma _iv_i & i = j \leq r\\ 0 & \text{ else } \\ \end{cases} \tag{5} \]

    따라서 \(i \leq r\) 에 대하여

    \[ \operatorname{T}^{*}\operatorname{T}(v_i) = \operatorname{T}^{*}(\sigma _iu_i) = \sigma _i \operatorname{T}^{*}(u_i) = \sigma _i ^{2} u_i \]

    이고 \(i > r\) 에 대하여 \(\operatorname{T}^{*}\operatorname{T}(v_i) = \operatorname{T}^{*}(0) = 0\) 이다. 그러므로 각 \(v_i\)\(\operatorname{T}^{*}\operatorname{T}\) 의 고유벡터이고 \(i \leq r\) 일 때 고윳값 \(\sigma _i ^{2}\) 에 대응되고 \(i > r\) 일 때 고윳값 \(0\) 에 대응된다. ■

특잇값(singular value)

정리 6.26 에서 정의한 유일한 스칼라 \(\sigma _1, \sigma _2, \dots , \sigma _r\)\(\operatorname{T}\) 의 특잇값이라 한다.

\(r < m \land r < n\) 이면 \(k = \min \{m, n\}\) 에 대하여 특잇값은 \(\sigma _{r+1} = \dots = \sigma _k = 0\) 이다.

  • 선형변환 \(\operatorname{T}\) 의 특잇값은 \(\operatorname{T}\) 에 의하여 유일하게 결정되지만 정리 6.26 에서의 정규직교기저는 유일하지 않다. \(\operatorname{T}^{*}\operatorname{T}\) 의 고유벡터로 이루어진 정규직교기저가 유일하지 않기 때문이다.

    또한 정리 6.26 의 \((5)\) 를 보면 \(\operatorname{T}\)\(\operatorname{T}^{*}\) 의 특잇값이 서로 같다는 것을 알 수 있다.

  • 다음 예시는 선형변환이 벡터공간의 대상을 어떻게 왜곡시키는지 특잇값을 통하여 확인할 수 있음을 보여준다.

  • 예시

    \(\R^2\) 에서 정의된 가역 선형연산자 \(\operatorname{T}\) 와 단위원 \(S = \{x \in \R^2 : \left\| x \right\| = 1\}\) 를 잡자. 정리 6.26 을 사용하여 \(S' = \operatorname{T}(S)\) 을 구하여 \(\operatorname{T}\)\(S\) 를 어떻게 왜곡시키는지 확인해보자.

    \(\operatorname{T}\) 는 가역이므로 \(\operatorname{rank} (\operatorname{T}) = 2\) 이고 특잇값 \(\sigma _1 \geq \sigma _2 > 0\) 을 가진다. 정리 6.26 에 의하여 \(\operatorname{T}(v_1) = \sigma _1u_1, \operatorname{T}(v_2) = \sigma _2u_2\) 를 만족하는 \(\R^2\) 의 두 정규직교기저 \(\{v_1, v_2\}\)\(\beta = \{u_1, u_2\}\) 를 잡을 수 있다.

    이때 \(\beta\)\(\operatorname{T}\) 에 의하여 왜곡된 좌표계를 보여준다. 이 좌표계를 \(x'y'\) 좌표계라고 하면 \(x'\)축은 \(u_1\) 에 의하여 생성되고, \(y'\)축은 \(u_2\) 에 의하여 생성된다. 벡터 \(u \in \R^2\) 에 대하여 \(u = x'_1u_1 + x'_2u_2\) 라면 \(u\)\(\beta\) 에 대한 좌표벡터는 \([u]_{\beta} = \begin{pmatrix} x'_1\\ x'_2\\ \end{pmatrix}\) 가 된다.

    임의의 벡터 \(v = x_1v_1 + x_2 v_2 \in \R^2\) 에 대하여 \(u = \operatorname{T}(v)\) 는 다음과 같다.

    \[ u = \operatorname{T}(x_1v_1 + x_2v_2) = x_1 \operatorname{T}(v_1) + x_2 \operatorname{T}(v_2) = x_1 \sigma _1u_1 + x_2 \sigma _2u_2 \]

    따라서 \(u = x'_1u_1 + x'_2u_2\) 에 대하여 \(x'_1 = x_1 \sigma _1, x'_2 = x_2 \sigma _2\) 이다. 이것은 \(\operatorname{T}\)\((x_1, x_2)\) 좌표를 \((x_1 \sigma _1, x_2 \sigma _2)\) 좌표로 변환시킨다는 것을 의미한다.

    image

    \(u \in S'\) 인 것은 \(v \in S\) 인 것과 동치이고, 이는 다음이 성립하는 것과 동치이다.

    \[ \dfrac{(x'_1) ^{2}}{\sigma _1 ^{2}} + \dfrac{(x'_2) ^{2}}{\sigma _2 ^{2}} = x_1 ^{2} + x_2 ^{2} = 1 \]

    \(\sigma _1 = \sigma _2\) 라면 이는 반지름이 \(\sigma _1\) 인 원의 방정식이다. 즉, 이 경우 \(\operatorname{T}\) 는 단위원을 반지름이 \(\sigma _1\) 인 원으로 변환시킨다.

    \(\sigma _1 > \sigma _2\) 인 경우 이는 위 그림과 같은 타원의 방정식이다. 즉, 이 경우 \(\operatorname{T}\) 는 단위원을 위 그림과 같은 타원으로 변환시킨다.

Singular Value Decomposition

행렬의 특잇값(singular value of matrix)

\(m \times n\) 행렬 \(A\) 에 대하여 선형변환 \(\operatorname{L}_{A}\) 의 특잇값을 \(A\) 의 특잇값으로 정의한다.

정리 6.27 행렬의 특잇값 분해 정리(Singular Value Decomposition Theorem for Matrices)

\(\operatorname{rank} (A) = r\)\(m \times n\) 행렬 \(A\) 의 특잇값이 \(\sigma _1 \geq \sigma _2 \geq \dots \geq \sigma _r > 0\) 일 때 \(m \times n\) 행렬 \(\Sigma\) 를 다음과 같이 정의하자.

\[ \Sigma _{ij} = \begin{cases} \sigma _i & i = j \leq r\\ 0 & \text{ else } \\ \end{cases} \]

\(A = U \Sigma V ^{*}\)\(m \times m\) 유니타리 행렬 \(U\)\(n \times n\) 유니타리 행렬 \(V\) 가 존재한다.

  • 정리 6.26 은 선형변환을 행렬로 표현할 때 유용하다.

  • 특잇값 분해는 \(m \times n\) 행렬 \(A\) 를 다음과 같이 분해한다. \(U\) 의 열벡터들을 좌측특이벡터(left-singular vector), \(V\) 의 열벡터들을 우측특이벡터라고 한다.

  • 특잇값이 유일하듯이 \(\Sigma\) 도 유일하다. 정리 6.26 의 정규직교기저가 유일하지 않듯이 이 기저를 열벡터로 갖는 \(U\)\(V\) 도 유일하지 않다.

  • 증명

    선형변환 \(\operatorname{L}_{A}: \mathbf{F}^n \to \mathbf{F}^m\) 는 정리 6.26 에 의하여 \(1 \leq i \leq r\) 일 때 \(\operatorname{T}(v_i) = \sigma _iu_i\), \(i > r\) 일 때 \(\operatorname{T}(v_i) = 0\)\(\mathbf{F}^n\) 의 정규직교기저 \(\beta = \{v_1, v_2, \dots, v_n\}\)\(\mathbf{F}^m\) 의 정규직교기저 \(\gamma = \{u_1, u_2, \dots, u_m\}\) 을 갖는다. 각 \(u_j\) 들을 열로하는 \(m \times m\) 행렬 \(U\), 각 \(v_j\) 들을 열로 하는 \(n \times n\) 행렬 \(V\) 를 만들자. 유니타리 행렬의 성질에 의하여 \(U, V\) 는 유니타리 행렬이다.

    \(AV\)\(j\)열은 \(Av_j\) 인데 \(\operatorname{L}_{A}\) 의 특잇값에 의하여 \(Av_j = \sigma _ju_j\) 이다. \(\Sigma\)\(j\) 열은 \(\sigma _je_j\) 이므로 \(U \Sigma\)\(j\)열은 다음과 같다.

    \[ U(\sigma _je_j) = \sigma _jUe_j = \sigma _ju_j \]

    \(AV\)\(U \Sigma\)\(m \times n\) 행렬이고 대응하는 열이 같으므로 \(AV = U \Sigma\) 이다. 이 사실과 유니타리 행렬의 성질에 의하여 \(A = AVV ^{*} = U \Sigma V ^{*}\) 이다. ■

특잇값 분해(singular value decomposition)

특잇값이 \(\sigma _1 \geq \sigma _2 \geq \dots \geq \sigma _r > 0\) 이고 \(\operatorname{rank} (A) = r\)\(m \times n\) 행렬 \(A\) 를 두자. 정리 6.27 와 같이 유니타리 행렬 \(U, V\) 와 대각 \(m \times n\) 행렬 \(\Sigma\) 에 대하여 \(A = U \Sigma V ^{*}\) 가 성립하는데, 이것을 \(A\) 의 특잇값 분해라고 한다.

  • 특잇값 분해는 모든 행렬에 적용가능하다.

  • 예시

    \(2 \times 3\) 행렬 \(A = \begin{pmatrix} 1&1&-1\\ 1&1&-1\\ \end{pmatrix}\) 을 특잇값으로 분해해보자. 정리 3.6 따름정리 2 에 의하면 \(A\) 의 행들은 일차종속이다. 즉, \(\operatorname{rank} (A) = 1\) 이다. 정리 6.27 에 의하여 행렬 \(A\) 는 영이 아닌 특잇값을 \(1\)개 갖는다.

    정리 6.26 에 의하여 \(A ^{*} A\) 의 고유벡터와 고윳값을 구하면 고유벡터들이 곧 \(\R^3\) 의 정규직교기저가 되고 고윳값의 제곱근 \(\sqrt[]{\lambda _i}\) 들이 곧 특잇값 \(\sigma _i\) 이 된다. 먼저 \(A ^{*}A\) 는 다음과 같다.

    \[ A ^{*}A = \begin{pmatrix} 1&1\\ 1&1\\ -1&-1\\ \end{pmatrix} \begin{pmatrix} 1&1&-1\\ 1&1&-1\\ \end{pmatrix} = \begin{pmatrix} 2&2&-2\\ 2&2&-2\\ -2&-2&2\\ \end{pmatrix} \]

    일단 \(A ^{*}A = B\)특성다항식을 풀어서 고윳값을 찾아보자.

    \[ \begin{align}\begin{split} \det (B - tI_3) &= \det \begin{pmatrix} 2 - t&2&-2\\ 2&2 - t&-2\\ -2&-2&2 - t\\ \end{pmatrix} \\ &= \sum_{j=1}^{3}(-1) ^{1+j}B _{1j} \cdot \det (\tilde{B}_{1j}) \\ &= (2 - t) \cdot \{(2-t) ^{2} - 2 ^{2}\} - 2 \cdot \{2(2-t) - 2 ^{2}\} - 2 \{-2 ^{2} +2(2-t)\}\\ &= (2 - t) \cdot \{(4-t)( - t) \} - 4 \cdot (-t) - 4 (-t)\\ &= (2 - t) (4-t)( - t) + 8 t = t\{8 -(2 - t)(4 - t)\}\\ &= t(t ^{2} -6t ) = t ^{2}(t - 6) \end{split}\end{align} \tag*{} \]

    따라서 \(A ^{*}A\) 의 고윳값은 \(\lambda _1 = 6\)\(\lambda _2 = 0\) 이고, \(A\) 의 특잇값을 다음과 같이 구할 수 있다.

    \[ \boxed{\sigma _1 = \sqrt[]{\lambda _1} = \sqrt[]{6}, \sigma _2 = 0}\]

    이제 이 고윳값에 대응하는 고유벡터를 찾아서 \(\R^3\) 의 정규직교기저를 구해보자. \(\lambda _1 = 6\) 에 대응하는 고유벡터 \(x \in \R^3\)\((B - \lambda _1I)x = 0\) 을 만족해야 한다.

    \[ B - \lambda _1I = \begin{pmatrix} -4&2&-2\\ 2&-4&-2\\ -2&-2&-4\\ \end{pmatrix} \]
    \[ (B - \lambda _1I)x = \begin{pmatrix} -4&2&-2\\ 2&-4&-2\\ -2&-2&-4\\ \end{pmatrix} \begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix} = \begin{pmatrix} -4x_1 + 2x_2 - 2x_3\\ 2x_1 - 4x_2 - 2x_3\\ -2x_1 - 2x_2 - 4x_3\\ \end{pmatrix} = \begin{pmatrix} 0\\ 0\\ 0\\ \end{pmatrix} \]
    \[ \begin{cases} 2x_1 -x_2 +x_3 = 0 &\\ x_1 -2x_2 -x_3 &\\ x_1 +x_2 +2x_3 &\\ \end{cases} \implies x_1 = x_2, x_1 = -x_3 \]
    \[ \therefore x = \begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix} =x_1 \begin{pmatrix} 1\\ 1\\ -1\\ \end{pmatrix} \]

    이제 \(\lambda _2 = 0\) 에 대응하는 고유벡터 \(x\) 를 구해보자.

    \[ (B - \lambda _2I)x = \begin{pmatrix} 2&2&-2\\ 2&2&-2\\ -2&-2&2\\ \end{pmatrix} \begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix} = \begin{pmatrix} 2x_1 + 2x_2 -2 x_3\\ 2x_1 + 2x_2 -2 x_3\\ -2x_1 - 2x_2 +2 x_3\\ \end{pmatrix} = 0 \]
    \[ \implies x_1 = -x_2 + x_3 \implies x = \begin{pmatrix} x_1\\ x_2\\ x_3\\ \end{pmatrix} = \begin{pmatrix} -x_2 + x_3\\ x_2\\ x_3\\ \end{pmatrix} = x_2 \begin{pmatrix} -1\\ 1\\ 0\\ \end{pmatrix} + x_3 \begin{pmatrix} 1\\ 0\\ 1\\ \end{pmatrix}\]

    \(\lambda _1\) 에 대응하는 고유벡터 \(x\) 에서 \(x_1 = \dfrac{1}{\sqrt[]{3}}\) 으로 두고 \(v_1\) 을 잡자. 그리고 \(\lambda _2\) 에 대응하는 고유벡터 \(x\) 에서 한 번은 \(x_2 = \dfrac{-1}{\sqrt[]{2}}, x_3 = 0\) 로 두고 \(v_2\) 를 잡고, 또 한 번은 \(x_2 = \dfrac{1}{\sqrt[]{6}}, x_3 = \dfrac{2}{\sqrt[]{6}}\) 로 두고 \(v_3\) 를 잡자. 그러면 \(\R^3\) 의 정규직교기저 \(\beta = \{v_1, v_2 ,v_3\}\) 를 다음과 같이 만들 수 있다.

    \[ \boxed{ \beta = \{v_1, v_2, v_3\} = \left\{ \frac{1}{\sqrt[]{3}}\begin{pmatrix} 1\\ 1\\ -1\\ \end{pmatrix} , \frac{1}{\sqrt[]{2}}\begin{pmatrix} 1\\ -1\\ 0\\ \end{pmatrix} , \frac{1}{\sqrt[]{6}}\begin{pmatrix} 1\\ 1\\ 2\\ \end{pmatrix} \right\}} \]

    그러면 이렇게 구한 특잇값과 \(\R^3\) 의 정규직교기저로 \(\Sigma\)\(V\) 를 다음과 같이 구할 수 있다.

    \[ \boxed{ \Sigma = \begin{pmatrix} \sqrt[]{6}&0&0\\ 0&0&0\\ \end{pmatrix}, V = \begin{pmatrix} \dfrac{1}{\sqrt[]{3}} & \dfrac{1}{\sqrt[]{2}} & \dfrac{1}{\sqrt[]{6}}\\ \dfrac{1}{\sqrt[]{3}} & -\dfrac{1}{\sqrt[]{2}} & \dfrac{1}{\sqrt[]{6}}\\ -\dfrac{1}{\sqrt[]{3}} & 0 & \dfrac{2}{\sqrt[]{6}}\\ \end{pmatrix}} \]

    정리 6.26 에 의하여 \(\R^2\) 의 정규직교기저 \(u_i\) 들은 \(\operatorname{L}_{A}(v_i) = \sigma _i u_i\) 로 구할 수 있다. 즉, 다음과 같다.

    \[ u_1 = \dfrac{1}{\sigma _1}Av_1 = \frac{1}{\sqrt[]{6}} \begin{pmatrix} 1&1&-1\\ 1&1&-1\\ \end{pmatrix} \frac{1}{\sqrt[]{3}} \begin{pmatrix} 1\\ 1\\ -1\\ \end{pmatrix} = \frac{1}{ 3 \sqrt[]{2}} \begin{pmatrix} 3\\ 3\\ \end{pmatrix} = \frac{1}{\sqrt[]{2}} \begin{pmatrix} 1\\ 1\\ \end{pmatrix}\]

    \(\sigma _2 = 0\) 이므로 \(u_2\) 는 자유롭다. 따라서 \(u_2\) 는 그냥 \(u_1\) 과 직교하는 단위벡터 \(\dfrac{1}{\sqrt[]{2}}\begin{pmatrix} 1\\ -1\\ \end{pmatrix}\) 로 잡으면 된다. 이로써 다음과 같은 \(\R^2\) 의 정규직교기저 \(\gamma = \{u_1, u_2\}\) 를 얻었다.

    \[ \boxed{\gamma = \{u_1, u_2\} = \left\{ \frac{1}{\sqrt[]{2}}\begin{pmatrix} 1\\ 1\\ \end{pmatrix}, \frac{1}{\sqrt[]{2}}\begin{pmatrix} 1\\ -1\\ \end{pmatrix} \right\}} \]

    이를 통하여 최종적으로 행렬 \(U\) 를 얻는다.

    \[ \boxed{U = \begin{pmatrix} \dfrac{1}{\sqrt[]{2}} & \dfrac{1}{\sqrt[]{2}} \\ \dfrac{1}{\sqrt[]{2}} & -\dfrac{1}{\sqrt[]{2}} \\ \end{pmatrix}} \]

    이렇게 구한 \(U\)\(\Sigma\)\(V\) 에 의한 다음과 같은 꼴이 \(A\) 의 특잇값 분해인 것이다.

    \[ A = U \Sigma V ^{*} \]

Polar Decomposition

문제 6.5-14

유니타리 동치인 두 행렬 \(A, B\) 에 대하여 \(A\) 가 양의 정부호[준정부호]인 것은 \(B\) 가 양의 정부호[양의 준정부호]인 것과 동치이다.

  • 증명

정리 6.28 극분해(polar decomposition)

정사각행렬 \(A\) 에 대하여 \(A = WP\) 인 유니타리 행렬 \(W\) 와 양의 준정부호 행렬 \(P\) 가 존재한다.

\(A\) 가 가역이면 \(W\)\(P\) 는 유일하다.

  • 증명

Pseudoinverse

유사역변환(pseudoinverse, Moore-Penrose generalized inverse)

유한차원 \(\mathbf{F}\)-내적공간 \(\mathbf{V}\), \(\mathbf{W}\) 선형변환 \(\operatorname{T}:\mathbf{V}\to \mathbf{W}\) 를 두자. 선형변환 \(\operatorname{L}_{}: \ker(\operatorname{T})^{\perp} \to \operatorname{im}(\operatorname{T})\) 를 다음과 같이 정의하자.

\[ \forall x \in \ker(\operatorname{T})^{\perp} : \operatorname{L}_{}(x) = \operatorname{T}(x) \]

다음을 만족하는 \(\mathbf{W} \to \mathbf{V}\) 에서 정의된 유일한 선형변환을 \(\operatorname{T}\) 의 유사역변환이라 한다.

\[ \operatorname{T} ^{+}(y) = \begin{cases} \operatorname{L}_{}^{-1}(y) & y \in \operatorname{im}(\operatorname{T})\\ 0 & y \in \operatorname{im}(\operatorname{T})^{\perp}\\ \end{cases} \]
  • 선형변환 \(\operatorname{T}\) 가 가역이 아니면 역변환이 존재하지 않는다. 그러나 \(\operatorname{T}\)\(\ker(\operatorname{T})^{\perp}\) 로 제한하면 역변환을 만들 수 있다. 이 테크닉을 사용하면 \(\operatorname{T}\) 의 역변환의 중요한 성질들을 보존한채 위와 같은 유사역변환을 정의할 수 있다.

  • 위 정의에 따라 다음이 성립한다.

    \[ \forall x \in \ker(\operatorname{T})^{\perp} : \operatorname{L}_{}^{-1}\operatorname{T}(x) = x \]
  • \(\operatorname{T}\) 가 가역이면 \(\ker(\operatorname{T})^{\perp} = \mathbf{V}\) 이 되어 \(\operatorname{L}_{}=\operatorname{T}\) 가 되므로 \(\operatorname{T}^{+} = \operatorname{T}^{-1}\) 이다.

  • 유사역변환을 특잇값 정리를 사용하여 구할 수 있다.

    유한차원 \(\mathbf{F}\)-벡터공간 \(\mathbf{V}\), \(\mathbf{W}\), \(\operatorname{rank} (\operatorname{T}) = r\) 인 선형변환 \(\operatorname{T}:\mathbf{V}\to \mathbf{W}\) 를 두자. \(\operatorname{T}\) 의 영이 아닌 특잇값을 \(\sigma _1 \geq \sigma _2 \geq \dots \geq \sigma _r\) 라 하고 \(\mathbf{V}\)\(\mathbf{W}\) 의 정규직교기저를 각각 \(\{v_1, v_2, \dots, v_n\}\)\(\{u_1, u_2, \dots, u_m\}\) 이라고 하자.

    \(\{v_1, v_2, \dots, v_r\}\)\(\ker(\operatorname{T})^{\perp}\) 의 기저, \(\{v _{r+1}, \dots , v_n\}\)\(\ker(\operatorname{T})\) 의 기저, \(\{u_1, u_2, \dots, u_r\}\)\(\operatorname{im}(\operatorname{T})\) 의 기저, \(\{u _{r+1}, \dots , u_m\}\)\(\operatorname{im}(\operatorname{T})^{\perp}\) 의 기저이다.

    \(\operatorname{T}\)\(\ker(\operatorname{T})^{\perp}\) 로 제한하여 얻은 선형변환을 \(\operatorname{L}_{}\) 이라 하자. \(1 \leq i \leq r\) 에 대하여 \(\operatorname{L}_{}^{-1}(u_i) = \dfrac{1}{\sigma _i}v_i\) 이므로 다음이 성립한다.

    \[ \boxed{\operatorname{T}^{+}(u_i) = \begin{cases} \dfrac{1}{\sigma _i}v_i & 1 \leq i \leq r\\ 0 & r < i \leq m\\ \end{cases} } \]

유사역행렬(pseudoinverse matrix)

\(m \times n\) 행렬 \(A\) 에 대하여 \((\operatorname{L}_{A})^{+} : \mathbf{F}^m \to \mathbf{F}^n\)\((\operatorname{L}_{A}) ^{+} = \operatorname{L}_{A ^{+}}\) 이 되게 하는 \(n \times m\) 행렬 \(A ^{+}\) 가 유일하게 존재한다. 이 행렬 \(A ^{+}\)\(A\) 의 유사역행렬이라 한다.

  • (418 페이지 25번문제 → 기계학습에서 사용하는 유사 역행렬 정의)

정리 6.29

\(\operatorname{rank} (A) = r\)\(m \times n\) 행렬 \(A\) 의 특잇값 분해가 \(A = U \Sigma V ^{*}\) 이고 영이 아닌 특잇값을 \(\sigma _1 \geq \dots \geq \sigma _r\) 이라 하고, \(n \times m\) 행렬 \(\Sigma ^{+}\) 를 다음과 같이 정의하자.

\[ \Sigma ^{+} _{ij} = \begin{cases} \dfrac{1}{\sigma _i} & i = j \leq r\\ 0 & \text{ else } \\ \end{cases} \]

그러면 \(A ^{+} = V \Sigma ^{+}U ^{*}\) 이고, 이는 \(A ^{+}\) 의 특잇값 분해이다.

  • 이렇게 행렬의 유사역행렬도 특잇값분해로 구할 수 있다. 정의된 \(\Sigma ^{+}\) 은 실제로 \(\Sigma\) 의 유사역행렬이다.

  • 예시

    \(A = \begin{pmatrix} 1&1&-1\\ 1&1&-1\\ \end{pmatrix}\) 의 특잇값 분해는 다음과 같다.

    \[ A = U \Sigma V ^{*} = \begin{pmatrix} \dfrac{1}{\sqrt[]{2}} & \dfrac{1}{\sqrt[]{2}} \\ \dfrac{1}{\sqrt[]{2}} & -\dfrac{1}{\sqrt[]{2}} \\ \end{pmatrix} \begin{pmatrix} \sqrt[]{6}&0&0\\ 0&0&0\\ \end{pmatrix}\begin{pmatrix} \dfrac{1}{\sqrt[]{3}} & \dfrac{1}{\sqrt[]{2}} & \dfrac{1}{\sqrt[]{6}}\\ \dfrac{1}{\sqrt[]{3}} & -\dfrac{1}{\sqrt[]{2}} & \dfrac{1}{\sqrt[]{6}}\\ -\dfrac{1}{\sqrt[]{3}} & 0 & \dfrac{2}{\sqrt[]{6}}\\ \end{pmatrix}^{*} \]

    본 정리에 의하여 \(A\) 의 유사역행렬 \(A ^{+}\) 은 다음과 같다.

    \[ A ^{+} = V \Sigma ^{+} U ^{*} = \begin{pmatrix} \dfrac{1}{\sqrt[]{3}} & \dfrac{1}{\sqrt[]{2}} & \dfrac{1}{\sqrt[]{6}}\\ \dfrac{1}{\sqrt[]{3}} & -\dfrac{1}{\sqrt[]{2}} & \dfrac{1}{\sqrt[]{6}}\\ -\dfrac{1}{\sqrt[]{3}} & 0 & \dfrac{2}{\sqrt[]{6}}\\ \end{pmatrix} \begin{pmatrix} \sqrt[]{6}&0\\ 0&0\\ 0&0\\ \end{pmatrix} \begin{pmatrix} \dfrac{1}{\sqrt[]{2}} & \dfrac{1}{\sqrt[]{2}} \\ \dfrac{1}{\sqrt[]{2}} & -\dfrac{1}{\sqrt[]{2}} \\ \end{pmatrix} ^{*} \]
    \[ = \frac{1}{6} \begin{pmatrix} 1&1\\ 1&1\\ -1&-1\\ \end{pmatrix} \]

보조정리(유사역변환)

유한차원 내적공간 \(\mathbf{V}\), \(\mathbf{W}\) 와 선형변환 \(\operatorname{T}:\mathbf{V} \to \mathbf{W}\) 에 대하여 다음이 성립한다.

  1. \(\operatorname{T}^{+}\operatorname{T}\)\(\ker(\operatorname{T})^{\perp}\) 로의 \(\mathbf{V}\) 의 정사영이다.

  2. \(\operatorname{T}\operatorname{T}^{+}\)\(\operatorname{im}(\operatorname{T})\) 로의 \(\mathbf{W}\) 의 정사영이다.

  • 증명

    1:

    \(\operatorname{T}\) 의 유사역변환 \(\operatorname{T}^{+}\) 은 선형변환 \(\operatorname{L}_{}:\ker(\operatorname{T})^{\perp}\to \mathbf{W}\)\(\forall x \in \ker(\operatorname{T})^{\perp} : \operatorname{L}_{}(x) = \operatorname{T}(x)\) 와 같이 정의하여 정의된다. 따라서 다음이 성립한다.

    \[ x \in \ker(\operatorname{T})^{\perp} \implies \operatorname{T}^{+}\operatorname{T}(x) = \operatorname{L}_{}^{-1}\operatorname{L}_{}(x) = x \]
    \[ x \in \ker(\operatorname{T}) \implies \operatorname{T}^{+}\operatorname{T}(x) = \operatorname{T}^{+}(0) = 0 \]

    \(\operatorname{im}(\operatorname{T}^{+}\operatorname{T}) = \ker(\operatorname{T})^{\perp}, \ker(\operatorname{T}^{+}\operatorname{T}) = \ker(\operatorname{T})\) 인데 \(\operatorname{T}^{+}\operatorname{T}\) 는 선형이므로 \(\operatorname{T}^{+}\operatorname{T}\)\(\ker(\operatorname{T})^{\perp}\) 으로의 정사영이다. ■

    2:

    1) 과 비슷하게 증명가능하다. ■

정리 6.30

\(m \times n\) 행렬 \(A\), \(b \in \mathbf{F}^m\) 에 대한 연립일차방정식 \(Ax = b\) 을 두자. \(z = A ^{+}b\) 에 대하여 다음이 성립한다.

  1. \(Ax = b\) 에 모순이 없으면, \(z\) 는 연립일차방정식의 노름이 가장 작은 유일한 해이다. 즉, 또 다른 해 \(y\) 에 대하여 \(\left\| z \right\| \leq \left\| y \right\|\) 이고, \(\left\| z \right\| = \left\| y \right\| \iff z = y\) 이다.

  2. \(Ax = b\) 에 모순이 있으면, \(z\) 는 노름이 가장 작은 유일한 최적근사이다. 즉, \(y \in \mathbf{F}^n\) 에 대하여 \(\left\| Az - b \right\| \leq \left\| Ay - b \right\|\) 이고, \(\left\| Az - b \right\| = \left\| Ay - b \right\| \iff Az = Ay\) 이다.

    또한, \(Az = Ay\) 이면 \(\left\| z \right\| \leq \left\| y \right\|\) 이고, \(\left\| z \right\| = \left\| y \right\| \iff z = y\) 이다.

  • 증명
  • 예시

    다음 연립방정식은 무한한 해를 갖는다.

    \[ x_1 + x_2 - x_3 = 1 \]
    \[ x_1 + x_2 - x_3 = 1 \]

    계수행렬 \(A = \begin{pmatrix} 1&1&-1\\ 1&1&-1\\ \end{pmatrix}\)\(b = \begin{pmatrix} 1\\ 1\\ \end{pmatrix}\) 를 잡고 유사역행렬 \(A ^{+} = \dfrac{1}{6}\begin{pmatrix} 1&1\\ 1&1\\ -1&-1\\ \end{pmatrix}\) 을 구하면 다음 \(z\) 가 노름이 가장 작은 해이다.

    \[ z = A ^{+}b = \frac{1}{3}\begin{pmatrix} 1\\ 1\\ -1\\ \end{pmatrix} \]

Bilinear

쌍선형형식(bilinear form)

\(\mathbf{F}\)-벡터공간 \(\mathbf{V}\) 에 대한 함수 \(H: \mathbf{V} \times \mathbf{V} \to \mathbf{F}\) 가 다음을 만족하면 \(\mathbf{V}\) 의 쌍선형형식이라 한다.

  1. \(\forall x_1, x_2, y \in \mathbf{V}, \forall a \in \mathbf{F} : H(ax_1 + x_2, y) = aH(x_1, y)+H(x_2, y)\)

  2. \(\forall x, y_1, y_2 \in \mathbf{V}, \forall a \in \mathbf{F} : H(x, ay_1 + y_2) = aH(x, y_1)+H(x, y_2)\)

\(H\) 가 다음을 만족하면 양의 정부호(positive definite)라고 한다.

\[ \forall x \in \mathbf{V}\setminus \{0\} : H(x,x)>0, \qquad H(0,0) = 0 \]
  • 즉, 이변수 함수 \(H: \mathbf{V} \times \mathbf{V} \to \mathbf{F}\) 가 각각의 변수에 대하여 선형이면 \(\mathbf{V}\) 의 쌍선형형식이라 한다.

  • \(\mathbf{V}\) 의 모든 쌍선형형식 집합을 \(\mathcal{B}(\mathbf{V})\) 라고 표기하자.

  • \(\R\)-벡터공간의 내적은 쌍선형형식이지만, \(\Bbb{C}\)-벡터공간의 내적은 쌍선형형식이 아니다.

  • 예시

    다음과 같이 정의된 함수 \(H: \R^2 \times \R^2 \to \R\) 는 쌍선형형식이다.

    \[ H \left( \begin{pmatrix} a_1\\ a_2\\ \end{pmatrix}, \begin{pmatrix} b_1\\ b_2\\ \end{pmatrix} \right) = 2a_1b_1 +3a_1b_2 + 4a_2b_1 - a_2b_2 \]

쌍선형형식의 성질(properties of bilinear form)

\(\mathbf{F}\)-벡터공간 \(\mathbf{V}\) 의 쌍선형형식 \(H\) 에 대하여 다음이 성립한다.

  1. 임의의 \(x, y \in \mathbf{V}\) 에 대하여 다음과 같이 정의된 함수 \(\operatorname{L}_{x}, \operatorname{R}_x: \mathbf{V} \to \mathbf{F}\) 는 선형변환이다.

    \[ \operatorname{L}_{x}(y) = H(x, y), \operatorname{R}_x(y) = H(y, x) \]
  2. \(\forall x \in \mathbf{V} : H(0, x) = H(x, 0) = 0\)

  3. \(\forall x,y,z,w \in \mathbf{V} : H(x + y, z + w) = H(x, z) + H(x, w) + H(y, z) + H(y, w)\)

  4. \(J: \mathbf{V}\times \mathbf{V} \to \mathbf{F}, (x, y) \mapsto H(y, x)\) 는 쌍선형형식이다.

  • 증명

쌍선형형식의 합과 스칼라 곱

벡터공간 \(\mathbf{V}\) 의 쌍선형형식 \(H_1, H_2\) 의 합과 스칼라 곱을 다음과 같이 정의한다.

  1. \((H_1 + H_2)(x, y) = H_1(x, y) + H_2(x, y)\)

  2. \((aH_1)(x, y) = a \cdot H_1(x, y)\)

정리 6.31

벡터공간 \(\mathbf{V}\) 에 대한 두 쌍선형형식의 합과 스칼라 곱은 \(\mathbf{V}\) 의 쌍선형형식이다.

  • 이 정리는 \(\mathcal{B}(\mathbf{V})\) 가 쌍선형형식의 합과 스칼라 곱에 대한 벡터공간임을 말해준다.

  • 증명

쌍선형형식의 행렬표현

\(n\)차원 \(\mathbf{F}\)-벡터공간 \(\mathbf{V}\) 의 순서기저 \(\beta = \{v_1, v_2, \dots, v_n\}\) 와 쌍선형형식 \(H \in \mathcal{B}(\mathbf{V})\) 에 대하여

\[ A _{ij} = H(v_i, v_j) \]

와 같이 정의된 \(n \times n\) 행렬 \(A\)\(H\) 의 행렬표현 \(\psi _{\beta }(H)\) 이라 한다.

  • \(\psi _{\beta }\)\(\mathcal{B}(\mathbf{V}) \to \mathbf{F}^{n \times n}\) 사이에서 정의된 함수이다.

  • 예시

    다음과 같이 정의된 쌍선형형식 \(H: \R^2 \times \R^2 \to \R\) 을 두자.

    \[ H \left( \begin{pmatrix} a_1\\ a_2\\ \end{pmatrix}, \begin{pmatrix} b_1\\ b_2\\ \end{pmatrix} \right) = 2a_1b_1 +3a_1b_2 + 4a_2b_1 - a_2b_2 \]

    \(\R^2\) 의 순서기저 \(\beta = \left\{ \begin{pmatrix} 1\\ 1\\ \end{pmatrix}, \begin{pmatrix} 1\\ -1\\ \end{pmatrix} \right\}\) 에 대한 행렬표현 \(B = \psi _{\beta}(H)\) 는 다음과 같다.

    \[ B _{11} = H \left( \begin{pmatrix} 1\\ 1\\ \end{pmatrix},\begin{pmatrix} 1\\ 1\\ \end{pmatrix} \right) = 8 \]
    \[ B _{12} = H \left( \begin{pmatrix} 1\\ 1\\ \end{pmatrix},\begin{pmatrix} 1\\ -1\\ \end{pmatrix} \right) = 4 \]
    \[ B _{11} = H \left( \begin{pmatrix} 1\\ -1\\ \end{pmatrix},\begin{pmatrix} 1\\ 1\\ \end{pmatrix} \right) = 2 \]
    \[ B _{11} = H \left( \begin{pmatrix} 1\\ -1\\ \end{pmatrix},\begin{pmatrix} 1\\ -1\\ \end{pmatrix} \right) = -6 \]
    \[ \implies B = \psi _{\beta}(H) = \begin{pmatrix} 8&4\\ 2&-6\\ \end{pmatrix} \]

정리 6.32

\(n\)차원 \(\mathbf{F}\)-벡터공간 \(\mathbf{V}\)\(\mathbf{V}\) 의 순서기저 \(\beta\) 에 대하여 쌍선형형식을 행렬로 변환하는 함수 \(\psi _{\beta}:\mathcal{B}(\mathbf{V})\to \mathbf{F}^{n \times n}\) 는 동형사상이다.

정리 6.32 따름정리 1

\(n\)차원 벡터공간 \(\mathbf{V}\) 에 대하여 \(\dim (\mathcal{B}(\mathbf{V})) = n ^{2}\) 이다.

  • 증명

정리 6.32 따름정리 2

\(n\)차원 \(\mathbf{F}\)-벡터공간 \(\mathbf{V}\), 순서기저 \(\beta\) 에 대하여 \(H \in \mathcal{B}(\mathbf{V}), A \in \mathbf{F}^{n \times n}\) 를 잡으면 다음이 성립한다.

\[ \psi _{\beta}(H) = A \iff \forall x, y \in \mathbf{V} : H(x, y) = [\phi _{\beta}(x)]^{t}A[\phi _{\beta}(y)] \]
  • 증명

정리 6.32 따름정리 3

\(\mathbf{F}\), 자연수 \(n \in \N\), \(\mathbf{F}^n\) 의 표준 순서기저 \(\beta\) 를 잡자. 임의의 \(H \in \mathcal{B}(\mathbf{F}^n)\), 모든 \(x, y \in \mathbf{F}^n\) 에 대하여 다음을 만족하는 행렬 \(A \in \mathbf{F}^{n \times n}\) 가 유일하게 존재한다.

\[ H(x, y) = x ^{t}Ay \]

이 행렬 \(A\)\(A = \psi _{\beta}(H)\) 이다.

  • 증명

  • 예시

    다음과 같이 정의된 쌍선형형식 \(H: \R^2 \times \R^2 \to \R\) 을 두자.

    \[ H \left( \begin{pmatrix} a_1\\ a_2\\ \end{pmatrix}, \begin{pmatrix} b_1\\ b_2\\ \end{pmatrix} \right) = \det \begin{pmatrix} a_1&b_1\\ a_2&b_2\\ \end{pmatrix} = a_1b_2 - a_2b_1 \]

    정리에 의하여 다음을 만족하는 행렬 \(A\) 가 존재한다.

    \[ \forall x, y \in \R^2 : H(x, y) = x ^{t}Ay \]

    \(\R^2\) 의 순서기저 \(e_1, e_2\) 에 대하여 항상 \(A _{ij} = H(e_i, e_j)\) 이므로 다음이 성립한다.

    \[ A _{11} = \det \begin{pmatrix} 1&1\\ 0&0\\ \end{pmatrix} = 0, \qquad A _{12} = \det \begin{pmatrix} 1&0\\ 0&1\\ \end{pmatrix} = 1 \]
    \[ A _{21} = \det \begin{pmatrix} 0&1\\ 1&0\\ \end{pmatrix} = -1, \qquad A _{22} = \det \begin{pmatrix} 0&0\\ 1&1\\ \end{pmatrix} = 0 \]
    \[ \implies A = \begin{pmatrix} 0&1\\ -1&0\\ \end{pmatrix} \]

행렬의 합동(congruent)

\(A, B \in \mathbf{F}^{n \times n}\) 에 대하여 \(B = Q ^{t}AQ\) 를 만족하는 가역행렬 \(Q \in \mathbf{F}^{n \times n}\) 가 존재하면 \(B\)\(A\) 와 합동이라 한다.

  • 합동은 동치관계이다.

정리 6.33

유한차원 벡터공간 \(\mathbf{V}\) 와 순서기저 \(\beta = \{v_1, v_2, \dots, v_n\}, \gamma = \{w_1, w_2, \dots, w_n\}\) 에 대하여 \(\gamma\) 좌표를 \(\beta\) 좌표로 바꾸는 좌표변환 행렬 \(Q\) 를 잡자. 임의의 \(H \in \mathcal{B}(\mathbf{V})\) 에 대하여 \(\psi _{\gamma}(H) = Q ^{t}\psi _{\beta}(H)Q\) 이다.

  • 이 정리는 \(\psi _{\gamma}(H)\)\(\psi _{\beta}(H)\) 와 합동임을 말해준다. 즉, 합동과 쌍선형형식의 행렬표현의 관계를 말해준다.

  • 증명

정리 6.33 따름정리

\(n\)차원 벡터공간 \(\mathbf{V}\) 와 순서기저 \(\beta\), \(\mathbf{V}\) 의 쌍선형형식 \(H\) 를 잡자.

임의의 \(n \times n\) 행렬 \(B\) 에 대하여 \(B\)\(\psi _{\beta}(H)\) 와 합동이면 \(\psi _{\gamma}(H) = B\)\(\mathbf{V}\) 의 순서기저 \(\gamma\) 가 존재한다.

행렬 \(Q\)\(B = Q ^{t}\psi _{\beta}(H)Q\) 를 만족하면 \(Q\)\(\gamma\)좌표를 \(\beta\)좌표로 바꾸어주는 좌표변환 행렬이다.

  • 증명

Symmetric Bilinear Form

대칭 쌍선형형식(symmetric bilinear form)

벡터공간 \(\mathbf{V}\) 의 쌍선형형식 \(H\) 를 잡자. 모든 \(x, y \in \mathbf{V}\) 에 대하여 \(H(x, y) = H(y, x)\) 인 쌍선형형식 \(H\) 를 대칭이라 한다.

정리 6.34

유한차원 벡터공간 \(\mathbf{V}\) 의 쌍선형형식 \(H\)\(\mathbf{V}\) 의 순서기저 \(\beta\) 에 대하여 \(H\) 가 대칭인 것과 \(\psi _{\beta}(H)\) 가 대칭행렬인 것은 동치이다.

  • 이 정리는 대칭 쌍선형형식이 본질적으로 대칭행렬과 같음을 말해준다.

  • 증명

쌍선형형식의 대각화가능

유한차원 벡터공간 \(\mathbf{V}\) 의 쌍선형형식 \(H\) 에 대하여 \(\psi _{\beta}(H)\) 가 대각행렬이 되도록 하는 \(\mathbf{V}\) 의 순서기저 \(\beta\) 가 존재하면 \(H\) 를 대각화가능하다고 한다.

정리 6.34 따름정리

유한차원 벡터공간 \(\mathbf{V}\) 의 대각화가능한 쌍선형형식 \(H\) 는 대칭이다.

  • 체의 지표\(2\) 인 경우 대칭이어도 대각화가능하지 않을 수 있다. 정리 6.35 에 의하여 지표가 \(2\) 가 아님을 가정하면 대칭 쌍선형형식은 대각화가능하다.

  • 증명

정리 6.35 보조정리

지표가 \(2\) 가 아닌 체 \(\mathbf{F}\) 에 대한 \(\mathbf{F}\)-벡터공간 \(\mathbf{V}\) 의 영이 아닌 대칭 쌍선형형식 \(H\) 를 잡자. \(H(x, x) \neq 0\) 인 벡터 \(x \in \mathbf{V}\) 가 존재한다.

  • 증명

정리 6.35

지표가 \(2\) 가 아닌 체 \(\mathbf{F}\) 에 대한 유한차원 \(\mathbf{F}\)-벡터공간 \(\mathbf{V}\) 의 대칭 쌍선형형식은 대각화가능하다.

  • 증명

정리 6.35 따름정리

지표가 \(2\) 가 아닌 체 \(\mathbf{F}\) 에 대하여 \(A \in \mathbf{F}^{n \times n}\) 가 대칭행렬이면 \(A\) 는 대각행렬과 합동이다.

  • 증명

Quadratic Forms

이차형식(quadratic form)

지표가 \(2\) 가 아닌 \(\mathbf{F}\)-벡터공간 \(\mathbf{V}\) 에 대한 함수 \(K: \mathbf{V} \to \mathbf{F}\) 에 대하여 다음을 만족하는 대칭 쌍선형형식 \(H \in \mathcal{B}(\mathbf{V})\) 가 존재하면 함수 \(K\)\(\mathbf{V}\) 의 이차형식이라 한다.

\[ \forall x \in \mathbf{V} : K(x) = H(x, x) \]
  • 대칭 쌍선형형식에 대응하는 함수를 이차형식이라 한다. 대칭 쌍선형형식은 이차형식과 일대일대응이다.

  • \(\mathbf{F}\)-벡터공간 \(\mathbf{V}\) 의 이차형식 \(K\) 가 주어졌을 때 어떤 쌍선형형식 \(H\) 에 대하여 \(K(x) = H(x, x)\) 이면 다음이 성립한다.

    \[ H(x, y) = \frac{1}{2}[K(x + y) - K(x) - K(y)] \]
    • 증명

        Friedberg, S. H., Insel, A. J., & Spence, L. E. (2018). Linear algebra. Pearson.