통계학 기댓값, 분산, 표준편차, 공분산 연산법칙 정리

통계학 기댓값, 분산, 표준편차, 공분산 연산법칙 정리

통계학은 응용 수학의 한 분야로 관찰, 조사로 얻을 수 있는 불균형적인 데이터로부터 응용 수학의 기법을 이용하여 수치상의 성질, 규칙성 또는 불규칙성을 찾아내는 학문입니다. 통계적 기법은 실험 계획, 데이터의 요약이나 해석을 실시하는데 있어서의 근거를 제공하는 학문이며, 폭넓은 분야에서 응용되어 실생활에 적용되고 있습니다.

재무관리 분야에서는 기댓값, 분산, 표준편차, 공분산 등과 같은 통계와 관련된 연산법칙이 자주 사용됩니다. 이 글에서는 재무관리를 공부하는데 매우 중요한 기댓값, 분산, 표준편차, 공분산에 대하여 알아보겠습니다.

기댓값

확률론에서 확률 변수의 기대값은 각 사건이 벌어졌을 때의 이득과 그 사건이 벌어질 확률을 곱한 것을 전체 사건에 대해 합한 값입니다. 이것은 어떤 확률적 사건에 대한 평균의 의미로 생각할 수 있습니다.

재무관리에서의 기댓값은 위험자산의 기대수익률을 의미하는데 주변 환경 상태에 따른 주식 또는 채권의 기대수익률을 측정할 때 통계학의 기대값 연산법칙이 적용됩니다. 아래의 표를 보면서 쉽게 이해할 수 있도록 합시다.

위 표에서의 상태는 경기의 불황 또는 호황이 될 수도 있으며 따뜻한 날씨 또는 추운 날씨 등이 될 수도 있습니다. 이는 자산의 특성에 따라 달라질 수 있는 환경 변수입니다.

주식 A와 주식 B는 기댓값을 구하기 위한 위험자산입니다. 위험자산은 분산 또는 표준편차가 0이 아닌 위험이 존재하는 자산으로, 주식이 될 수도 있으며 채권이 될 수도 있습니다. 따라서 가장 쉽게 찾아볼 수 있는 무위험자산인 은행예금은 여기에서 제외됩니다.

재무관리 또는 통계학에서 기댓값은 수학적 기호로 E(x)를 사용하며 주식 A와 주식 B의 기댓값은 각각 E(rA)와 E(rB)와 같이 나타냅니다.

위와 같은 수익률의 확률분포가 주어지면 두 회사 주식에 대한 수익률의 기댓값은 다음과 같이 계산할 수 있습니다.

  • E(rA) = 0.2 × 50% + 0.7 × 10% + 0.1 × -40% = 13%
  • E(rB) = 0.2 × -20% + 0.7 × 20% + 0.1 × 60% = 16%

주식 A의 기대수익률은 13%이며 주식 B의 기대수익률은 16%입니다. 하지만 표에서 쉽게 볼 수 있듯이 주식 A와 주식 B의 수익률이 주변 환경 상태에 따라 정반대로 움직이고 있습니다. 하지만 기대수익률은 13%와 16%로 거의 비슷하게 나타나고 있습니다.

따라서 기대수익률만 이용하여 어느 자산에 투자할 것인지 선택하는 것은 불가능합니다. 따라서 각 자산에 대한 위험을 측정해야 하는데 재무관리에서 위험을 측정할 때에는 분산과 표준편차를 이용합니다. 표준편차는 분산 값의 제곱근이므로 분산과 표준편차는 자산의 위험을 측정하는데 같은 용도로 사용됩니다.

분산과 표준편차 그리고 공분산

분산과 표준편차, 공분산은 재무관리에서 위험을 측정하는데 사용됩니다. 표준편차는 분산의 제곱근으로 구할 수 있으며 한 가지 자산에 대한 위험을 측정하는데 사용됩니다. 공분산은 두 자산의 표준편차를 이용하여 구할 수 있으며 두 자산에 대한 관계를 규명하는데 사용됩니다. 쉽게 말하면 두 자산이 주변 환경에 따라 얼마나 큰 차이로 변동이 생기는지 측정할 때 사용되는 것이 공분산과 이 다음에 알아볼 상관계수입니다.

재무관리 및 통계학에서 분산은 σ2x 또는 Var(x)와 같이 나타냅니다.

위에서 제시했던 표를 그대로 사용하여 주식 A와 주식 B 각각의 분산과 표준편차를 구해보도록 하겠습니다.

  • Var(rA) = σ2A = 0.2 × (50% – 13%)2 + 0.7 × (10% – 13%)2 + 0.1 × (-40% – 13%)2 = 561(%)2
  • Var(rB) = σ2B = 0.2 × (-20% – 16%)2 + 0.7 × (20% – 16%)2 + 0.1 × (60% – 16%)2 = 464(%)2
  • σA = 23.69%
  • σB = 21.54%

위에서 구한 값을 정리하면 아래와 같습니다.

공분산은 두 자산의 수익률의 상관관계를 나타내 주는 척도로 많이 사용됩니다. 공분산은 두 자산의 관계를 나타내므로 아래와 같이 공분산을 계산할 때에는 두 자산의 수익률을 모두 필요로 합니다.

공분산은 분산의 다른 형태라고 말할 수 있습니다. 분산은 한 개의 자산을 제곱한 것이지만 공분산은 두 자산을 곱한 것으로 생각하면 쉽습니다. 공분산은 Cov(X, Y) 또는 분산과 같이 σ로 나타내며 A와 B의 공분산은 Cov(rA, rB) 또는 σAB와 같이 나타냅니다. 공분산은 아래와 같이 구할 수 있습니다.

Cov(rA, rB) = σAB = 0.2 × (50% – 13%) × (-20% – 16%) + 0.7 × (10% – 13%) × (20% – 16%) + 0.1 × (-40% – 13%) × (60% – 16%) = -508(%)2

기댓값의 연산법칙

지금부터 기댓값의 연산법칙에 대하여 설명하겠습니다. 아래에서 X, Y 각각은 확률변수를, 그리고 a, b는 상수(정수 혹은 소수 혹은 분수)를 나타낸다고 가정하겠습니다.

[상수의 기댓값은 상수 자체이다.]
E(a) = a

[확률변수 X에 일정한 배수 a를 곱한 확률변수의 기댓값은 본래의 확률변수 X의 기댓값에 a를 곱한 값과 같다.]
E(aX) = a × E(X)

[확률변수 X와 Y의 합의 기댓값은 각각의 기댓값의 합과 같다.]
E(X + Y) = E(X) + E(Y)

[위의 두 법칙으로부터 다음 식이 성립한다.]
E(aX + bY) = a × E(X) + b × E(Y)

분산의 연산법칙

분산의 연산법칙에 대하여 설명하겠습니다. 아래에서 X, Y 각각은 확률변수를, 그리고 a, b는 상수(정수 혹은 소수 혹은 분수)를 나타낸다고 가정하겠습니다.

[상수 a의 분산은 0이다.]
Var(a) = 0

[확률변수 X에 일정한 배수 a를 곱한 확률변수의 분산은 본래의 확률변수 X의 분산에 a2을 곱한 것과 같다.]
Var(aX) = a2 × Var(X)

※ 증명
Var(aX) = E[aX – E(aX)]2
Var(aX) = E(a × {X – E(X)}]2
Var(aX) = E(a2 × {X – E(X)}2] Var(aX) = a2 × E[{X – E(X)}2] Var(aX) = a2 × Var(X)

[두 확률변수 X와 Y의 합의 분산은 각각의 분산에 둘 사이의 공분산을 두 배 하여 더한 것과 같다.]
Var(X + Y) = Var(X) + Var(Y) + 2 × Cov(X, Y) = σ2X + σ2Y + 2 × σ2XY

※ 증명
Var(X + Y) = E[(X + Y) – E(X + Y)]2
Var(X + Y) = E[{X – E(X)} + {Y – E(Y)}]2
Var(X + Y) = E[{X – E(X)}2 + {Y – E(Y)}2 + 2 × {X – E(X)} × {Y – E(Y)}] Var(X + Y) = E[X – E(X)]2 + E[Y – E(Y)]2 + 2 × E[X – E(X)][Y – E(Y)] Var(X + Y) = Var(X) + Var(Y) + 2 × Cov(X, Y)

[위의 두 관계를 이용하면 다음의 관계가 성립한다.]
Var(aX + bY) = a2 × Var(X) + b2 × Var(Y) + 2 × a × b × Cov(X, Y)

공분산의 연산법칙

공분산의 연산법칙에 대하여 설명하겠습니다. 아래에서 X, Y, Z 각각은 확률변수를, 그리고 a, b, c는 상수(정수 혹은 소수 혹은 분수)를 나타낸다고 가정하겠습니다.

[상수 a와 확률변수 X의 공분산은 0이다.]
Cov(a, X) = 0

[확률변수 X에 일정한 배수 a를 곱한 값과 확률변수 Y의 공분산은 두 확률변수 X와 Y의 공분산에 a를 곱한 것과 같다.]
Cov(aX, Y) = a × Cov(X, Y)

※ 증명
Cov(aX, Y) = E[aX – E(aX)][Y – E(Y)] Cov(aX, Y) = E[a × {X – E(X)}][Y – E(Y)] Cov(aX, Y) = a × E(X – E(X)][Y – E(Y)] Cov(aX, Y) = a × Cov(X, Y)

[위의 관계를 이용하면 다음의 관계가 성립한다.]
Cov(aX, bY) = a × b × Cov(X, Y)

[두 확률변수 X와 Y의 합과 또 다른 확률변수 Z의 공분산은 X와 Z의 공분산과 Y와 Z의 공분산의 합과 같다.]
Cov(X + Y, Z) = Cov(X, Z) + Cov(Y, Z)

※ 증명
Cov(X + Y, Z) = E[X + Y – E(X + Y)][Z – E(Z)] Cov(X + Y, Z) = E[{X – E(X)} + {Y – E(Y)}][Z – E(Z)] Cov(X + Y, Z) = E[X – E(X)][Z – E(Z)] + E(Y – E(Y)][Z – E(Z)] Cov(X + Y, Z) = Cov(X, Z) + Cov(Y, Z)

[위의 두 관계를 이용하면 다음의 관계가 성립한다.]
Cov(aX + bY, cZ) = a × c × Cov(X, Z) + b × c × Cov(Y, Z)

타이틀 이미지: Intel Free Press, Karl Kempf, Intel Fellow, Flickr. CC BY-SA 2.0.

5 Comments
  1. […] ※ 참고: 위의 수식을 이해하기 힘들다면 통계학에서 사용하는 각종 통계값의 연산법칙에 대하여 자세히 알아볼 필요가 있습니다. 다음 글을 참고하면서 이 글을 읽으면 이해하는 것이 더욱 쉬울 것입니다. → 2017/08/09 통계학 기댓값, 분산, 표준편차, 공분산 연산법칙 정리 by Walter Erzsa… […]

  2. 두 자산의 관계 -508 이 두 자산의 상관관계가 적다는 것인가요 두자산 모두 위험하다는 건가요?

    1. 공분산이 마이너스 값이라는 것은 두 자산의 수익이 반대의 결과를 가져온다는 것을 의미합니다. 예를 들어, A 자산의 가격이 올라가는 경우 B 자산의 가격은 떨어지게 됩니다. 위험성을 회피하기 위해서는 이러한 자산을 골고루 분포시키는 것이 중요합니다.

  3. 안녕하세요! 증명을 드래그하니 안보였던 것들이 있는데 그건 뭔가요?

    1. 수식에 이미지가 포함되어 있습니다! 아마 이미지는 제대로 복사가 안 될 겁니다. ㅠㅠ

Leave a reply

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다