NLP/AI/Statistics

[수리통계]Chap.5 확률변수의 분포2 본문

Statistics/수리통계

[수리통계]Chap.5 확률변수의 분포2

Danbi Cho 2020. 11. 19. 20:22

지난 글에서 확률변수의 개수에 따른 분포와 변환방법에 대하여 설명하였다.

 

이번 글에서는 아래의 목차에 대하여 설명할 예정이다.

 

5.4) 적률생성함수기법

5.5) 정규분포와 관련된 확률함수

 

오늘 설명할 5.4) 적률생성함수기법 은 이전 글 중 이산형 확률분포1 에서도 언급하기 때문에 참고해도 좋을 것 같다.

 

5.4) 적률생성함수기법

 

$Y = u(X_{1}, X_{2}, ..., X_{n})$에 대하여 $Y$의 적률생성함수는 $E[e^{tu(X_{1}, X_{2}, ..., X_{n})}]$으로 계산된다.

 

예제1)

 

"확률변수 $X_{1}, X_{2}$를 서로 독립이고 공간 {1,2,3,4} 위에서 균일분포를 갖는다고 할 때,

$Y = X_{1}+X_{2}$에 대한 $Y$의 mgf는?"

 

$$M_{Y}(t) = E(e^{tY} = E(e^{t(X_{1}+X_{2})})$$

$$= E(e^{tX_{1}}e^{tX_{2}}) = E(e^{tX_{1}})E(e^{tX_{2}})$$

$$M_{X}(t) = E(e^{tX}) = e^{t}\frac{1}{4} + e^{2t}\frac{1}{4} +e^{3t}\frac{1}{4} +e^{4t}\frac{1}{4} $$

 

$$M_{Y}(t) = (M_{X}(t))^{2}$$

$$ = [e^{t}\frac{1}{4} + e^{2t}\frac{1}{4} +e^{3t}\frac{1}{4} +e^{4t}\frac{1}{4}]^{2}$$

 

즉, 위의 예시와 함께 적률생성함수를 정리하면

 

$X_{1}, X_{2}, ..., X_{n}$가 각각 적률생성함수

 

$M_{X_{i}}(t),\ h_{i} < t < h_{i},\ h_{i} > 0,\ i = 1, 2, ..., n$를 갖는 서로 독립인 확률변수라고 할 때,

 

$Y = \sum^{n}_{i=1}a_{i}X_{i}$의 적률생성함수는 다음과 같다.

 

$$M_Y{t} = E(e^{t\sum_{i}a_{i}X_{i}}) = E(\prod^{n}_{i=1}e^{ta_{i}X_{i}})$$

$$ = \prod^{n}_{i=1}E(e^{ta_{i}X_{i}})$$

$$ = \prod^{n}_{i=1}M_{X_{i}}(a_{i}t)$$

 

추가적인 특성으로는,

 

$X_{1}, X_{2}, ..., X_{n}$가 각각 적률생성함수 $M(t), \ -h < t < h,$를 갖는 분포에서

추출한 확률표본이라고 할 때, 

 

a) $Y = \sum^{n}_{i=1}X_{i}$의 적률생성함수는

$$M_{Y}(t) = \prod^{n}_{i=1}M(t) = [M(t)]^{n}, \ -h < t < h$$

 

b) $\bar{X} = \frac{1}{n}\sum^{n}_{i=1}X_{i}$의 적률생성함수는

$$M_{\bar{X}}(t) = \prod^{n}_{i=1}M(\frac{t}{n}) = [M(\frac{t}{n})]^{n}, \ -h < \frac{t}{n} < h$$

 

5.5) 정규분포와 관련된 확률함수

 

$X_{1}, X_{2}, ..., X_{n}$가 각각 평균 $m_{1}, m_{2}, ..., m_{n}$과 분산 $\sigma^{2}_{1}, \sigma^{2}_{2}, ..., \sigma^{2}_{n}$을 갖는 서로 독립인 정규 확률변수라고 할 때,

 

선형함수 $Y = \sum^{n}_{i=1} c_{i}X_{i}$는 아래와 같이 정규분포를 갖는다.

 

$$ N(\sum^{n}_{i=1}c_{i}m_{i}, \sum^{n}_{i=1} c^{2}_{i}\sigma^{2}_{i})$$

 

#. $c_{i}$는 상수이다.

 

$X_{1}, X_{2}, ..., X_{n}$이 정규분포 $N(m, \sigma^{2})$에서 추출한 크기가 $n$인 확률표본이라고 할때,

표본평균 $\bar{X}$의 분포는 $N(m, \frac{\sigma^{2}}{n})$을 갖는다.

 

$$\bar{X} = \sum c_{i}X_{i}, \ \ c_{i} = \frac{1}{n}$$

$$m_{\bar{X}} = \sum \frac{1}{n} m = m$$

$$\sigma^{2}_{\bar{X}} = \sum \frac{1}{n^{2}} \sigma^{2} = \frac{\sigma^{2}}{n}$$

 

예제1)

 

"$X_{1}, X_{2}, ..., X_{n}$은 $N(50, 16)$ 분포로부터 추출한 확률표본이다."

 

(1) 표본평균 $\bar{X}$의 분포는?

$$\bar{X} ~ N (50, \frac{16}{n})$$

 

(2) $n = 64$일 때, $P(49 < X < 51)$는? 

$$P(\frac{49-50}{4} < Z < \frac{51-50}{4})$$

$$ = P(-0.25 < Z< 0.25)$$

 

(3) $n = 64$일 때, $P(49 < \bar{X} < 51)$는?

$$\bar{X} ~ N(50, (\frac{1}{2})^{2})$$

#. $\frac{16}{64} = \frac{1}{4} = (\frac{1}{2})^{2}$

$$P(\frac{49-50}{\frac{1}{2}} < Z < \frac{51-50}{\frac{1}{2}})$$

$$ = P(-2 < Z < 2)$$

 

$X_{1}, X_{2}, ..., X_{n}$는 정규분포 $N(m, \sigma^{2})$에서 추출한 크기가 $n$인 확률표본이다. 

$\bar{X} = \frac{1}{n}\sum^{n}_{i=1}X_{i}$는 표본평균이고

$S^{2} = \frac{1}{n-1}\sum^{n}_{i=1}(X_{i} - \bar{X})^{2}$는 표본분산이라고 하면 아래의 특징이 성립한다.

 

(a) $\bar{X}$와 $S^{2}$은 독립이다.

(b) $\frac{(n-1)S^{2}}{\sigma^{2}}$는 $\chi^{2}(n-1)$를 갖는다.

#. $\frac{(n-1)S^{2}}{\sigma^{2}} = \frac{\sum(X_{i} - \bar{X})^{2}}{\sigma^{2}}$

 

즉, 

 

$$\bar{X}~N(m, \frac{\sigma^{2}}{n})$$

$$\frac{\bar{X} - m}{\frac{\sigma}{\sqrt{n}}}~N(0, 1)$$

$$(\frac{\bar{X} - m}{\frac{\sigma}{\sqrt{n}}})^{2} ~ \chi^{2}(1)$$

 

이 때,

 

$$U = \sum^{n}_{i=1}\frac{(X_{i} - m)^{2}}{\sigma^{2}} ~ \chi^{2}(n)$$

 

에서 모평균 $m$가 표본평균 $\bar{X}$로 대체되면서 자유도 1이 상실된다.

 

 

#. $X_{1}, X_{2}, ..., X_{n}$이 $N(m, \sigma^{2})$ 분포로부터 추출한 크기 $n$의 확률표본이라고 할 때,

$$Z = \frac{\bar{X} - m}{\frac{\sigma}{\sqrt{n}}}, \ U = \frac{(n-1)S^{2}}{\sigma^{2}}$$

이라고 하면

 

$Z ~ N(0, 1)$이고, $U ~ \chi^{2}(n-1)$이며, $Z$와 $U$가 서로 독립이다.

 

이에 따라,

 

$$T = \frac{\frac{\bar{X}-m}{\frac{\sigma}{\sqrt{n}}}}{\frac{\sqrt{\frac{(n-1)S^{2}}{\sigma^{2}}}}{(n-1)}}$$

$$ = \frac{\bar{X} - m}{\frac{S}{\sqrt{n}}} ~ t(n-1)$$

 

Comments