일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- github
- install
- paper_review
- natural_language_processing
- cs224n
- Ai
- linux
- deeplearning
- terminal
- Standford
- Statistics
- computer
- git
- pip
- Stanford
- review
- json
- code
- Vim
- tab
- error
- cs231n
- gensim
- slideshare
- language_model
- computer_setting
- seq2seq
- machinelearning
- text
- nlp
- Today
- Total
NLP/AI/Statistics
[수리통계]Chap.5 확률변수의 분포2 본문
지난 글에서 확률변수의 개수에 따른 분포와 변환방법에 대하여 설명하였다.
이번 글에서는 아래의 목차에 대하여 설명할 예정이다.
5.4) 적률생성함수기법
5.5) 정규분포와 관련된 확률함수
오늘 설명할 5.4) 적률생성함수기법 은 이전 글 중 이산형 확률분포1 에서도 언급하기 때문에 참고해도 좋을 것 같다.
5.4) 적률생성함수기법
$Y = u(X_{1}, X_{2}, ..., X_{n})$에 대하여 $Y$의 적률생성함수는 $E[e^{tu(X_{1}, X_{2}, ..., X_{n})}]$으로 계산된다.
예제1)
"확률변수 $X_{1}, X_{2}$를 서로 독립이고 공간 {1,2,3,4} 위에서 균일분포를 갖는다고 할 때,
$Y = X_{1}+X_{2}$에 대한 $Y$의 mgf는?"
$$M_{Y}(t) = E(e^{tY} = E(e^{t(X_{1}+X_{2})})$$
$$= E(e^{tX_{1}}e^{tX_{2}}) = E(e^{tX_{1}})E(e^{tX_{2}})$$
$$M_{X}(t) = E(e^{tX}) = e^{t}\frac{1}{4} + e^{2t}\frac{1}{4} +e^{3t}\frac{1}{4} +e^{4t}\frac{1}{4} $$
$$M_{Y}(t) = (M_{X}(t))^{2}$$
$$ = [e^{t}\frac{1}{4} + e^{2t}\frac{1}{4} +e^{3t}\frac{1}{4} +e^{4t}\frac{1}{4}]^{2}$$
즉, 위의 예시와 함께 적률생성함수를 정리하면
$X_{1}, X_{2}, ..., X_{n}$가 각각 적률생성함수
$M_{X_{i}}(t),\ h_{i} < t < h_{i},\ h_{i} > 0,\ i = 1, 2, ..., n$를 갖는 서로 독립인 확률변수라고 할 때,
$Y = \sum^{n}_{i=1}a_{i}X_{i}$의 적률생성함수는 다음과 같다.
$$M_Y{t} = E(e^{t\sum_{i}a_{i}X_{i}}) = E(\prod^{n}_{i=1}e^{ta_{i}X_{i}})$$
$$ = \prod^{n}_{i=1}E(e^{ta_{i}X_{i}})$$
$$ = \prod^{n}_{i=1}M_{X_{i}}(a_{i}t)$$
추가적인 특성으로는,
$X_{1}, X_{2}, ..., X_{n}$가 각각 적률생성함수 $M(t), \ -h < t < h,$를 갖는 분포에서
추출한 확률표본이라고 할 때,
a) $Y = \sum^{n}_{i=1}X_{i}$의 적률생성함수는
$$M_{Y}(t) = \prod^{n}_{i=1}M(t) = [M(t)]^{n}, \ -h < t < h$$
b) $\bar{X} = \frac{1}{n}\sum^{n}_{i=1}X_{i}$의 적률생성함수는
$$M_{\bar{X}}(t) = \prod^{n}_{i=1}M(\frac{t}{n}) = [M(\frac{t}{n})]^{n}, \ -h < \frac{t}{n} < h$$
5.5) 정규분포와 관련된 확률함수
$X_{1}, X_{2}, ..., X_{n}$가 각각 평균 $m_{1}, m_{2}, ..., m_{n}$과 분산 $\sigma^{2}_{1}, \sigma^{2}_{2}, ..., \sigma^{2}_{n}$을 갖는 서로 독립인 정규 확률변수라고 할 때,
선형함수 $Y = \sum^{n}_{i=1} c_{i}X_{i}$는 아래와 같이 정규분포를 갖는다.
$$ N(\sum^{n}_{i=1}c_{i}m_{i}, \sum^{n}_{i=1} c^{2}_{i}\sigma^{2}_{i})$$
#. $c_{i}$는 상수이다.
$X_{1}, X_{2}, ..., X_{n}$이 정규분포 $N(m, \sigma^{2})$에서 추출한 크기가 $n$인 확률표본이라고 할때,
표본평균 $\bar{X}$의 분포는 $N(m, \frac{\sigma^{2}}{n})$을 갖는다.
$$\bar{X} = \sum c_{i}X_{i}, \ \ c_{i} = \frac{1}{n}$$
$$m_{\bar{X}} = \sum \frac{1}{n} m = m$$
$$\sigma^{2}_{\bar{X}} = \sum \frac{1}{n^{2}} \sigma^{2} = \frac{\sigma^{2}}{n}$$
예제1)
"$X_{1}, X_{2}, ..., X_{n}$은 $N(50, 16)$ 분포로부터 추출한 확률표본이다."
(1) 표본평균 $\bar{X}$의 분포는?
$$\bar{X} ~ N (50, \frac{16}{n})$$
(2) $n = 64$일 때, $P(49 < X < 51)$는?
$$P(\frac{49-50}{4} < Z < \frac{51-50}{4})$$
$$ = P(-0.25 < Z< 0.25)$$
(3) $n = 64$일 때, $P(49 < \bar{X} < 51)$는?
$$\bar{X} ~ N(50, (\frac{1}{2})^{2})$$
#. $\frac{16}{64} = \frac{1}{4} = (\frac{1}{2})^{2}$
$$P(\frac{49-50}{\frac{1}{2}} < Z < \frac{51-50}{\frac{1}{2}})$$
$$ = P(-2 < Z < 2)$$
$X_{1}, X_{2}, ..., X_{n}$는 정규분포 $N(m, \sigma^{2})$에서 추출한 크기가 $n$인 확률표본이다.
$\bar{X} = \frac{1}{n}\sum^{n}_{i=1}X_{i}$는 표본평균이고
$S^{2} = \frac{1}{n-1}\sum^{n}_{i=1}(X_{i} - \bar{X})^{2}$는 표본분산이라고 하면 아래의 특징이 성립한다.
(a) $\bar{X}$와 $S^{2}$은 독립이다.
(b) $\frac{(n-1)S^{2}}{\sigma^{2}}$는 $\chi^{2}(n-1)$를 갖는다.
#. $\frac{(n-1)S^{2}}{\sigma^{2}} = \frac{\sum(X_{i} - \bar{X})^{2}}{\sigma^{2}}$
즉,
$$\bar{X}~N(m, \frac{\sigma^{2}}{n})$$
$$\frac{\bar{X} - m}{\frac{\sigma}{\sqrt{n}}}~N(0, 1)$$
$$(\frac{\bar{X} - m}{\frac{\sigma}{\sqrt{n}}})^{2} ~ \chi^{2}(1)$$
이 때,
$$U = \sum^{n}_{i=1}\frac{(X_{i} - m)^{2}}{\sigma^{2}} ~ \chi^{2}(n)$$
에서 모평균 $m$가 표본평균 $\bar{X}$로 대체되면서 자유도 1이 상실된다.
#. $X_{1}, X_{2}, ..., X_{n}$이 $N(m, \sigma^{2})$ 분포로부터 추출한 크기 $n$의 확률표본이라고 할 때,
$$Z = \frac{\bar{X} - m}{\frac{\sigma}{\sqrt{n}}}, \ U = \frac{(n-1)S^{2}}{\sigma^{2}}$$
이라고 하면
$Z ~ N(0, 1)$이고, $U ~ \chi^{2}(n-1)$이며, $Z$와 $U$가 서로 독립이다.
이에 따라,
$$T = \frac{\frac{\bar{X}-m}{\frac{\sigma}{\sqrt{n}}}}{\frac{\sqrt{\frac{(n-1)S^{2}}{\sigma^{2}}}}{(n-1)}}$$
$$ = \frac{\bar{X} - m}{\frac{S}{\sqrt{n}}} ~ t(n-1)$$
'Statistics > 수리통계' 카테고리의 다른 글
[수리통계] Chap.6 점추정1 (0) | 2020.11.27 |
---|---|
[수리통계]Chap.5 확률변수의 분포3 (0) | 2020.11.25 |
[수리통계]Chap.5 확률변수의 분포1 (0) | 2020.11.16 |
[수리통계]Chap.4 이변량 분포 2(조건부 분포) (0) | 2020.11.12 |
[수리통계]Chap.4 이변량 분포 1(상관계수) (0) | 2020.11.05 |