일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Stanford
- github
- code
- install
- computer_setting
- Vim
- slideshare
- deeplearning
- cs224n
- nlp
- computer
- terminal
- text
- review
- tab
- Statistics
- pip
- seq2seq
- cs231n
- error
- json
- gensim
- Ai
- machinelearning
- natural_language_processing
- paper_review
- language_model
- linux
- Standford
- git
- Today
- Total
NLP/AI/Statistics
[수리통계]Chap.5 확률변수의 분포1 본문
Chap.5에서는 확률변수의 분포에 대하여 설명한다.
5.1) 한 확률변수의 분포(분포함수기법, 변수변환기법 등)
5.2) 두 확률변수의 변환
5.3) 여러확률변수
5.4) 적률생성함수기법
5.5) 정규분포와 관련된 확률함수(스튜던트 t 분포)
5.6) 중심극한정리
5.7) 이산형 분포의 근사(이항 분포, 포아송 분포)
5.8) 체비셰프 부등식과 확률수렴(체비셰프 부등식, 대수의 법칙)
목차는 위와 같으며, Chap.5에서는 많은 내용을 담고 있기 때문에 설명에 따라 나누어 설명할 예정이다.
이미 앞서 언급했던 내용도 포함하기 때문에 전체적으로 내용을 훑어보며 구체적인 분포의 성질을 정리한다.
5.1) 한 확률변수의 분포
연속형 확률변수 X에 대하여 Y=u(X)도 확률변수이기 때문에 이에 대한 확률분포를 가진다.
즉, Y에 대한 확률분포는 아래와 같다.
G(y)=P(Y≤y)=P[u(X)≤y]
이 때 pdf는 g(y)=G′(y)이다.
하나의 확률변수의 분포를 나타내는 기법으로 분포 함수 기법(distribution function technique)가 있다.
G(y)를 구한 후 pdf인 g(y)=G′(y)를 활용하는 방법을 의미한다.
예제)
"확률변수 X가 f(x)=3x2, 0<x<1를 가진다고 할 때,
Y=X2의 pdf는?"
Y가 확률 변수 X의 증가함수고 0<y<1이기 때문에 Y의 cdf는 다음과 같다.
G(y)=P(Y≤y)=P(X2<y)=P(X<y12)=F(y12)
=∫y1203t2dt=y32, 0<y<1
#. 이 때 G(y)는 y의 cdf, F(x)는 x의 cdf이다.
이에 따라 Y의 pdf는 다음과 같다.
g(y)=32y12, 0<y<1
분포 함수 기법 이외에 변수 변환 기법(change of variable technique)을 활용하여 확률 변수의 분포를 표현할 수 있다.
X를 공간 c1<x<c2 에서 pdf f(x)를 갖는 연속형 확률변수라고 할 때,
X의 연속인 증가함수 혹은 감소함수인 Y=u(X) 의 역함수를 X=u(Y)라고 하면
X의 공간은 Y의 공간 d1=u(c1)<y<d2=u(c2)로 매핑된다.
이 때 Y의 pdf는 다음과 같다.
1) u(x)가 증가함수 일 때,
G(y)=P(Y≤y)=P(u(X)≤y)
=P(X≤u−1(y))
=∫u−1(y)c1f(x)dx
이 때, u−1(y)=v(y)
g(y)=f(v(y))∗v′(y)
2) u(x)가 감소함수 일 때,
G(y)=P(Y≤y)=P(u(X)≤y)
=P(X≥u−1(y))
=∫c2v(y)f(x)dx
이 때, X≤c=y≥u(c)
g(y)=f(v(y))[−v′(y)]
예제)
y=u(x)=x2,x=v(y)=y12
v′(y)=12y−12
g(y)=3y12y−12=32y12
이산형 확률변수의 변수변환기법은 다음과 같다.
이산형 확률변수의 pmf는 f(x)=P(X=x),x∈SX이다.
공간 SX의 원소들이 가산(countable)의 점들인 c1,c2,...로 구성되었을 때,
Y=u(X)는 역함수 X=u(Y)와 1대 1 변환 관계에 있다고 한다.
즉, SY=d1=u(c1),d2=u(c2),...
g(y)=P(Y=y)=P[u(X)=y]=P([X=v(y)]=f(v(y)),y∈SY
1대 1 변환 관계를 갖기 때문에 도함수 |v′(y)|가 필요하지 않다.
예제)
"확률변수 X가 λ=4인 포아송 분포를 나타낼 때, Y=√(X)의 pmf는?"
f(x)=λxe−λx!, x=0,1,2,...
x=y2
g(y)=f(y2)=4y2e−4y2!, y=0,1,√2,√3,...
5.2) 두 확률변수의 변환
한 개의 변수에 대하여 변수변환 기법을 통해 하나의 역함수를 표현하였다.
두 개의 확률변수의 변환에서는 자코비안(Jacobian)을 이용하여 변수변환 기법을 표현한다.
즉, X1,X2가 결함 pdf f(x1,x2)를 갖는 두 개의 연속형 확률변수이고
Y1=u1(X1,X2),Y2=u2(X1,X2)가 하나의 역함수
X1=v1(Y1,Y2),X2=v2(Y1,Y2)를 가지면
Y1,Y2의 결합 pdf는 다음과 같다.
g(y1,y2)=|J|f[v1(y1,y2),v2(y1,y2)], (y1,y2)∈SY
이 때, 자코비안(Jacobian)은 다음의 행렬식으로 정의된다.
J=[∂x1∂y1∂x1∂y2∂x2∂y1∂x2∂y2]
예제)
"확률 변수 X1,X2가 결합 pdf일 때,
f(x1,x2)=2, 0<x1<x2<1
를 갖는다고 하면,
변환 Y1=X1X2,Y2=X2의 결합 pdf g(y_{1}, y_{2})$와 주변 pdf는?"
x1=y1y2,x2=y2와 같으므로,
J=[y2y101]
=y2
위의 자코비안에 따라 pdf는
g(y1,y2)=2y2
이 때, 0<y1y2<y2<1, 0<y1<1, 0<y2<1이다.
5.3) 여러 확률변수
독립인 확률 변수 X1,X2의 pmf가 같고 결합 pmf는 f(x1)f(x2)일 때,
두 확률 변수 X1,X2의 모임을 n=2 크기의 확률표본이라고 한다.
이처럼 x1,x2,...xn이 독립이고 분포가 같은 것을 (independent & identically dist, iid)라고 한다.
#. 이 때 x1,x2,...,xn은 공통된 분포로부터 크기가 n인 확률표본이다.
예제)
"X1,X2는 균형된 정육면체 주사위를 두 번 던져서 나온 결과를 나타내는 서로 독립인 확률변수이다.
이는 공간 {1, 2, 3, 4, 5, 6}에서 균일 분포를 갖는 n=2의 확률 표본이기 때문에 아래의 확률분포와 같다."
f(x)=16, x=1,2,3,4,5,6
E(X1)=E(X2)=6∑x=1xf(x)dx=3.5
Var(X1)=Var(X2)=6∑x=1(x−3.5)2f(x)=3512
E(X1X2)=E(X1)E(X2)12.25
E[(X1−3.5)(X2−3.5)]=0
#. Cov(X1,X2)=E(X1X2)−E(X1)E(X2)
위의 값에 따라, 만약 Y=X1+X2이면
E(Y)=E(X1+X2)=E(X1)+E(X2)=7
Var(Y)=Var(X1+X2)=E((X1+X2−7)2)
=E[[(X1−3.5)+(X2−3.5)]2]
=E[(X1−3.5)2]+E[(X2−3.5)2]+E[2(X1−3.5)(X2−3.5)]
=3512+3512+0
즉, 여러 확률 변수 X1,X2,...,Xn가 서로 독립인 확률변수들이고
각각 E(ui(Xi)), i=1,2,...,n이 존재하고 Y=u1(X1)u2(X2)...un(Xn)이면 E(Y)는 다음과 같다.
E(Y)=E[u1(X1)]E[u2(X2)]...E[un(Xn)]
#. E(X2)≠E(X)2를 의미하는 것은 아니며, 모든 확률변수들끼리 독립이어야한다.
#. E(XX)≠E(X)E(X)
X1,X2,...,Xn이 각각 평균 m1,m2,...,mn과
분산 σ21,σ22,...,σ2n을 갖는 n개의 서로 독립인 확률변수일 때,
a1,a2,...,an이 실수인 상수들이면, Y=∑ni=1aiXi의 평균과 분산은 다음과 같다.
mY=n∑i=1aimi
σ2Y=n∑i=1a2iσ2i
이 때,
Xi,Xj가 상관관계가 있는 경우: ρij
σ2Y=n∑i=1a2iσ2i+2∑i<j∑aiajρijσiσj
'Statistics > 수리통계' 카테고리의 다른 글
[수리통계]Chap.5 확률변수의 분포3 (0) | 2020.11.25 |
---|---|
[수리통계]Chap.5 확률변수의 분포2 (0) | 2020.11.19 |
[수리통계]Chap.4 이변량 분포 2(조건부 분포) (0) | 2020.11.12 |
[수리통계]Chap.4 이변량 분포 1(상관계수) (0) | 2020.11.05 |
[수리통계]Chap.3 연속형 확률분포 (0) | 2020.10.26 |