NLP/AI/Statistics

[수리통계]Chap.5 확률변수의 분포3 본문

Statistics/수리통계

[수리통계]Chap.5 확률변수의 분포3

Danbi Cho 2020. 11. 25. 16:26

이전 글 (확률변수의 분포1,  확률변수의 분포2)에서 확률변수에 따른 분포 특성에 대해 설명하였다.

 

이번 글에서는 아래의 목차에 대하여 설명할 예정이다.

 

5.6) 중심극한정리

5.7) 이산형 분포의 근사(이항 분포)

5.8) 체비셰프 부등식과 확률수렴(체비셰프 부등식, 대수의 법칙)

 

5.6) 중심극한정리

 

중심극한정리는 통계에서 가장 자주 언급되는 특징이라고 할 수 있다.

 

우선, 평균 m, 분산 σ2을 갖는 분포(꼭 정규분포가 아니어도 된다.)에서 추출한 크기 n인 확률 표본의 평균 ˉXE(ˉX)=m,Var(ˉX)=σ2n이다. 

 

확률표본이 N(m,σ2)에서 추출되었을 때, ˉX N(m,σ2n)이 된다.

 

정규분포가 아닌 평균 m, 분산 σ2를 갖는 임의의 분포에서 뽑은

크기가 n인 확률표본의 평균 ˉX에 대하여 아래와 같이 정의할 수 있다.

 

W=nσ(ˉXm)=ˉXmσn

 

이 때 양의 정수 n에 대하여 평균과 분산은 아래와 같이 추출된다.

 

E(ˉXmσn)=E(ˉX)mσn=0

E(W)=0

 

Var(ˉXmσn)=Var(ˉX)σ2n=1

Var(W)=1

 

ˉX는 유한의 평균 m와 유한의 양의 분산 σ2을 갖는 분포에서 추출한 크기가 n인 확률표본 X1,X2,...,Xn의 평균이라 하면,

 

W=ˉXmσn=ni=1Xinmnσ

 

W의 분포는 n일 때, 근사적으로 N(0,1)이 된다.

 

이러한 정의를 중심극한정리(central limit theorem; CLT)라고 한다. 

 

5.7) 이산형 분포의 근사

 

아래는 이항분포의 근사에 대하여 설명한다. 

 

X1,X2,...,Xn은 평균이 m=p, 분산이 σ2=p(1p), 0<p<1인 베르누이 분포에서 뽑은 확률표본이라고 할 때, Y=ni=1Xi는 이항분포 b(n,p)가 된다. 

#. Yn=ˉX=ˆP

 

이 때, 

W=Ynpnp(1p)=ˉXpp(1p)n

 

W의 분포는 n에 따라 근사적으로 N(0,1)이다.

 

즉, 

 

Y의 분포는 n이 충분히 크면 근사적으로 N(np,np(1p))이고

"n이 충분히 크가"의 기준은 np5,n(1p)5이다.

 

예제1)

 

"Y b(10,12)일 때, 정규근사를 이용하여 P(3Y<6)을 구하면?"

 

이항분포에서는 P(3Y<6)=P(3)+P(4)+P(5)이다. 

 

이를 정규근사로 표현하면, YN(5,52)이다.

P(3Y<6)P(2.5552Z<5.5552)

=ϕ(0.316)ϕ(1.581)=0.5670

 

5.8) 체비셰프 부등식과 확률수렴

 

체비셰프 부등식(Chebyshev's inequality)은 다음을 정의한다.

 

만약 확률변수 X의 평균이 m이고 분산이 σ2이라면, 모든 k1에 대하여

P(|Xm|kσ)1k2

P(|Xm|<kσ)11k2

 

이에 따라,

 

ϵ=kσ이면

P(|Xm|ϵ)σ2ϵ2

 

이 때 X가 평균으로부터 최소한 k배 표준편차만큼 떨어져 있을 확률은 1k1이고

X가 평균으로부터 k배 표준편차 안쪽에 떨어질 확률이 적어도 11k2이다.

 

예제1)

 

"X의 평균이 25이고 분산이 16이라면, P(17<X<33)의 하한은?"

#. m=25,σ=4

 

P(17<X<33)=P(|X25|<8)=P(|X25|<2σ)114=0.75

 

아래는 대수의 법칙(law of large number; LLN)에 대한 설명이다.

 

성공확률이 p인 베르누이 시행을 n번 시행했을 때, 

 

성공의 횟수를 Y라 하면, Y b(n,p)이다.

 

이 때, Yn은 상대도수이며 p의 추정치는 ˆp 의미한다.

 

즉, Yn의 평균은 p, 표준편차는 pqn

 

Ynp에 얼마나 가까운지는 체비셰프 부등식에 의해

 

p(|Ynp|<ϵ)1pqnϵ2114nϵ2

 

고정된 ϵ>00<p<1에 대하여

 

limnP(|ˉXm|<ϵ)=1

 

이 때, 

 

n이 충분히 클 때, 상대도수 Ynp로부터 ϵ이내에 있을 확률이 1에 매우 가까우며

 

Ynp에 확률수렴(convergence in probability)함을 나타낸다.

 

이러한 성질을 대수의 법칙(law of large number)이라고 한다.

Comments