일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- review
- machinelearning
- code
- paper_review
- github
- json
- tab
- natural_language_processing
- gensim
- pip
- Ai
- cs224n
- linux
- seq2seq
- Vim
- Standford
- text
- install
- git
- computer
- computer_setting
- Stanford
- deeplearning
- cs231n
- Statistics
- error
- language_model
- nlp
- slideshare
- terminal
- Today
- Total
NLP/AI/Statistics
[수리통계]Chap.5 확률변수의 분포3 본문
이전 글 (확률변수의 분포1, 확률변수의 분포2)에서 확률변수에 따른 분포 특성에 대해 설명하였다.
이번 글에서는 아래의 목차에 대하여 설명할 예정이다.
5.6) 중심극한정리
5.7) 이산형 분포의 근사(이항 분포)
5.8) 체비셰프 부등식과 확률수렴(체비셰프 부등식, 대수의 법칙)
5.6) 중심극한정리
중심극한정리는 통계에서 가장 자주 언급되는 특징이라고 할 수 있다.
우선, 평균 m, 분산 σ2을 갖는 분포(꼭 정규분포가 아니어도 된다.)에서 추출한 크기 n인 확률 표본의 평균 ˉX는 E(ˉX)=m,Var(ˉX)=σ2n이다.
확률표본이 N(m,σ2)에서 추출되었을 때, ˉX N(m,σ2n)이 된다.
정규분포가 아닌 평균 m, 분산 σ2를 갖는 임의의 분포에서 뽑은
크기가 n인 확률표본의 평균 ˉX에 대하여 아래와 같이 정의할 수 있다.
W=√nσ(ˉX−m)=ˉX−mσ√n
이 때 양의 정수 n에 대하여 평균과 분산은 아래와 같이 추출된다.
E(ˉX−mσ√n)=E(ˉX)−mσ√n=0
E(W)=0
Var(ˉX−mσ√n)=Var(ˉX)σ2n=1
Var(W)=1
ˉX는 유한의 평균 m와 유한의 양의 분산 σ2을 갖는 분포에서 추출한 크기가 n인 확률표본 X1,X2,...,Xn의 평균이라 하면,
W=ˉX−mσ√n=∑ni=1Xi−nm√nσ
W의 분포는 n→∞일 때, 근사적으로 N(0,1)이 된다.
이러한 정의를 중심극한정리(central limit theorem; CLT)라고 한다.
5.7) 이산형 분포의 근사
아래는 이항분포의 근사에 대하여 설명한다.
X1,X2,...,Xn은 평균이 m=p, 분산이 σ2=p(1−p), 0<p<1인 베르누이 분포에서 뽑은 확률표본이라고 할 때, Y=∑ni=1Xi는 이항분포 b(n,p)가 된다.
#. Yn=ˉX=ˆP
이 때,
W=Y−np√np(1−p)=ˉX−p√p(1−p)n
W의 분포는 n→∞에 따라 근사적으로 N(0,1)이다.
즉,
Y의 분포는 n이 충분히 크면 근사적으로 N(np,np(1−p))이고
"n이 충분히 크가"의 기준은 np≥5,n(1−p)≥5이다.
예제1)
"Y b(10,12)일 때, 정규근사를 이용하여 P(3≤Y<6)을 구하면?"
이항분포에서는 P(3≤Y<6)=P(3)+P(4)+P(5)이다.
이를 정규근사로 표현하면, Y≈N(5,52)이다.
P(3≤Y<6)≈P(2.5−5√52≤Z<5.5−5√52)
=ϕ(0.316)−ϕ(−1.581)=0.5670
5.8) 체비셰프 부등식과 확률수렴
체비셰프 부등식(Chebyshev's inequality)은 다음을 정의한다.
만약 확률변수 X의 평균이 m이고 분산이 σ2이라면, 모든 k≥1에 대하여
P(|X−m|≥kσ)≤1k2
P(|X−m|<kσ)≥1−1k2
이에 따라,
ϵ=kσ이면
P(|X−m|≥ϵ)≤σ2ϵ2
이 때 X가 평균으로부터 최소한 k배 표준편차만큼 떨어져 있을 확률은 1k1이고
X가 평균으로부터 k배 표준편차 안쪽에 떨어질 확률이 적어도 1−1k2이다.
예제1)
"X의 평균이 25이고 분산이 16이라면, P(17<X<33)의 하한은?"
#. m=25,σ=4
P(17<X<33)=P(|X−25|<8)=P(|X−25|<2σ)≥1−14=0.75
아래는 대수의 법칙(law of large number; LLN)에 대한 설명이다.
성공확률이 p인 베르누이 시행을 n번 시행했을 때,
성공의 횟수를 Y라 하면, Y b(n,p)이다.
이 때, Yn은 상대도수이며 p의 추정치는 ˆp 의미한다.
즉, Yn의 평균은 p, 표준편차는 √pqn
Yn이 p에 얼마나 가까운지는 체비셰프 부등식에 의해
p(|Yn−p|<ϵ)≥1−pqnϵ2≥1−14nϵ2
고정된 ϵ>0과 0<p<1에 대하여
limn→∞P(|ˉX−m|<ϵ)=1
이 때,
n이 충분히 클 때, 상대도수 Yn가 p로부터 ϵ이내에 있을 확률이 1에 매우 가까우며
Yn가 p에 확률수렴(convergence in probability)함을 나타낸다.
이러한 성질을 대수의 법칙(law of large number)이라고 한다.
'Statistics > 수리통계' 카테고리의 다른 글
[수리통계] Chap.6 점추정2 (0) | 2020.12.02 |
---|---|
[수리통계] Chap.6 점추정1 (0) | 2020.11.27 |
[수리통계]Chap.5 확률변수의 분포2 (0) | 2020.11.19 |
[수리통계]Chap.5 확률변수의 분포1 (0) | 2020.11.16 |
[수리통계]Chap.4 이변량 분포 2(조건부 분포) (0) | 2020.11.12 |