NLP/AI/Statistics

[통계분석]통계분석 방법론3 - 집단이 3개 이상인 경우 [분산 분석, 카이제곱 검정] 본문

Statistics/통계분석

[통계분석]통계분석 방법론3 - 집단이 3개 이상인 경우 [분산 분석, 카이제곱 검정]

Danbi Cho 2020. 10. 12. 21:46

앞에서 집단이 1개인 경우와 2개인 경우 사용되는 통계 분석 방법론에 대하여 설명했다.

 

3개 이상의 집단을 조사할 때 집단 간 차이가 나는지 검정하기 위해 다음과 같은 분석 방법론을 사용한다.

 

[일원배치 분산분석, 이원배치 분산분석, 반복측정 분산분석, 카이제곱 검정]

 

각각의 특성을 예시와 함께 비교해보고자 한다. 

 

일원배치 분산분석(One-way ANOVA)

 

예시1)

 

연구문제: 서울, 대전, 울산 지역의 모의고사 점수의 차이가 있는가.

 

귀무가설: 세 지역의 모의고사 점수는 같다.

대립가설: 세 지역 중 적어도 하나 이상의 지역에서 모의고사 점수 차이가 있다. 

 

#. 3개 이상의 집단을 비교할 때 대립가설은 "적어도 하나 이상의 ~에서 차이가 있는가"를 검정하는 것이다. 

   

조사도구: 객관식 설문(지역 선택) + 주관식 설문(모의고사 점수)

 

#. 만약 검정 결과, 적어도 하나 이상의 지역에서 차이가 난다는 결과가 나왔을 경우 어느 지역에서 차이가 나는지 확인해야 하며, 이를 "사후 검정" 이라고 한다. 

 

예시2)

 

연구문제: 서울, 대전, 울산 지역의 생활만족도의 차이가 있는가.

 

귀무가설: 세 지역의 생활만족도는 같다.

대립가설: 세 지역 중 하나 이상의 지역에서 생활만족도 차이가 있다.

 

조사도구: 객관식 설문(생활만족도 - 5점척도)

 

일원배치 분산분석은 위의 두 예시와 같이 하나의 변수(지역)에 따른 집단을 비교할 때 사용가능한 분석 방법이다.

 

이와 유사한 형태로, 이원배치 분산분석(Two-way ANOVA)두 개의 변수에 따른 집단을 비교할 때 사용된다. 

 

서로 다른 토양에서 성분이 다른 비료를 사용하였다고 가정할 때, 옥수수의 길이 차이를 검정할 경우 이 때 변수는 (토양, 비료) 두가지에 따라 분석된다.

 

이와 같이 집단 변수가 2개인 경우 이원배치 분산 분석을 통해 통계 분석을 진행한다. 

 

반복 측정 분산분석(Repeated Measure ANOVA)

 

반복 측정 분산분석은 측정된 자료가 시간의 흐름에 따라 측정된 상태에서 집단 간 차이를 검정하는 방법이다.

 

예를 들어, 실험군과 대조군에 대하여 실험 대상자를 구분하고 몸무게의 변화를 일주일 간격으로 5회 측정하였다고 가정할 때, 5회 측정한 실험 결과에서 실험군과 대조군의 차이가 있는지 검정한다. 

 

#. 카이제곱 검정에 대하여는 이전 글에서 설명되었다. 

Comments