NLP/AI/Statistics

[통계분석]신뢰도 분석 본문

Statistics/통계분석

[통계분석]신뢰도 분석

Danbi Cho 2020. 10. 15. 20:19

통계 분석을 진행하기 이전에, 데이터를 수집하기 위해 실행하는 조사도구에 대한 신뢰성이 보장되어야한다. 

 

이 때 통계 분석을 위한 조사도구에 대한 응답이 신뢰할 수 있는지를 검정하는 것을 신뢰도 분석 이라고 한다. 

 

신뢰도 분석은 주로 5점 척도를 이용하여 점수화시킨다. 

 

대부분의 5점 척도는 ('매우 아니다', '아니다', '보통이다', '그렇다', '매우 그렇다') 와 같이 이루어지는데,

 

이 때 무조건적으로 '매우 그렇다'를 5점으로 취급하지 않는다.

 

문항을 의도적으로 역질문하여 '매우 그렇다'이지만 사실 상 '매우 아니다'를 의미하는 문항을 넣을 수 있다.

 

이를 '역문항'이라고 하며, 응답자가 성실하게 답하였는가를 판단하기 위해 사용된다. 

 

하나의 요인에 대하여 여러 가지 문항에 대한 설문을 진행한 후, 해당 값들을 평균하면 그 값이 요인에 대한 조사 결과가 된다. 

 

설문을 진행한 경우, 동일한 사람에게 여러 번 실행하였을 때 유사한 결과가 나오거나 여러 명의 평가 결과가 유사하게 나올 경우 신뢰할만하다고 한다. 

 

이러한 결과로 '응답자가 내적 일치가 어느정도 이루었는가'를 분석하는 것이 신뢰도 분석이며

크롬바하 알파(Cronbach' alpha)계수를 사용하여 응답자의 성실도가 높은지 판단한다.

 

- 척도화란?

 

척도화는 자신이 알고자 하는 것을 측정단위를 주어 체계를 갖추도록 하는 것이다. 

 

이는 분석하고자 하는 결과를 점수화시키기 위한 것으로 thurstone, guttman, likert 척도법이 존재한다.

 

Thurstone 척도법: 문항을 중심으로 한 접근방법

Guttman 척도법: 반응을 중심으로 한 접근방법

Likert 척도법: 응답자를 중심으로 한 접근방법

 

- 크롬바하 알파계수

 

신뢰도 분석은 크롬바하 알파계수에 의해 평가된다.

 

우선, 신뢰도는 다음과 같이 계산된다. $$신뢰도 = 참값 / (참값+거짓값)$$

 

신뢰도는 0과 1사이의 값으로, 거짓값(오차)이 0인 경우 신뢰도는 1이되며 거짓값이 클수록 신뢰도는 0에 가까운 값을 갖는다.

 

신뢰도 분석에서는 동일한 사람에게 여러 번 조사를 실시하였을 때 동일한 결과값이 나오는지에 대한 신뢰성 또한 중요한다.

 

이를 위해 문항 수만큼 조사하였다고 가정하여 신뢰도를 분석하여 동일한 검사를 반복 시행하였을 때 개인의 점수가 일관성 있게 나타나는 정도를 파악해야 한다. 

 

즉, 5개의 문항을 5번 조사한 것과 같다.

 

이를 문항내적합치도(inter-item consistency reliability)라고 한다.

 

이를 위한 크롬바하 알파계수는 다음과 같으며 1에 가까울수록 높은 신뢰도를 의미한다.

 

$$\frac{N}{(N-1)} [1-\frac{\sum var(X_{i})} {var(\sum X_{i})}]$$

 

이 때, $N$은 문항 수이며 $X_{i}$는 1부터 $N$까지의 문항 점수를 의미한다.

 

위와 같이 분산의 비율로 크롬바하 알파계수를 산출할 수 있으며 해당 값이 0.6 이상인 경우 신뢰할 수 있다고 판단한다.

 

크롬바하 알파계수의 특징은 문항 수가 커질수록 신뢰도가 높게 나타나는 것이다. 

 

이 때문에 적절한 문항 수를 사용하여 조사도구로 사용하는 것 또한 중요하다.

 

 

 

Comments