NLP/AI/Statistics

[통계분석]변수 간 상관성: 상관분석 본문

Statistics/통계분석

[통계분석]변수 간 상관성: 상관분석

Danbi Cho 2020. 10. 13. 14:28

데이터 분석에서 데이터가 표현하는 변수(특징) 간 상관성은 주된 분석 방법으로 활용된다. 

 

데이터 내의 변수 간 상관성을 분석한다면, 양의 상관성을 보이는 변수들 간의 영향력과 음의 상관성을 보여주는 변수들 간의 영향력을 파악하기에 용이하다. 

 

상관성을 분석하기 위한 통계 분석 방법을 상관분석이라고 하며, 

 

대표적으로 피어슨 상관분석(pearson correlation)이 있다. 

 

예시1) 

 

연구문제: 학생들의 생활만족도와 건강만족도는 서로 상관이 있는가.

 

귀무가설: 학생들의 생활만족도와 건강만족도는 서로 상관이 없다.

대립가설: 학생들의 생활만족도와 건간만족도는 서로 상관이 있다. 

 

#. "상관이 있다"는 생활만족도와 건강만족도가 비례적, 혹은 반비례적 특성을 보인다는 것을 의미한다. 

 

조사도구: 객관식 설문(생활만족도와 건강만족도 - 5점척도)

 

예시2)

 

연구문제: 학생들의 키와 몸무게는 서로 상관이 있는가.

 

귀무가설: 학생들의 키와 몸무게는 서로 상관이 없다. 

대립가설: 학생들의 키와 몸무게는 서로 상관이 있다.

 

조사도구: 주관식 설문(키, 몸무게)

 

위의 두 가지 예시와 같이, 변수 간의 상관성을 분석하기 위한 통계분석 방법론으로 상관분석을 사용한다. 

Comments