본문 바로가기
데이터분석/Statistics

[기초통계] ANOVA Test 총정리

by _Bree_ 2023. 8. 24.
반응형

 

ANOVA TEST 총정리

 

 

ANOVA TEST란?

t-test는 두 집단 간의 평균의 비교 혹은 두 집단 간의 차이가 있는지 비교하는 검정이었다. 그러나 3집단 이상의 집단 비교에는 쓰일 수 없었다. 이 처럼 3집단 이상의 비교를 위해 사용하는 것이 ANOVA 이다.

독립변수는 명목형, 종속변수는 수치형인 경우 사용 가능

 

ANOVA TEST 종류 

 

1 ) One way ANOVA TEST 

하나의 독립변수를 이용하여 집단 간의 차이를 비교. 이때 독립변수는 반드시 하나여야 하며,
해당 독립변수 내부에 레벨이 여러 개가 있는 경우에 사용.
예시) 
Titanic 데이터에서 sex 변수(male, female 두 개의 레벨 존재) 가 평균 fare에 차이가 있는지 검정

 

  • 귀무가설(H0) : k개의 집단 간 모평균에는 차이가 없다. 즉, 같다고 할 수 있다.
  • 대립가설(H1) : k개의 집단 간 모평균이 모두 같다고 할 수 없다.

 

1-2) 사후 검정

사후검정이란 분산분석의 결과 귀무가설이 기각되어 적어도 한 집단에서 평균의 차이가 있음이 통계적으로 증명되었을 경우 실시하게 되는 검정.

 

Python에서의 One way ANOVA TEST 순서

One way ANOVA TEST

 

 

2) Two way ANOVA TEST 

분산분석에서 반응값에 대해 두 개의 범주형 변수 A,B의 영향을 알아보기 위해 사용되는 검증 방법.
예시)
성별(male, female)과 학년(1,2,3)에 따른 시험 점수의 차이가 있는지 검정.

성별 , 학년 : 명목형 
시험점수 : 수치형

 

  • 귀무가설(H0) : 3개
    • 1) a와 b변수의 상호작용 효과 (교호작용, interaction)가 없다.
    • 2) a변수에 따른 종속변수의 값에는 차이가 없다.
    • 3) b변수에 따른 종속변수의 값에는 차이가 없다.
  • 대립가설(H1) : 3개
    • 1) a와 b변수의 상호작용 효과 (교호작용, interaction)가 있다. 
    • 2) a변수에 따른 종속변수의 값에는 차이가 있다.
    • 3) b변수에 따른 종속변수의 값에는 차이가 있다.

 

2-1) 주효과와 교호작용 효과

  • 이원배치 분산분석에서는 두 개의 독립변수값에 따르는 데이터의 주효과와 상호작용효과에 대한 검정을 수행.
  • 주효과란 각각의 독립변수가 종속변수에 미치는 효과를 의미하며, 이를 검정하는 것을 주효과 검정.
  • 교호작용효과는 여러 독립변수들의 조합이 종속변수에 주는 영향을 의미.
    • 즉 교호작용효과 검정은 한 독립변수가 종속변수에 미치는 영향이 다른 독립변수의 수준에 따라서 달라지는 지를 분석하는 것.
    • 두 독립변수 A,B 사이에 상관관계가 존재할 경우, 교호작용이 있다는 의미이다. 교호작용이 없을 경우, 주효과 검정을 진행한다. 반면 교호작용이 있을 경우에는 검정이 무의미하다.
반응형

댓글