본문 바로가기
데이터분석/Statistics

[기초통계] One-way ANOVA Test (1)

by _Bree_ 2023. 8. 14.
반응형

 

ANOVA Test (1)

 

우리는 이전 포스팅에서 2개의 그룹의 차이를 알아보기 위해 t-test가 필요한 이유와 진행 방법에 대해 알아보았다.

이전 포스팅 링크) https://2days.tistory.com/61

 

[기초통계] t-test(1)

t-test란? t-test ? 모집단의 표준편차가 알려지지 않았을 때, 정규분포의 모집단에서 모든 샘플(표본)의 평균값에 대한 가설검정 방법 t-test의 목적 두 개의 집단이 같은지 다른지 비교하기 위해 사

2days.tistory.com

 

 

만약 2개 그룹(남-여)이 아니라 3개 그룹(A 학원,B 학원,C 학원)의 집단 비교가 필요하다면 어떤 통계적 방법을 쓸 수 있을까?

3개 그룹

 

 

우리는 이미 이전에 t-test를 한 번 배웠으니, 아래와 같이 총 3번의 t-test를 진행하면 되지 않을까?

(a와 b t-test, b와 c t-test, a와 c t-test)

 

multiple t-test

 

만약 위의 방법대로 진행한다면 몇 개의 집단이든 더 이상 새로운 통계 분석 기법을 배울 필요가 없을 것이다.  
3개든 4개든 수백개의 그룹에 대해 하나씩 다 t-test 하면되니까!

그런데 과연 위의 방법대로 진행하는 것이 올바른 통계 분석 방법일까?

.

.

.

 

정답은 "안 된다"이다!

왜 이 방법을 쓰면 안될까?

 

왜 안될까?

 

 

만약 위의 방법대로 그룹이 3개일 때 t-test를 세번 하게 된다면, 우리는 "1종 오류"를 범하게 된다.

 

통계적 오류

 

 

🙄생각해보자

 

우리는 5% p-value를 기준으로 세번의 t-test를 했다. 
그리고 이 세 번의 t-test 결과를 바탕으로 결론을 내릴 것이다. 


그런데 문제는, 우리가 3번의 ttest를 할 동안 0.05의 p-value를 3번 적용했기 때문에 결국에는 a보단 b, b보단 c가 더 크다라는 결론을 내리기 까지 동원된 p-value는 0.05 + 0.05 + 0.05 , 총 0.15(15%)가 된다.


따라서 우리는 0.05라고 생각했지만 실제로는 0.15가 적용 됨으로써 심각한 1종 오류가 발생하는 것이다. 

 

 

 

결론적으로, 그룹이 3개일 때 t-test를 여러번 함으로서 어떤 통계적 결과를 내는 것은 사용 불가하다.

따라서 우리는 새로운 방법을 배워야하는데, 그 새로운 통계 방법이 One-way ANOVA test이다.

 

반응형

댓글