본문 바로가기
데이터분석/Statistics

[기초통계] One-way ANOVA Test 공식 설명

by _Bree_ 2023. 8. 14.
반응형

 

One-way ANOVA Test 공식 설명

 

One-way ANOVA Test 공식

 

식을 하나씩 살펴보자 

1) µ

 

 

우변의 µ(mu)는 평균을 의미한다. 왜 평균이 필요할까?

종속 변수의 값이 100% 독립변수의 영향이라고 볼 수 없기 때문이다. 

예를 들어 사과의 출하량을 종속변수, 비료를 준 그룹과 비료를 주지 않은 그룹의 사과 출하량을 비교할 때, 비료를 주지 않은 그룹의 사과 출하량이 상식적으로 "0"이 되지는 않을 것이다. 

 

2) T_ j

 

 

하지만 ANOVA 에서 이 평균값은 우리의 관심사가 아니다. 관심사는 τ_j(타우_제이)이다. 

여기서 τ는 독립변수를 의미, j는 그룹을 의미한다 (j = 1,2,3,4...)

 

 

3) Y_ ij

 

 

'=' 좌측을 보면 Y_ij가 있는데 이는 종속 변수이다. 

이전 포스팅에서 ANOVA에서 종속 변수는 연속형 변수이어야 한다고 언급한 적이 있다. 

여기서 연속형 종속변수의 값이 대문자 Y에 해당한다.

이렇게 표현하는 이유는 데이터 전체를 한 문자로 대표하여 표기하기 위함이다.

그럼 아래첨자 i와 j는 무엇일까?

여기서 j는 독립변수의 그룹을 대표하는 문자이다. i는 그 그룹 내의 ID이다.

 

 

이전 포스팅에서 신약 개발 예시를 들었던 데이터를 가정하고 Y_ij 식을 매칭해보자.

 

이전 포스팅 ) https://2days.tistory.com/66

 

[기초통계] One-way ANOVA Test의 사용 변수와 주의점

One-way ANOVA Test 사용 변수와 주의점 One-way ANOVA에 사용되는 변수 - 종속변수 : 연속형 변수만 가능 - 독립변수 : 이산형/범주형 변수만 가능 만약 이전 포스팅 예시에서 3개의 그룹을 A,B,C 학원 간 아

2days.tistory.com

 

 

Y_ij 예시

 

 

 

4) e_ ij

 

 

그럼 마지막의 e_ij는 무엇일까?

마찬가지로 j 는 독립변수의 그룹을 대표하는 문자이다. 

그리고 i는 그 그룹 내의 ID이다. 

여기서 e의 의미는 오차(error)이며, 그룹 간의 차이인  τ_j 에 의해 설명되지 않는 오차이다.

즉, random 한 오차. 이 오차는 무작위로 발생했으므로 큰 의미는 없다고 가정한다.
만약 이 오차가 무작위로 발생하지 않았다고 하면 무엇인가 문제가 있는 것.

 

이처럼 위의 식은 그룹별(독립변수) 차이가 종속변수에 나타나는 것인지 아닌지 보겠다는 의미로 해석할 수 있다.

반응형

댓글