One-way ANOVA Test 공식 설명
One-way ANOVA Test 공식
식을 하나씩 살펴보자
1) µ
우변의 µ(mu)는 평균을 의미한다. 왜 평균이 필요할까?
종속 변수의 값이 100% 독립변수의 영향이라고 볼 수 없기 때문이다.
예를 들어 사과의 출하량을 종속변수, 비료를 준 그룹과 비료를 주지 않은 그룹의 사과 출하량을 비교할 때, 비료를 주지 않은 그룹의 사과 출하량이 상식적으로 "0"이 되지는 않을 것이다.
2) T_ j
하지만 ANOVA 에서 이 평균값은 우리의 관심사가 아니다. 관심사는 τ_j(타우_제이)이다.
여기서 τ는 독립변수를 의미, j는 그룹을 의미한다 (j = 1,2,3,4...)
3) Y_ ij
'=' 좌측을 보면 Y_ij가 있는데 이는 종속 변수이다.
이전 포스팅에서 ANOVA에서 종속 변수는 연속형 변수이어야 한다고 언급한 적이 있다.
여기서 연속형 종속변수의 값이 대문자 Y에 해당한다.
이렇게 표현하는 이유는 데이터 전체를 한 문자로 대표하여 표기하기 위함이다.
그럼 아래첨자 i와 j는 무엇일까?
여기서 j는 독립변수의 그룹을 대표하는 문자이다. i는 그 그룹 내의 ID이다.
이전 포스팅에서 신약 개발 예시를 들었던 데이터를 가정하고 Y_ij 식을 매칭해보자.
이전 포스팅 ) https://2days.tistory.com/66
[기초통계] One-way ANOVA Test의 사용 변수와 주의점
One-way ANOVA Test 사용 변수와 주의점 One-way ANOVA에 사용되는 변수 - 종속변수 : 연속형 변수만 가능 - 독립변수 : 이산형/범주형 변수만 가능 만약 이전 포스팅 예시에서 3개의 그룹을 A,B,C 학원 간 아
2days.tistory.com
4) e_ ij
그럼 마지막의 e_ij는 무엇일까?
마찬가지로 j 는 독립변수의 그룹을 대표하는 문자이다.
그리고 i는 그 그룹 내의 ID이다.
여기서 e의 의미는 오차(error)이며, 그룹 간의 차이인 τ_j 에 의해 설명되지 않는 오차이다.
즉, random 한 오차. 이 오차는 무작위로 발생했으므로 큰 의미는 없다고 가정한다.
만약 이 오차가 무작위로 발생하지 않았다고 하면 무엇인가 문제가 있는 것.
이처럼 위의 식은 그룹별(독립변수) 차이가 종속변수에 나타나는 것인지 아닌지 보겠다는 의미로 해석할 수 있다.
'데이터분석 > Statistics' 카테고리의 다른 글
[기초통계] ANOVA Test 총정리 (0) | 2023.08.24 |
---|---|
[기초통계] One-way ANOVA Test의 사용 변수와 주의점 (0) | 2023.08.14 |
[기초통계] One-way ANOVA Test (1) (0) | 2023.08.14 |
[기초통계] t-test(1) (0) | 2023.08.10 |
[기초통계] 상관관계와 상관계수 (0) | 2023.08.07 |
댓글