본문 바로가기
데이터분석/Statistics

[기초통계] One-way ANOVA Test의 사용 변수와 주의점

by _Bree_ 2023. 8. 14.
반응형

 

One-way ANOVA Test 사용 변수와 주의점

 

 

One-way ANOVA에 사용되는 변수

- 종속변수 : 연속형 변수만 가능
- 독립변수 : 이산형/범주형 변수만 가능

 

만약 이전 포스팅 예시에서 3개의 그룹을 A,B,C 학원 간 아이들의 평균 점수 차이를 ANOVA test에 적용해 보면 

종속변수: 아이들의 평균 점수
독립변수: 학원의 종류 (A,B,C 3가지 학원)

가 된다.


여기서 독립변수는 변수가 1개이다. 
이걸 더미변수로 바꿔서 넣기도 하고 이러는 경우가 많은데 절대로 해당 방법을 사용하면 안 된다.
ANOVA를 하겠다라는 것은 -> 독립변수는 "한 개"이고, 그 독립변수 안에 레벨이 3개(혹은 이상)가 있는 것 

 

다른 예를 들어보자.


코로나 신약을 개발한 어느 제약회사에서, 코로나 감염자를 대상으로 신약의 효과를 측정하고자 한다면 

종속변수 : 신약을 먹은 후 완치 될 때까지 걸린 날짜
독립변수 (3레벨 - 3가지 그룹)
     - 새로 개발된 신약
     - 기존의 독감 약
     - 플라시보


가 되고, 이 때의 독립변수는 여전히 "한 개"이다. (굳이 독립변수의 이름을 붙이자면 신약의 종류?)
절대 헷갈리지 말자. ANOVA에서의 독립변수는 "한 개"이다.

 


또 다른 예를 들어보자.

어느 인터넷 ISP 기업이 고객의 총 지불 금액이 고객들의 지불 방법에 따라 차이가 있는지 알고 싶어한다. 이때의 사용변수를 살펴보면

종속변수: 고객의 총 지불금액( Total Charges)
독립변수(4레벨 - 4가지 그룹)
    - 은행계좌 자동이체(Bank Transfer)
    - 신용카드 (Credit Card)
    - 전자수표 (Electronic Check)
    - 종이수표 (Mailed Check)


여기서의 독립변수도 여전히 한 개이며, 레벨만 여러 개 라는 것을 알 수 있다.

반응형

댓글