-
<통계학> 분산분석(ANOVA) - 3 (Two-way ANOVA)데이터 분석 관련 공부 2024. 1. 26. 14:12
지난 번 작성한 일원배치 분산분석에 이어서 이원배치 분산분석에 대해서 작성해보려고한다.
https://jinhyunbae.tistory.com/133
이원배치 분산분석(Two-way ANOVA)
분산 분석 중에서 Two-way ANOVA라는 것은 한국어로는 이원분산분석 혹은 이원배치 분산분석이라고 하는데
독립변수가 2개일 때 집단 간 종속변수의 차이를 검증하기 위해서 사용되는 방법이다.
집단 간 평균차이를 비교한다는 점에서 t검정과 유사하다고 생각할 수 있다.
이원배치 분산분석의 기본 가정
1. 종속변수가 연속형 변수여야하며, 독립변수는 모두 범주형 변수여야한다.
2. 정규성 가정을 만족해야한다.
3. 등분산성 가정을 만족해야한다.
4. 독립성 가정을 만족해야한다.
일원배치 분산분석과 기본 가정을 동일하다.
이원배치 분산분석의 연구문제 및 가설 예시
이원배치 분산분석은 독립변수가 2개이기 때문에 연구가설이 다르게 바뀐다.
우선 각각의 독립변수에 따른 주효과를 가설로 세우고
두 독립변수간의 교호작용(상호작용) 효과를 가설로 세우게 된다.
교호작용을 알기 쉽게 그래프로 나타내면
이런식으로 교차하는 그래프로 알 수 있다. 집단 A와 집단 B를 동시에 고려했을 때 종속변수에 대해서
미치는 영향이 있는 것을 살펴볼 수 있다.
주효과 2개, 교호작용 1개로 연구가설이 3개이기 때문에 그에 따른 귀무가설도 3개가 된다.
연구문제
이성에 대한 신체적 매력도 평가 점수가 성별과 음주량에 따라서 다르게 나타나는지 알고 싶다.
가설
- 귀무가설(H0) : 음주량에 따른 이성의 신체적 매력도 평가 점수는 다르지 않을 것이다.
- 귀무가설(H0-1) : 성별에 따른 이성의 신체적 매력도 평가 점수는 다르지 않을 것이다.
- 귀무가설(H0-2) : 이성의 신체적 매력도 평가 점수에 있어 음주량과 성별 간에 교호작용은 없을 것이다.
- 대립가설(H1) : 음주량에 따라 이성의 신체적 매력도 평가 점수는 다를 것이다.
- 대립가설(H1-1) : 성별에 따라 이성의 신체적 매력도 평가 점수는 다를 것이다.
- 대립가설(H1-2) : 이성의 신체적 매력도 평가 점수에 있어 음주량과 성별 간에 교호작용이 있을 것이다.
일원배치 분산분석과 마찬가지로 주의해야할 점은 대립가설이 모든 집단이 차이가 있다는 것이 아니라
적어도 한 집단에서는 차이가 난다라는 부분이다.
이원배치 분산분석의 가설 검증 논리 및 통계량
https://jinhyunbae.tistory.com/133
가설검증의 논리와 사용된 통계량은 일원배치 분산분석과 동일하다.
다만 실제 차이(처치 효과)에 대해서 구체적으로 나누어서 보게된다.
독립변수가 A와 B가 있다고 했을 때
A의 주효과(MSE), B의 주효과(MSB), AB의 교호작용에 의한 효과(MSAB), 그리고 오차(MSE)로 구분하여
MSA / MSE,
MSB / MSE,
MSAB / MSE의 F값을 유의수준에 따라 비교한다.
사후검정(Post-Hoc Analysis)
사후검정의 경우에도 일원배치 분산분석과 유사하게 진행된다.
다만 독립변수가 2개이기 때문에 검정과 해석에 조금 집중할 필요가 있다.
비모수 검정
이원배치 분산분석에 대해서는 비모수 검정이 있는 지 찾아봤으나
Friedman 검정이 이원배치 분산분석의 비모수 검정 방법이라는 글도 있고
그렇지 않다는 글도 있다.
검색을 해보니 Friedman 검정은 독립이 아닌 세 개 이상의 집단 간 평균 차이를 보기 위한 검정 방법이라고 나왔다.
이원배치에 비모수검정이 없다는 사람은
그래서 전체적으로 Kruskal-Wallis 검정을 시행한 뒤 pairwise하게 Mann-Whitney 검정을 시행하고
그 결과를 Bonferroini Correction하여 해석하는 방법 밖에 없다고 한다.
Kruskal-Wallis도 결국 정규성을 만족하지 못했을 때의 비모수 방법이고 Friedman은 독립성 가정이 만족하지 못했을 때의 세 집단 이상 비교방법이니 어느쪽을 사용해야하는지는 모르겠지만 Friedman에서 Bonferroni Correction을 사용한다면 두 방법이 결과적으로는 같은 이야기를 하고 있는 것이 아닌가 싶기도하다.
https://blog.naver.com/PostView.naver?blogId=drted&logNo=221340448870
이 부분은 공부가 좀 더 필요할 것 같다.
이원배치 분산분석 코드 구현은 아래 링크에 정리해두었다.
https://jinhyunbae.tistory.com/137
References
- 충남대학교 심리학과 심리통계2 강의자료
- 파이썬 한권으로 끝내기(2023) 시대에듀
'데이터 분석 관련 공부' 카테고리의 다른 글
<통계학> 단순선형회귀 - 1 (0) 2024.01.30 <통계학> 분산분석(ANOVA) - 4 (Two-way ANOVA with Python) (1) 2024.01.26 <통계학> 분산분석(ANOVA) - 2 (One way ANOVA with Python) (1) 2024.01.25 <통계학> 분산분석(ANOVA) -1 (One-way-ANOVA) (2) 2024.01.25 <통계학> t검정(t-test) - 2 (with Python) (0) 2024.01.24