1. ANCOVA
ANOVA는 요인수준(X)에 따른 반응변수(Y)가 차이가 있는지 검정하는 분석이며, ANCOVA도 마찬가지로 요인수준(X)에 따른 반응변수(Y)가 차이가 있는지 검정하지만, 요인 이외에도 반응변수에 영향을 주는 요인(공변량)을 통제한 후 요인수준(X)이 반응변수에 미치는 순수한 영향을 측정하는데 목적이 있다. 공변량은 주 관심요인은 아니지만 반응변수(Y)에 영향을 미치는 요인이다. 공변량을 추가함으로써 모형으로 설명되지 않는 변동의 일부분을 설명하여 모형에서의 그룹-내 오차분산을 줄일 수 있다. 또한, 반응변수에 영향을 미치는 공변량 효과를 통제함으로써 처리효과를 보다 정확하게 추정할 수 있다. 공분산 분석은 공변량 효과의 통제하에 주효과와 교호작용효과를 검정하기 위해 사용된다.
만약 공변량이 반응변수에 영향을 주지 않는다면, 이는 통계적으로 통제할 필요가 없으며, 이 경우네는 공변량을 분석 모형에서 제거한다고 해도 결과에 변함이 거의 없다.
또한, 공분산분석은 분산분석과 회귀분석의 특성을 결합한 분석방법으로 이해할 수 있다. 즉, 다른 요인들의 영향 없이 한 번에 하나의 요인만을 고려한다는 점에서 분산분석과 비슷하고, 모든 회귀선의 기울기가 동일할 때 어떤 회귀선의 절편값이 다른지 검정할 수 있다. 즉, 요인이 반응변수에 어떻게 작용하는지 분석할 수 있다는 점에서 회귀분석과 같다.
2. Data에 적용
약품 A | 약품 B | 대조군 | |||
치료 전 (공변량) | 치료 후 | 치료 전 (공변량) | 치료 후 | 치료 전 (공변량) | 치료 후 |
10 | 8 | 9 | 6 | 4 | 0 |
12 | 5 | 18 | 17 | 9 | 5 |
23 | 18 | 16 | 11 | 12 | 9 |
8 | 7 | 10 | 6 | 6 | 2 |
6 | 2 | 2 | 1 | 23 | 4 |
약품 A와 B의 효과를 비교하고자 한다. 임의로 뽑힌 15명의 환자 중에서 5명에게는 약품 A를 , 다른 5명에게는 약품 B를 투여하고, 나머지 5명에게는 대조군으로 관측하였다. 치료 전과 치료 후의 특정 질병균을 측정한 자료이다.
처리 별로 특정 질병균의 수가 같은지 검정하고자 한다. 하지만, 처리가 모두 다른 사람에게 가해졌기 때문에 사람마다 가지고 있는 특성으로 약품이 잘 받거나 잘 안받을 수 있다. 즉, 치료 후의 특정 질병균이 정말 처리효과에 의해 반응이 나타난건지 그사람이 가지고 있는 특성에 의해 반응한건지 알 수 없다는 이야기이다. 이는 또 위에서 ANCOVA를 소개했던 처리효과의 순수한 영향을 알 수 없다는 말과 같다. 따라서, 치료 전의 특정 질병균(공변량)을 고려하여 순수한 처리효과를 알 수 있다. 곰곰히 생각해보면 이는 공변량과 반응변수의 상관관계가 높을수록 ANCOVA를 실시해야 순수한 요인수준(X)의 효과를 알 수 있다는 이야기로 들린다.
3. 가정
- 공변량과 처리효과 간에 독립이어야 한다. 이는 처리에 상관없이 공변량이 같아야 한다는 말과 같다. 공변량이 처리별로 다른 경우 처리 효과의 일부분이 공변량 효과에 포함되게 되어, 처리 효과에 대한 검정력을 떨어뜨릴 수 있다.
- 처리별로 회귀선의 기울기가 동일해야 한다. 이는 공변량의 효과가 처리와 독립이라는 말과 같다. 이는 다중회귀에서, 예측변수들이 반응변수에 독립적으로 작용해야하는 조건과 동일하다. 이 가정은 공변량과 예측변수 간에 교호작용효과가 있는지의 검정을 통해 확인 할 수 있다.
- 잔차의 정규성, 등분산성, 독립성
4. 분석 과정
ANCOVA의 일반적인 절차는 다음과 같다.
- 독립변수와 종속변수에 대해 회귀분석을 실시한다.
- 그 결과로부터 나온 잔차를 확인한다.
- 잔차에 대해 ANOVA를 실시한다.
'Multivariate analysis > 다변량분석' 카테고리의 다른 글
혼합분포군집(mixture distribution clustering) (0) | 2021.03.03 |
---|---|
판별분석(Discriminant Analysis, DA) (0) | 2020.06.21 |
Hotelling's T-Squared (0) | 2020.05.27 |
ANOVA(분산분석), MANOVA(다변량분산분석) (0) | 2020.05.08 |
마할라노비스 제곱거리와 카이제곱분포을 통한 다변량 이상치 탐색 (0) | 2020.04.16 |
댓글