요인 수준 또는 처리 수준의 선택에는 두 가지 방법이 있다. 하나는 실험자가 스스로 적당한 실험 수준을 선택하는 것으로 고정(fixed)되었다고 하며 이에 대응되는 모형을 고정효과 모형(fixed effects model)이라 부른다. 다른 하나는 가능한 모든 처리 수준 중 랜덤으로 몇 개를 고르는 것으로 랜덤(random)이라 하며 대응되는 모형을 랜덤효과 모형(random effects model)이라 부른다.
교정효과 모형과 랜덤효과 모형의 차이는 통계 추론의 범위에 있다. 고정효과 모형에서는 통계 추론이 오로지 실험이 실제 진행된 처리 수준들에 국한된다. 반면에 랜덤효과 모형에서는 통계 추론이 실제 실험을 하지 않은 처리 수준을 포함하는 가능한 모든 처리 수준들에까지 확대된다. 즉, 고정효과 모형에서는 단순히 실험이 실제로 수행된 수준들에 한해서 통계적 결론이 유효하지만, 랜덤효과 모형으로부터의 통계적 결론은 실험을 하지 아니한 모든 수준들에까지도 확대 적용할 수 있다. 분석 결과의 해석만을 놓고 보면 랜덤 모형이 고정 모형보다 우월하다. 그러나 랜덤하게 결정된 실험 수준을 조절하기가 어려워 실용적이지는 않다. 또한 효과 차이에 대한 다중 비교법은 고정효과 요인에 대해서만 적용할 수 있다. 랜덤효과 요인에 대해서는 다중 비교가 원천적으로 불가능하다.
단일 요인의 경우에는 고정효과 모형과 랜덤효과 모형의 두 가지 모형이 존재한다. 그러나 요인의 개수가 둘 이상이면 혼합효과 모형(mixed effects model)도 나타난다. 혼합효과 모형은 고정 요인과 램덤 요인이 동시에 존재하는 실험에 대한 모형을 의미한다. 혼합 모형에서 고정효과 요인과 랜덤효과 요인의 상호작용 효과는 랜덤효과가 된다.
요인 수준의 선택 방법에 따라 즉, 고정모형 - 랜덤모형 - 혼합모형에 따라 모델과 가설 검정법이 달라진다.
일원배치법의 경우, 랜덤모형은 다음과 같다.
$Y_{ij} = \mu + \tau_i + \epsilon_{ij}, \epsilon \sim N(0, \sigma^2), \tau_i \sim ~N(0, \sigma_{\tau}^2)$
여기서, $\tau_i$는 상수가 아닌 확률변수로서 오차와는 서로 독립이다. 랜덤효과 모형에서 $\tau_i$가 확률변수인 이유는 실험 전에 어떤 수준이 될지 미리 알 수 없기 때문이다. 모형에 따르면 관측 $Y_{ij}$의 분산은 다음과 같다.
$Var(Y_{ij}) = \sigma^2 + \sigma^2$
랜덤효과 모형에서 관측의 분산은 처리분산과 오차분산의 두 요소로 이루어지며, 이런 면에서 랜덤모형을 분산요소 모형이라 부르며, 처리분산과 오차분산을 분산요소라 부른다. 따라서 랜덤효과 모형에서 처리 효과의 유무를 확인하는 가설의 형태는 다음과 같다.
$H_0 : \sigma_{\tau}^2 = 0$ $H_1 : \sigma_{\tau}^2 > 0$
일원 분산분석자료에서는 고정이든 랜덤이든 분산분석표를 만들고 분석하는 과정에 아무런 차이가 없다. 그러나 둘 이상의 관심 요인이 있는 분산분석 자료에서는 분산분석표를 이용한 가설검정에 큰 차이가 있다.
'Experiment design > 실험설계' 카테고리의 다른 글
실험 설계시, 가설과 지표 설정 방향 Idea (0) | 2023.02.26 |
---|---|
분산 분석의 가정(Assumptions for ANOVA) (0) | 2022.08.17 |
지분설계(nested design) (0) | 2020.06.16 |
EMS(expected mean square) : 기대평균제곱 (0) | 2020.06.15 |
요인설계(factorial design) or 교차실험(crossed experiment) with fixed (0) | 2020.06.14 |
댓글