마할라노비스 제곱거리와 카이제곱분포을 통한 다변량 이상치 탐색
다변량 자료를 다루기 전, 먼저 알고 넘어갈 사항이 있다. 정규분포와 마찬가지로, 다변량 정규분포는 몇몇 다변량 분석 절차에서 중요한 역할을 한다. 또한, 모집단의 모수에 대한 추론은 주로 모집단에 대해 다변량 정규분포의 가정하에 이루어 진다. 1. 다변량 정규분포 확률벡터 $X = X(X_1,X_2, \cdots,X_p)^T$가 평균이 $\mu$이고 공분산행렬이 $\Sigma$인 다변량 정규분포를 따를 때 (기호로, $X$ ~ $N_p(\mu,\Sigma$)), 확률밀도함수는 다음과 같다. $f(x;\mu,\Sigma) = (2\pi)^{-p/2} det(\Sigma)^{-1/2} exp[-\frac{1}{2} (x-\mu)^T \Sigma^{-1} (x-\mu)] $ 위의 확률밀도함수는 동일한 값을 ..
2020. 4. 16.