결측치의 비율과 다중대체법 > 결측치,다중대체법

본문 바로가기
서울논문컨설팅 / 무료상담 010-2556-8816
신뢰할수 있는 서울대 박사님들이 함께합니다. seoulpaper@daum.net, 02-715-6259


Home > 통계 > 결측치,다중대체법
결측치,다중대체법

결측치의 비율과 다중대체법


Fraction of missing information and multiple imputation

 

Rubin의 다중대체법에 대한 발표 이후 [3], 

컴퓨터의 발달 등과 함께 점점 다중대체법이 연구자들에게 유용성을 인정받고 있으나결측치의 수가 얼마인까지 가능한가에 대한 명확한 결론은 없다. 

이로인해 결측치의 수가 어디까지 가능한가에 대한 물음이 제기될 수 있다.

  

John 등은 결측치정보의 비율 (fraction of missing information: γ (gamma))에 따라 필요한 다중대체의 횟수에 대한 연구를 보고하였다 [5].

 

결측치 정보의 비율 γ 는 단순회귀분석처럼 단순한 구조의 경우 결측치의 수의 비율과 같다이들의 분석에 의하면 결측치의 비율 γ =0.1 (10%)., 0.3 (30%), 0.5 (50%), 0.7 (70%) 그리고 0.9 (90%)의 다섯가지 수준들을 설정한 후다중대체법으로 분석하였을 때, 모든 γ 값의 수준에서 회귀계수가 편향되지 않았다고 (unbiased) 보고하였다 [7].

 

그리고 각 γ 값 내에서 다중대체의 수가 100회에서 3회로 감소할 때 

mean-square error (MSE)standard error (SE)가 증가하였고, 

잘못된 귀무가설에 대한 기각확률인 검정력이 감소하였다.

  

그리고 다중대체의 횟수가 감소하면서 

추정값의 변동성 (variability)이 증가하였다 [7]. 

 

뿐만 아니라 경로분석이나 구조방정식에서 변수의 수가 증가하더라도 

변수들간에 충분한 인과관계가 존재한다면 

결측치 정보의 비율 (γ )은 감소하게 된다. 

 

, 단순회귀분석과 같은 간단한 모형에서 γ 값은 결측치의 비율과 동일하지만만약 다중대체 모델에 포함된 변수들이 다른 변수들과 높은 상관관계를 보인다면, 잘 만들어진 모형에서는, 결측정보의 양인 γ 값은 결측치 데이타보다 일반적으로 작아지게 된다 [4].

  

따라서 모형에서 변수들의 수가 증가하더라도 

결측치를 가진 변수들과 다른 변수들 사이에 어떠한 상관관계가 나타났다면 

실제 결측치의 불확실성은 더욱 감소하게 되는 것이다. 

 

결측치를 포함하지 않은 단일회귀분석, 다중대체로 산출된 데이타를 이용한 단일회귀분석 그리고, 다중대체로 산출된 데이타셋을 합계낸 후 분석한 다중회귀분석대중대체로 자동으로 산출한 결과 이 모든 값들을 비교해볼때 유사한 값을 나타낸다면 진행된 다중대체법의 결과에 대한 신뢰도를 지지하는 결과들에 포함될 수 있다. 

번호 제목 글쓴이 날짜 조회 수
2 다중대체법 (Multiple Imputation: M.I.) 서울논문 08-07 13454
열람중 결측치의 비율과 다중대체법 서울논문 08-07 2401

대표:이광조ㅣ사업자등록번호: 643-09-02202ㅣ대표전화: 02-715-6259ㅣ서울시 용산구 효창원로 188