엔트로피와 인과설정 > 데이터입력하기

본문 바로가기
서울논문컨설팅 / 무료상담 010-2556-8816
신뢰할수 있는 서울대 박사님들이 함께합니다. seoulpaper@daum.net, 02-715-6259


Home > 통계 > 데이터입력하기
데이터입력하기

엔트로피와 인과설정


통계의 핵심개념중 하나는 물질로 구성된 현상세계는 끊임없이 변화한다는 것입니다.

물질의 운동변화는 항상 에너지의 변화를 동반하고, 

에너지 형식의 변화과정에서 엔트로피는 증가하게 됩니다.

 

끊임없이 요동(fluctuation)하는 물질들의 변화양상에서

쓸모없는 에너지 형태인 열로 소실되는 에너지들은 

개체들 사이의 변화양상에서 다양한 차이를 만들어냅니다.

 

즉, 현상계의 변화는 엔트로피의 증가로 인하여

변화를 하면서도 그 변화가 차이가 있게 됩니다.

그 차이를 우리는 오차 또는 잔차 또는 정보의 소실이라고 말합니다.

 

통계는 무작위로 샘플들을 추출하여 분석을 함으로써

그 정보의 소실을 감안하고도 

모집단의 변수들에서 일정한 패턴이 있음을 확인하는 과정이라 할 수 있습니다.

 

통계기법에 따라 동일한 데이타임에도 추출할 수 있는

정보의 수준은 천차만별로 차이가 날 수 있습니다.

 

예를 들어 하나의 변수에 대해 두 그룹의 차이 또는

전후의 차이가 있는지를 확인하는 t-test 또는 분산분석의 방법이 있습니다.

만약 전후로 짝을 맞추어서 비교해 본다면 paired t-test나 Wilcoxon 부호-서열 검증이 있습니다.

샘플수가 50개 이상 되면 위의 방법들간에 유의도가 거의 차이가 없지만

샘플수가 작은 경우에는 변수에 따라 유의도가 많은 차이를 보이기도 합니다.

 

두 변수들 간의 요동의 방향을 확인하는 공분산분석이 있고,

 

분산분석에서 요동의 크기정보를 추가하게 되면  상관분석이 됩니다.

 

그리고 상관분석에서 더 나아가 원인과 결과에 대한 정보가 추가되면

회귀분석이라고 합니다.

 

하나의 원인변수와 결과변수를 단순회귀분석이라고 하고,

두개이상의 원인변수들이 하나의 결과변수에 대한 효과크기를 추정하는 것을

다중회귀분석이라고 합니다.

 

하나의 원인변수들이 두개 이상의 결과변수에 대한 효과크기를 추정하는 것을

다변량회귀분석이라 할 수 있습니다. 

 

인과관계의 그물 또는 연속적인 두개 이상의 인과관계에 대한 추정이 가능한데

이것은 경로분석이라고 합니다.

 

비유를 들자면 방 하나를 만드는 것이 회귀분석이라고 한다면,

집을 만드는 것은 경로분석이 됩니다.

경로분석단계에 들어서면 개별적인 경로들 즉, 각 방이 잘 만들어졌는지에 대한

유의도 뿐만 아니라,

집이 제대로 만들어졌는지를 확인할 수 있는 모형적합도를 구할 수 있게 됩니다.

보다 수준높은 정보들이 제공되는 것입니다.

 

두개 이상의 그룹들의 경로분석을 동시에 진행하는 것을 

다중그룹 경로분석이라 하며,

각 그룹들의 동일한 경로계수의 차이값에 대한 유의도를 구할수 있는데

대표적인 방법이 Wald test입니다.

이 방법은 AMOS프로그램으로는 할수가 없고

단지 Mplus라는 구조방정식 전문 통계프로그램으로 가능합니다.

Mplus는 다중대체법을 할수 있는 현재로서는 유일한 프로그램이기도 합니다.


이러한 상황에서 추출되는 정보의 양이나 수준은

단순히 하나의 변수에서 나오는 평균과는 비교할 수 없게 됩니다.


연구란, 현상계의 변화속에서 내재된 정보를 추출하는 것이라 한다면,

통계방법은 연구의 수준을 결정짓는 핵심적인 요소가 되는 것일수 밖에 없는 것입니다.

 

관찰변수들을 모아서 관찰할수 없는 잠재변수를 만들어낼수 있는데

이러한 잠재변수를 요인(factor)라고 표현합니다.

 

요인들간의 인과관계추정이 가능한데

이를 구조방정식(structure equation model)이라고 합니다.

 

이러한 모든 통계의 기저에는 

변화한다는 것, 그리고 그 변화는 열로의 에너지소실, 

즉 엔트로피의 증가를 동반한다는 것이 있습니다.

 

이때문에 회귀분석이나 경로분석, 구조방정식에서

인과관계가 바뀔때 또는 인과관계설정에 따라 모형적합도나

개별 경로들에 유의도가 변화합니다.

 

그래서 모형을 잘 만들어야 한다는 것은 곧

현상계의 인과관계에 대한 추정을 잘한다는 것과 일맥상통하게 됩니다. 

그렇기에 모형에서 경로설정은 기본적으로 선행연구들의 분명한 결과에

근거해서 하는 것이 원칙입니다.

 

물론 선행연구가 없는 새로운 영역에서 

연구자는 자신의 합리적 이성에 근거하여 경로를 설정할수도 있고,

이것은 곧 연구역량의 범위에 들어가게 됩니다.


예를 들어 HPA-Cytokine feedback이라는 loop가

보고되었다 할지라고 정상상태에서 닫힌 고리의 경로모형은

모형적합도가 낮게 나옵니다. 하지만 열린고리로 만들었을때

경로모형이 높게 나타나는데 이것은 정상상태에서는 

실제로는 피드백메카니즘이 작용하지 않고 있다는 추정을 가능하게 하는 것입니다.

 

이와같이 연구자가 사전에 알고 있는 정보에 따라

통계결과는 매우 깊은 의미를 추론할수 있는 훌륭한 도구로 사용할 수 있습니다.

   

번호 제목 글쓴이 날짜 조회 수
4 샘플 그룹 만들기의 중요성 서울논문 05-25 969
열람중 엔트로피와 인과설정 서울논문 08-28 1298
2 통계는 도구입니다. 때로는 결정적이고, 매우 중요한.... 서울논문 08-28 1074
1 데이타 입력하는 방법 서울논문 08-07 2791

대표:이광조ㅣ사업자등록번호: 643-09-02202ㅣ대표전화: 02-715-6259ㅣ서울시 용산구 효창원로 188