통계

본문 바로가기
서울논문컨설팅 / 무료상담 010-2556-8816
신뢰할수 있는 서울대 박사님들이 함께합니다. seoulpaper@daum.net, 02-715-6259


Home > 통계
통계

통계

서울논문컨설팅을 방문해주셔서 감사합니다.

사전에 만들어 놓았던 연구모형의 통계분석의 결과가 예상과 달리 잘 나오지 않아서

논문에 적용하지 못하고 고민하던 많은 분들이 

본 컨설팅을 이용하시면서 해법을 찾으시는 것을 경험하게 되면서 

더욱 큰 보람을 느끼고 있습니다.

 

어떠한 통계기법에 대한 배경원리를 이해한 상황에서는

다양한 방법을 통하여 원래의 모형에 대한 통계분석결과가 달라질 수 있습니다.

 

무엇보다 통계란 무엇인가에 대한 관점이 필요할 것입니다.

통계는 절대적인 기준이 있다기 보다는

현상계의 변화를 최대한 예측하고 제어하고자하는 목적으로 만들어진 

것임을 이해하실 필요가 있습니다.

그 다양한 방법들을 이용하는데 있어서 몇가지 조건들과 가정, 그리고 원리를

이해하는 것이 연구자의 연구설계를 적용하고, 그 결과를 해석하고, 응용하는데 

있어 중요한 것입니다.


그 다음으로는 통계에서 나온 결과가 의미하는 바가 무엇인가에 대한 이해입니다.

이를 위해서는 기본적인 통계개념과 함께 연구자의 연구영역에 대한 고찰이 필요합니다.

즉, 통계결과수치에 대한 의미부여는 그 분야의 전문가가 할수 있을 뿐입니다.


따라서 연구분야에서 통계를 이용하기 위해서는

두가지가 필요함을 알수 있습니다. 

하나는 통계지식과 응용이며 다른 하나는 연구경험과 해석능력입니다.


이 두가지는 마치 새의 양날개 또는 수례의 양바퀴와 같아서

하나만으로는 제대로 연구라는 수레를 전진시키기가 쉽지 않은 것입니다.

 

----------------------------------------------------------------------------------- 

 

변화하는 현상계에 대한 이해를 위해서

하나의 개체가 아니라 여러개체를 이용하여 패턴을 확인하는 것,

그 속에 숨겨진 정보들을 추출해 내고

예측하고 최종적으로는 제어할수 있도록 하는 것이

통계의 힘입니다.

 

따라서 어떠한 통계기법을 사용할 수 있는가 하는 것은

곧 어떠한 수준의 연구를 수행할수 있는가와 직결됩니다.

 

단적인 예로 심리학계에서 성격에 관한 요인분석연구는 1900년대 중반부터 있어왔지만,

사람의 손으로 수작업을 해야 했기에 수십년동안 빠른 진전이 있기 어려웠습니다.

하지만 1980년대에 IBM에서 개인용 컴퓨터를 만들어내게 되면서

통계작업이 사람이 할때와는 비교할 수 없이 매우 빨라졌고 

심리학계에서 성격요인은 매우 확고한 근거가 있는 분야로 발달하게 되었습니다.

 

 

그러므로 통계는, 특히 컴퓨터의 발달로 인하여, 단순한 기술적 테크닉을 넘어서

연구의 본질을 규정할수 있는 매우 중요한 요소가 되는 것입니다.

 

의뢰인들 중에는 매우 훌륭한 데이타를 얻었음에도

그 분석은 제한되어있어 논문작성에 불필요한 내용들로 채워넣는 경우를

종종 경험하곤 합니다.

적절한 통계적 수치와 근거자료가 없이

제한된 결과로 논리를 전개하게 되면 비약으로 받아들여질수 있습니다.

아무리 선행연구를 잘 고찰하였다 하더라도

자신의 분석이 제한되어 있다면 그 선행연구와 자신의 연구를 연결하는데에

제한이 있을수 밖에 없는 것입니다.

 

 

이러한 상황에서 몇가지 통계기법을 활용하게 되면

전혀 알지 못하였던 정보들을 추출해 낼 수 있습니다.

그렇게 되면 이 논문은 그전과는 전혀 다른 논문이 되며,

고객은 상당한 만족감을 표현하게 되는 것을 빈번히 확인하게 됩니다.

다양한 선행연구들이 자신의 연구와 연결되는 것을 경험하게 됩니다.

 

통계분석에서 분포를 확인하고 어떠한 통계방법을 이용해야 하는지에 대한

이해도 필요합니다. 무작정 제시된 통계버튼을 눌러서 분석을 할수 있는 것은

아닙니다. 즉, 어떠한 분포인지 확인해야 하는 것은

특정 통계분석방법을 사용할 수 있는 전제조건이 되기 때문에 중요합니다.

자료의 분포에 대한 확인후에 사용가능한 통계방법을 선택하거나

변형해야 합니다.


예를 들어 우울증 검사를 하게 되면

우울증 지표에서 폐경기 여성은 정규분포와 비슷한 분포도를 나타나지만

하지만 초등학생이나 중학생에게 우울증 검사는

정규분포가 나오지 않고 오른쪽으로 꼬리를 가진 포아송 분포와 비슷해집니다.

그 이유는 어린아이들이 우울할 경우는 그리 많지 않다는 것입니다.

이유를 알지 못하는 major depression의 경우에는 많은 수가 신경학적인 기능과

관련되어 있을 가능성이 높습니다. 노화와 호르몬이상의 함께 진행되는 폐경기여성에게서

우울증이 많은 이유입니다.

따라서 어린이의 우울증 분포에서는 변수의 정규분포를 전제로 한단순 회귀를 그대로 사용할때 

분석이 정확하지 않을 가능성이 높습니다. 

대신 로그변환으로 일반화선형모형을 이용하면 정확하게 분석되는 것입니다.

이러한 현상은 경로분석에서도 동일하게 나타나게 되는데 (모형적합도로 확인이 가능), 

그 이유는 경로분석의 전제는 회귀분석의 조건과 동일하기 때문입니다.

 

하지만 이러한 과정은 단지 몇가지 통계기술만이 있다고 가능한 것도 아닙니다.

선행연구들을 찾고, 읽고, 이해하고, 응용이 가능할때에야

통계기법은 힘을 활휘하고 그 결과가 빛이 나게 됩니다.

다시 표현하자면 선행되는 연구들에 대한 이해와 이론적 배경이 없이, 

그리고 합리적 이성에 근거한 추론이 없는 통계결과는

연구라기 보다는 단순한 기술적 테크닉에 지나지 않는 것입니다.


따라서 선행연구를 찾아내고, 그 내용을 읽을수 있고

(한글논문들뿐만 아니라 외국문헌들도 자유로이 읽고 이해할 수 있어야),

고찰하고 종합하여 판단내릴수 있는 능력이 통계적 활용에

요구되는 사항들이라 할 수 있습니다.

 

 

동일한 재료를 가지고 무엇을 만들 수 있는가는

결국 선행연구에 대한 이해력과 응용력, 그리고 분석도구에 의존하는 함수가 되며

연구의 질을 놀랍게 향상시킬수 있는 매개가 되므로

분석을 위한 투자는 충분히 가치가 있을 수 있습니다.

 

-----------------------------------------------------

 

빈번하게 문의를 받는 사항 중에 하나는

이미 실험이 끝나고 논문제출시한을 남겨 놓은 상태에서

인과분석을 요청하는 것입니다.

그런데 그룹의 샘플수가 15명 내외라고 합니다.

이 숫자로 인과분석은 거의 불가능합니다.

즉, 유의도가 나오지 않습니다.

대략 그룹당 50명은 되야 하는데,

이미 실험을 15명 정도의 제한된 숫자로 진행을 하게 되면

추출해 낼 수 있는 정보는 단순 t test도 쉽지 않을 것입니다.


이런 문제들은 이미 발표가 된 논문들에서도 쉽게 확인하는 현실입니다.

200여 페이지가 넘는 내용에서도 세심하게 분석을 해 놓은 논문인데,

정작 그룹당 샘플을 13명에서 15명으로 설정한후

연구를 해 놓은 것입니다.

이렇게 되면 아무리 많은 분석을 동원하여

지면을 채운다 한들, 거기에서 제공할 수 있는 정보는 제한될 수 밖에 없는

것입니다.


그러므로 만약 경험이나 선행연구가 없을 경우에는

가능하면 경험자에게 문의하여 진행하는 것이 좋습니다.

단순히 통계교과서에 의지하기 보다는 경험에 의한

자문이 더욱 효과적인 이유는 본질적으로 통계는 경험에 근거하기 때문입니다.

수많은 변수들에 공통적으로 적용될 수 있는 샘플수는 있을수가 없는데,

그것은 그 분포의 모양과 크기가 제각기 다를수밖에 없기 때문입니다.

 

----------------------------------

 

무엇을 위한 통계인가요?

처음 연구를 하면서, 논문을 쓰면서 

통계에 대한 이해가 제한되어 있는 경우에는

통계방법을 배우는것 자체가 목적이 되기도 합니다.

 

논문들 중에도 실재 논문이 의도한 바의 주제는 상실된채

화려한 통계기법들이 중요테마로 자리잡고

정작 결론이나 논의는 통계의 내용과는 상관없이 짧게 끝내버리고

마는 경우도 종종 보게 됩니다.

 

주객이 전도된 이러한 상황의 주된 이유는

연구자가 어떤 연구를 하고 싶은지에 대해 명확하지 못하고,

연구자가 그 목적을 위해 어떤 통계가 적절한지 이해가 제한되어 있을때,

그리고 통계를 이해하는 자체가 연구자에게 너무나 크게 부담으로 작용하고 있기 때문입니다.

 

간단히 경로분석으로 끝낼수도 있는데,

구조방정식에 매개변수를 끌어들여서 또는 조절변수를 도입하여

분석을 시도하고, 해결하려 합니다.

 

잠재변수가 들어간 구조방정식의 단점은

요인이라는 잠재변수가 모형에서 주요축으로 자리잡음으로써

정작 우리가 알고자 하는 관찰변수들간의 직접적인 이해가 제한될 수 있다는 점입니다.

 

뉴턴 이래로 수학을 동원하여 천문현상을 예측하게 되면서

자연과학은 확고한 진리탐구의 수단으로 인정받게 되었고, 

하나로서의 과학의 힘은 기존의 종교, 철학 등 사회 곳곳에 맹위를 떨치게 되었습니다.

이러한 상황에서 사회현상의 과학화를 도모하고 

유용한 도구로서 활용된것이 구조방정식입니다.

 

사랑, 믿음, 용기, 자존감, 효능감, 커뮤니케이션 스킬 등등 

수많은 보이지 않는 현상들과 개념들을

보이는 관찰변수를 동원하여 잠재변수, 즉 요인을 설정함으로써

이들을 설명할수 있게 되었기 때문입니다.

 

그러나 직접적으로 설명할 수만 있다면

그것을 마다할 이유는 없을 것이다.

즉, 잠재변수를 동원하지 않는 경로분석 등이

오히려 구조방정식 보다 더 강력한 해석과 정보를 제공하는 경우도

빈번하다는 점입니다.

 

처음 연구에서 선행연구를 참조하고, 모방하는 것은 필요할수 있지만,

다른 선행연구의 해석방법들을 무비판적으로

판박이로 따르려고 하는 것은 때로 자신의 연구의 정보를 손상할 수 있음을

기억할 필요가 있습니다. 

 

자신은 이 연구에서 무엇을 알고자 하는가?

이를 위해 어떤 통계방법들이 좋은가?

그 통계결과를 통해 어떠한 정보를 추출해 내고 해석할수 있는가?

이러한 질문들 속에서 연구자는 그/그녀가 원하는 주제에 대해 논의를 

할 수 있습니다.

 

 

 


대표:이광조ㅣ사업자등록번호: 643-09-02202ㅣ대표전화: 02-715-6259ㅣ서울시 용산구 효창원로 188