데이타 입력하는 방법 > 데이터입력하기

본문 바로가기
서울논문컨설팅 / 무료상담 010-2556-8816
신뢰할수 있는 서울대 박사님들이 함께합니다. seoulpaper@daum.net, 02-715-6259


Home > 통계 > 데이터입력하기
데이터입력하기

데이타 입력하는 방법


데이타를 입력하는 과정은 통계분석의 핵심적 과정 중 하나입니다.

 

왜냐하면 기본자료입력이 잘못된다면 분석의 결과도 전혀 다르게 나올수 있기 때문입니다.

 

특히 샘플의 수가 많지 않거나, 입력수치가 큰 차이가 나게 되면

 

그 결과의 변화는 더욱 커집니다.

 

설문조사나, 연구를 한후에 그 결과지를 가지고 입력을 못해서 하나씩 숫자를 세고

 

평균을 내는 학생들이 의외로 많습니다.

 

따라서 데이타입력하기의 강조와 소개는 지나치지 않다고 할수 있습니다.

 

다음의 과정에 따라 진행을 하면 누구든지 쉽게 코딩을 할수 있습니다.

 

 

얻은 데이터를 엑셀에 코딩하는 순서

순서

1. 먼저 엑셀파일을 여십시오.

2. 세로축으로는 참가자의 이름을 쓰세요(번호로 대신해도 무방합니다.)

3. 가로축으로는 변수들의 이름을 쓰세요(설문항이라면 설문1. 설문2...)

4. 실험참가자 또는 샘플과 변수들의 교차점에 입력을 하세요.

5. 입력한 자료를 다시한번 검토하세요

6. 입력한 자료를 제 3자가 다시 한번 검토하세요.

 

 이름

성별 

연령 

질문1 

질문2 

 홍길동

 남

28 

 성춘향 

 여 

18 

 이몽룡

 남 

20 

 방자

 남 

22 

4

 

 

입력한 데이타를 프린트하여 다시한번 확인하기

 

기계가 측정한 데이타라 하더라도,

 

옮겨 적는 과정에서 실수를 할수도 있다.

 

따라서 데이타를 프린트하여 전체적으로 훑어보는 것이 필요하다.

 

다른 값들에 비해 너무 높거나 낮은 값들은 형광펜 등으로 표시를 해 놓아야 한다.

 

그리고 경우에 따라 그 값을 제외할수도 있다.

 

대개 평균에서 표준편차 2개를 합한 값보다 높은 경우에 그 값은 제외를 고려해야한다.

 

특히 회귀분석이나 경로분석에서 이러한 이상치 들로 인하여 분석이 되지 않거나

 

이상한 결과가 나오게 되는데, 이러한때 연구자는 이상치를 제외하고

 

분석을 한다.

 

 

회귀분석에서 원칙은 이상치를 제외한 후,

 

다시 평균을 내고, 편차를 낸후 다시 이상치를 확인하는 과정을 반복하지만,

 

한번 정도만 이상치를 제외해도 분석이 보다 정확하게 되는 것을 경험하게 된다.

 

 

raw data를 직접 비교해보기

 

기계에서 프린트 된 값들 또는 설문지에 기입된 값들과

 

엑셀에 코딩된 값들을 직접 일대일 확인을 해본다.

 

 

 

모든 데이타의 입력이 끝난후에는 이것을 SPSSSAS와 같은 통계프로그램에서 불러와서

 

간단하게 분석을 할 수 있습니다.

 

또는 최근에는 엑셀의 분석기능이 높아져서 왠만한 분석은 엑셀내에서 진행이 가능합니다.

 

좀더 고급통계분석을 위해서는 적절한 통계프로그램을 이용합니다.

 

예를 들어서 구조방정식이나 경로분석에는 AMOSMplus등이 이용됩니다.

 

 

 

ps. 통계를 하기전에, 실험을 하기 전에 고려해야 할 사항

 

1. 통계를 하는 목적은 정보를 추출하기 위해서입니다.

 

통계자체가 목적은 아닌것이죠.

 

따라서 통계를 한 후 그 결과를 어떻게 해석할 것인가 하는 것은 중요한 내용입니다.

 

 

2. 어떤 연구에서는 어떤 특별한 통계방법만을 해야 한다라는 법칙은 없습니다.

 

통계의 목적이 정보의 추출이라는 점을 상기한다면,

 

어떤 연구 데이타에서 최대한 정보를 얻어내는 것이 필요합니다.

 

, 연구자는 다양한 통계방법을 이용하여 데이타에 숨어 있는 의미, 즉 정보를

 

추출합니다.

 

기본적으로 평균이나 분산, 표준편차 등이 얻어질 것이고,

 

상관분석이나, 요인분석, 판별분석 등도 진행할수 있습니다.

 

보다 많은 정보는 인과분석에서 얻어집니다.

 

 

현상계 연구에서 핵심적 요소는 바로 원인과 결과의 관계의 규명에 있다할수 있습니다.

 

처음엔 정성적인 관계에 집중하게 되지만

 

결국 예측과 그것에 근거하여 통제를 하려한다면

 

정량분석을 하게 됩니다.

 

 

이 과정에서 가장 널리 쓰이는 분석방법은 단순회귀분석입니다.

 

이보다 많은 정보는 다중회귀를 통해 얻을 수 있으며

 

경로분석은 다중회귀를 넘어선 보다 고급정보를 얻게 합니다.

 

 

현상세계의 관찰과 측정을 통해 얻어지는 관찰변수들의 데이타를 통해서

 

보다 추상적인 개념들을 도출하고 이들간의 인과관계를 추출해 내는 통계방법은

 

구조방정식입니다.

 

 

 

3. 데이타를 구조방정식을 통하여 분석할 계획이라면

 

데이타의 형식에 대해 고려해야 할 필요가 있습니다.

 

왜냐하면 원인변수들이 categorical variables일 경우에

 

구조방정식으로 분석하기 어렵기 때문입니다.

 

따라서 원인 관찰변수를 가능하면 continuous variables로 얻을 수 있도록 합니다.

 

또다른 방법은 요인분석을 하여 요인들간의 관계를 추정하는 방법이

있습니다.

 

 

대개의 연구에서 사지선다형의 명목변수나 연속형의 점수나

 

분석하면 거의 비슷한 결과가 나옵니다.

 

따라서 보다 고급정보를 추출하고자 하는 연구자는

 

연속변수로 데이터를 얻을 수 있도록 설문지나 실험을 설계하는 것이 좋습니다.

 

 

그리고 경로분석이나 구조방정식을 하기 위한 연구자는

 

샘플의 수가 최소 50이상 대략 100개 내지 200개 정도를 권장합니다.

 

그리고 샘플들의 분산이 최소화할수록 유의미한 데이타를 얻게 됩니다.

 

예를 들자면 남녀노소를 섞은 그룹보다는

 

30대 남성 그룹이 보다 분산이 작게 되고,

 

보다 정확한 값이 나오고 해석이 분명하게 됩니다.

  

번호 제목 글쓴이 날짜 조회 수
4 샘플 그룹 만들기의 중요성 서울논문 05-25 969
3 엔트로피와 인과설정 서울논문 08-28 1297
2 통계는 도구입니다. 때로는 결정적이고, 매우 중요한.... 서울논문 08-28 1073
열람중 데이타 입력하는 방법 서울논문 08-07 2791

대표:이광조ㅣ사업자등록번호: 643-09-02202ㅣ대표전화: 02-715-6259ㅣ서울시 용산구 효창원로 188