대학원/간호통계

간호통계 (데이터 핸들링)

행복한 원지를 위해 2022. 9. 18. 09:00

[데이터 핸들링]

1. 엑셀에 코딩  -> 엑셀데이터를 SPSS로 불러오기 

- 파일 - 열기 - 데이터 - 데이터 첫 행에서 변수 이름 읽어오기(체크)

 

2. 변수 정의  -> 변수명 정의, 변수값 정의, 결츠치 확인 등

1) 일반적 특성 - 범주형 -> 값설정 O / 연속형 -> 값설정 X

2) 결측치 - 체크안된 설문지(보통 '9', '99', '999' 로 표현), 없으면 '없음'

 

3. 잘못 입력된 자료가 없는지 확인작업하기

1) 기술통계 

  • 모든 자료 이름 불러와서 확인
  • 최소값 ~ 최대값
  • 나올 수 없는 숫자인지 확인
  • 데이터에서 확인 후 수정 <찾기>

4. 데이터 변환

1) 변수 계산 -> 평균의 계산

  • 모든 중요한 변수 -> 평균으로 계산해놔야 함!
  • 목표 변수 -> 이름 설정(임의로), 예) 윤리평균
  • 숫자표현 -> mean
  • 데이터 마지막에 데이터 나타남

2) 같은변수로 코딩변경

  • 역행된 질문들 (긍정, 부정 질문들) - 예) 윤리6, 윤리8 - 숫자변수 [같은 변수로 코딩 변경]
  • 기존값 -> 새로운 값 변경 - 예) 1->5, 2->4, 3->3, 4->2, 5->1
  • 계수 -> 확인 -> 데이터 확인

3) 다른변수로 코딩변경

  • 연속형 -> 범주형으로 변경 시 사용 - 예) 연령 : 24살, 23살 (X) -->  20대~, 30대~ (O) 
  • 연령 -> 연령대 (이름설계)
  • 기존값 

     -  [범위] () ~ (), 예) 30 thm 39 -> 2, 40 thm 49 -> 3

     - [최솟값], 예) Lowest thm 29 -> 1

     - [최고값], 예) 50 thm highest -> 4

     - 새로운 값 [값] , 1,2,3,4...

  • 값 레이블 (변수) 예시)
기준값   레이블
1 --> 20대
2 --> 30대
3 --> 40대
4 --> 50대 이상
  • 범주형만!!  -> (해당셀)  -> 빈도분석  n/%

    - 결측치 O -> 빈도, 유효퍼센트 사용하기!

    - 한셀에 30명 이상 이되어야 함

    - 보통 2개의 셀이 30명 이상, 1개의 셀이 10명 이상이어도 허용됨..

  • 확인 후 다시 변경

    - [코딩변경], [값레이블] 변경

 

* 이름은 같을 수 없다 -> 윤리1, 윤리2.... 이런식으로 엑셀 이용해서 설정하기

* 숫자는 앞에 오면 안됨!

* 띄어쓰기 안됨! (윤리1 O / 윤리 1 X)

 


<예시>

 

1. 연구의 목적

1) 대상자의 일반적 특성을 파악한다.

2) 대상자의 요인1, 요인2, 요인3 정도를 파악한다.

3) 대상자의 일반적 특성에 따른 요인3간의 차이를 파악한다.

4) 대상자의 요인1, 요인2, 요인3 간의 상관관계를 파악한다.

5) 대상자의 요인3에 영향하는 요인을 파악한다.

 

2. 자료분석방법

본 연구에서 수집된 자료은 SPSS 프로그램을 이용하여 통계분석하였다.

1) 대상자의 일반적 특성은 N, %, 평균, 표준편차, 최소값, 최대값, 왜도, 첨도로 산출하였다.

2) 대상자의 요인1, 요인2, 요인3정도는 평균, 표준편차, 최소값, 최대값, 왜도, 첨도로 산출하였다.

3) 대상자의 일반적 특성에 따른 요인3간의 차이는 독립표본 t-test, ANOVA로 분석하였고, 사후 검정은 Scheffe'로 분석하였다.

4) 대상자의 요인1, 요인2, 요인3 간의 상관관계는 pearson's correlation coefficient로 분석하였다.

5) 대상자의 요인3에 영향하는 요인을 파악하기 위해 다중회귀분석(multiple regression)을 실시하였으며 변수의 선택방법은 단계적(stepwise) 방법을 사용하였다.

 

빈도분석  기술통계