본문 바로가기
STUDY (공부)/STATISTICS (통계)

통계학을 통한 자료의 요약

by phd.갖고싶은자 2021. 1. 6.

표와 그림을 통한 자료의 요약

 

자료가 주어질 때, 특히 자료가 방대하여 한 눈에 쉽게 알아볼 수 없을 때에는 자료에 내포된 내 용을 쉽고 빠르게 파악할 수 있도록 자료를 정리, 요약할 필요가 있다.

자료(data)의 형태 (or 변수의 형태) 자료의 형태에 따라 요약하는 방법이 달라지게 된다.

 

(1) 수치자료(numerical data), 양적자료(quantitative data) : 수치로 관측되며, 관측값은 양(quantity)을 나타냄. i) 연속형 자료(continuous data): 관측 가능한 값이 연속인 자료 (, 몸무게) ii) 이산형 자료(discrete data): 관측 가능한 값이 셀 수 있는 자료 (교통사고건수)

(2) 범주형자료(categorical data), 질적자료(qualitative data) : 몇 개의 범주 또는 항목의 형태로 관측되며, 관측값은 질적속성을 나타냄. i) 순위형 자료(ordinal data): 범주간에 순서의 의미가 있는 자료 (학점(A,B,C,D,F), 선호도(나쁨:보통:좋음)) ii) 명목형 자료(nominal data): 범주간에 순서의 의미가 없는 자료 (혈액형, 성별) (※ 연속적이다 -> 어떤 구간안의 임의의 값을 다 가질 수 있다.)

 

참고: ① 연속형 자료라 할지라도 기록의 편리함이나 측정기구의 한계 때문에 실제로는 이산형 인 값을 갖게 된다. (. : 주로 자연수의 값만 가짐. 하지만, 연속형이다. ) ② 숫자로 표현된다고 다 수치 자료인 것은 아니다. ③ 수치 자료가 범주형 자료로 변환되어 사용되기도 한다.

 

 

수집된 자료는 관심의 대상이 되는 특성을 측정 또는 관측한 결과인데, 이와 같이 관측되어지 는 특성을 변수(variable)라고 한다. ● 관측되어지는 특성, 즉 변수의 관측결과가 수치냐, 범주냐? 연속적이냐, 이산적이냐? 범주간 에 순서적 의미가 있느냐, 없느냐? -> 변수의 형태

수치 변수 (numerical var.) 연속형 변수 (continuous var.) 이산형 변수 (discrete var.) 순위형 변수 (ordinal var.) 명목형 변수 (nominal var.) 범주형 변수 (categorical var.) ※ 자료는 대개의 경우 표본이고, 가끔 모집단인 자료도 있다. () 모집단인 자료 - 인구총조사(census : 전수조사)에서한국인의 연령의 자료

 

 

원데이터(raw data)의 대개의 모양

변수1 (ex. ) 변수2 (ex. 성별) … 변수k (ex. 학점) 표본추출단위1 165 M … A 표본추출단위2 180 F … B … … … … … … … … … … 표본추출단위n 170 M … C

댓글