표와 그림을 통한 자료의 요약
자료가 주어질 때, 특히 자료가 방대하여 한 눈에 쉽게 알아볼 수 없을 때에는 자료에 내포된 내 용을 쉽고 빠르게 파악할 수 있도록 자료를 정리, 요약할 필요가 있다.
자료(data)의 형태 (or 변수의 형태) 자료의 형태에 따라 요약하는 방법이 달라지게 된다.
(1) 수치자료(numerical data), 양적자료(quantitative data) : 수치로 관측되며, 관측값은 양(quantity)을 나타냄. i) 연속형 자료(continuous data): 관측 가능한 값이 연속인 자료 (키, 몸무게) ii) 이산형 자료(discrete data): 관측 가능한 값이 셀 수 있는 자료 (교통사고건수)
(2) 범주형자료(categorical data), 질적자료(qualitative data) : 몇 개의 범주 또는 항목의 형태로 관측되며, 관측값은 질적속성을 나타냄. i) 순위형 자료(ordinal data): 범주간에 순서의 의미가 있는 자료 (학점(A,B,C,D,F), 선호도(나쁨:보통:좋음)) ii) 명목형 자료(nominal data): 범주간에 순서의 의미가 없는 자료 (혈액형, 성별) (※ 연속적이다 -> 어떤 구간안의 임의의 값을 다 가질 수 있다.)
참고: ① 연속형 자료라 할지라도 기록의 편리함이나 측정기구의 한계 때문에 실제로는 이산형 인 값을 갖게 된다. (예. 키 : 주로 자연수의 값만 가짐. 하지만, 연속형이다. ) ② 숫자로 표현된다고 다 수치 자료인 것은 아니다. ③ 수치 자료가 범주형 자료로 변환되어 사용되기도 한다.
● 수집된 자료는 관심의 대상이 되는 특성을 측정 또는 관측한 결과인데, 이와 같이 관측되어지 는 특성을 변수(variable)라고 한다. ● 관측되어지는 특성, 즉 변수의 관측결과가 수치냐, 범주냐? 연속적이냐, 이산적이냐? 범주간 에 순서적 의미가 있느냐, 없느냐? -> 변수의 형태
수치 변수 (numerical var.) 연속형 변수 (continuous var.) 이산형 변수 (discrete var.) 순위형 변수 (ordinal var.) 명목형 변수 (nominal var.) 범주형 변수 (categorical var.) ※ 자료는 대개의 경우 표본이고, 가끔 모집단인 자료도 있다. (예) 모집단인 자료 - 인구총조사(census : 전수조사)에서 ‘한국인의 연령’의 자료
원데이터(raw data)의 대개의 모양
변수1 (ex. 키) 변수2 (ex. 성별) … 변수k (ex. 학점) 표본추출단위1 165 M … A 표본추출단위2 180 F … B … … … … … … … … … … 표본추출단위n 170 M … C
'STUDY (공부) > STATISTICS (통계)' 카테고리의 다른 글
통계학의 수치를 통한 연속형 자료 (0) | 2021.01.07 |
---|---|
통계학과 범주형 자료 (0) | 2021.01.07 |
통계학과 정규분포 (0) | 2021.01.06 |
통계학으로 본 복권과 확률 (0) | 2021.01.05 |
통계학의 관점에서 본 O.J심슨 재판과 기대수명 (0) | 2021.01.05 |
댓글