본문 바로가기
STUDY (공부)/STATISTICS (통계)

통계학과 범주형 자료

by phd.갖고싶은자 2021. 1. 7.

범주형 자료의 요약

 

범주형 자료에서는 각 범주가 나타나는 횟수를 요약함으로써 개요를 파악할 수 있다.

 

 

(1) 도수분포표 (Frequency Table) 도수(frequency): 각 범주에 속하는 관측값의 개수 상대도수(relative frequency): 도수를 자료의 전체개수로 나눈 비율 도수분포표(frequency table): 범주와 그 범주에 대응하는 도수와 상대도수를 나열하여 표로 작성한 것

() 어느 콩밭에서 60개의 콩깍지를 임의로 추출하여 각 깍지에서의 콩의 개수를 세어 얻어진 자료를 이용하여 도수분포표를 만들었다. 4, 3, 4, 1, 5, 5, ……… 4 콩의 개수 도수 상대도수 1 2 0.033 2 4 0.067 3 21 0.350 4 18 0.300 5 10 0.167 6 5 0.083 60 1.000

변수1 (ex. ) 변수2 (ex. 성별) … 변수k (ex. 학점) 표본추출단위1 165 M … A 표본추출단위2 180 F … B … … … … … … … … … … 표본추출단위n 170 M … C

 

 

(2) 원형그래프 (Pie Chart) 원에 각 범주의 상대도수에 비례하게 중심각을 나누어 그린 그림

) 100명의 40대 남성의 나이 (-> 수치 자료 중 이산형 자료) i) 각 범주 또는 몇 개의 범주가 전체에서 차지하는 비율을 한눈에 알 수 있다. ii) 범주간의 도수를 비교하거나 도수 크기의 차이를 파악하기 어렵다. => 도수나 상대도수를 기입하기도 한다.

 

 

(3) 막대그래프 (Bar Chart) 수평축에 서로 다른 특성값을 배열하고, 막대높이가 상대도수나 도수에 비례하도록 막대를 그린 그래프로 각 범주간의 도수를 비교하는데 용이하다 정보사회의통계활용 - 4 - 2.4 이산형 자료의 요약 관측값의 종류가 적은 경우에는 범주형 자료를 요약하는 기법을 이용하고, 많을 경우에는 뒤에 서 배울 연속형 자료를 요약하는 기법을 사용하게 된다.

() 어느 콩밭에서 60개의 콩깍지를 임의로 추출하여 각 깍지에서의 콩의 개수를 세어 다음과 같이 기록하였다. 4, 3, 4, 1, 5, 5, ……… 4 -> 표본? 표본의 크기? 추출단위? 변수? 변수의 형태? (모집단?) -> 도수분포표, 원형그래프, 막대그래프 등의 표나 그림을 통해, 특성값들이(깍지당 콩의 개수) 흩어진 상태를 알 수 있다. (원데이터만으로

는 파악하기 힘들다)

댓글