본문 바로가기

STUDY (공부)/STATISTICS (통계)29

표본크기와 통계 정확성 표본크기가 크기만 하면 언제나 정확한 결과를 얻을 수 있는가? ● 여론조사에서 표본크기 o 여론조사 결과의 정확도를 결정하는 중요한 요소 o 표본크기가 작더라도 정확한 경우 - c 새로운 나온 음료수의 맛 : 1병이면 충분 - 혈액 검사 : 5cc 채혈 ⇒ 모집단 내 조사단위가 동질적이고 랜덤추출하였다면 적은 수의 표본으로 정확한 조사 가능 ● 예 : 「리터러리 다이제스트(Literary Digest)」의 선거예측조사 ※ 표본크기가 크더라도 왜곡된 결과를 얻은 경우의 대표적인 예 o 미국의 선거여론조사(1936년 대선) : 루즈벨트(민주당)와 랜든(공화당)의 경합 - 「리터러리 다이제스트(Literary Digest)」 : 사상최대의 여론조사 실시(천만장의 설문지 회수된 약 240만장으로 분석 예측함) .. 2021. 1. 30.
통계학과 여론조사, ● 여론조사 - 국민 여론을 파악하기 위해서 수행 - 일반 대중의 의견을 알기 위해 응답자에게 설문지를 통해 질문하고 응답을 받음으로써 정보를 수집하는 방법 - 여론조사는 적은 비용과 짧은 시간안에 여론을 파악할 수 있는 유용한 도구 ● 여론조사의 정보 수집방법 o 총조사(census) 또는 전수조사 - 관심 대상 집단의 전체 구성원을 모두 조사하는 방법 - 국가의 중요한 정책수립을 기초자료 마련을 목적으로 함 - 엄청난 인력과 예산이 소요됨 - 조사자체가 방대하여 조사과정에 대한 관리가 어렵고 자료입력, 처리과정 등에 오류 발 생가능성이 높음 - 단순한 내용의 조사만 가능 - 예 : 인구 주택 총조사, 사업체 기초통계조사 o 표본조사(sample survey) - 관심 대상 집단에서 일부를 추출하여 조.. 2021. 1. 29.
여론조사와 선거에서의 통계학 ● 여론조사 - 신문, 방송과 인터넷을 통해서 다양한 여론조사의 결과를 접하는 시대 - 업무 또는 sns상에서 간단한 의견을 묻는 조사도 가능함 ● 몇가지 사례 1. 선거예측 여론조사 o 제16대 대통령 선거시 노무현 후보(민주당)와 정몽준 후보(국민통합21)가 여론조사를 통해 후보단일화 실시 - 여론조사 결과 노후보가 단일후보로 확정 - 여론조사 결과를 통해 대통령 후보 단일화를 이룬 전대미문의 사례 - 여론조사가 의사결정에 중요하고 결정적인 영향을 미칠수 있다는 점을 보여주는 사례 o 2007년 한나라당 대선후보 경선 당시에 이명박 후보는 선거인단 투표에서 박근혜 후보에 게 뒤졌지만 여론조사에서 높은 지지를 얻어 결과적으로 승리 o 여론조사 결과는 대통령 선거나 국회의원 선거의 당선예측뿐만 아니라 각.. 2021. 1. 28.
백분위수, 사분위수, 상자그림 통계학 ● 제 100× p백분위수 (the 100× p-th Percentile) (0 (np) 번째 값과 (np+1) 번째 값의 산술평균이 제 100*p 백분위수이다. (ii) np 가 정수가 아니면 -> np 의 정수부분에서 1을 더한 값 을 m 이라 두자. (m은 np 보다 큰 최소의 정수가 된다.) m 번째 관측값이 제 100*p 백분위수이다. 예제) n=15. p=0.50 p=0.20 31 35 37 38 38 38 39 40 40 41 42 43 44 45 78 ● 사분위수 (quartile) 와 사분위수범위 (Interquartile Range) 제 25 백분위수 를  으로 표기하고, 제 1 사분위수 (first quartile) 이라 한다. 제 50 백분위수  제 2 사분위수 (second.. 2021. 1. 28.
통계학에서의 평균과 중앙값 ※ 표본평균, 중앙값의 비교 표본평균은 가장 많이 쓰이는 중심위치의 측도이지만, 이상치에 민감하게 반응한다. 반면, 중앙값은 이상치에는 강하나 자료 전체를 이용하지 않는다. 따라서, 전체의 경향을 볼 때 극 단적인 관측값의 영향을 배제하고 싶으면 중앙값이 바람직하고, 전체 관측값을 모두 포함하 고 싶으면 평균을 사용하는 것이 바람직하다. ● 가중평균 - 자료에 경중의 차이가 있으며 필요에 따라 각 자료에 일정한 가중값을 곱하여 구함. ▶ 예 : 최초 망년회에서 0.6ℓ의 맥주, 2차에서 0.4ℓ의 소주, 3차에서 0.1ℓ의 위스키를 마 셨다고 가정하자. 맥주의 알코올 도수가 4%, 소주가 13%, 위스키가 43%일 때, 평균 알코올 도수는 몇 %인가 ? - 예제 : 어느 콩밭에서 60개의 콩깍지를 임의로.. 2021. 1. 8.
통계학의 수치를 통한 연속형 자료 수치를 통한 연속형 자료의 요약 데이터의 기술(description)" 내용과 관련 표나 그림으로 자료값들의 흩어진 상태를 시각적으로 빠르고 쉽게 전달할 수 있지만, 작성자에 따라 다를 수 있으므로 일관성과 객관성이 부족한 면이 있다. 반면, 몇 개의 의미 있는 수치만으로 방대한 자료값들이 흩어진 상태를 대략적으로 파악할 수 있다. 중심위치의 측도 (measure of center) : 평균 (Mean), 중앙값 (Median) 산포(퍼진 정도)의 측도 (measure of dispersion) : 분산 (Variance) or 표준편차 (Standard deviation), 사분위수 범위 (Interquartile Range) ※ 표본자료이면서, 연속형 자료인 n 개의 관측값들     ⋯.. 2021. 1. 7.
통계학과 범주형 자료 범주형 자료의 요약 범주형 자료에서는 각 범주가 나타나는 횟수를 요약함으로써 개요를 파악할 수 있다. (1) 도수분포표 (Frequency Table) 도수(frequency): 각 범주에 속하는 관측값의 개수 상대도수(relative frequency): 도수를 자료의 전체개수로 나눈 비율 도수분포표(frequency table): 범주와 그 범주에 대응하는 도수와 상대도수를 나열하여 표로 작성한 것 (예) 어느 콩밭에서 60개의 콩깍지를 임의로 추출하여 각 깍지에서의 콩의 개수를 세어 얻어진 자료를 이용하여 도수분포표를 만들었다. 4, 3, 4, 1, 5, 5, ……… 4 콩의 개수 도수 상대도수 1 2 0.033 2 4 0.067 3 21 0.350 4 18 0.300 5 10 0.167 6 5 0.. 2021. 1. 7.
통계학을 통한 자료의 요약 표와 그림을 통한 자료의 요약 자료가 주어질 때, 특히 자료가 방대하여 한 눈에 쉽게 알아볼 수 없을 때에는 자료에 내포된 내 용을 쉽고 빠르게 파악할 수 있도록 자료를 정리, 요약할 필요가 있다. 자료(data)의 형태 (or 변수의 형태) 자료의 형태에 따라 요약하는 방법이 달라지게 된다. (1) 수치자료(numerical data), 양적자료(quantitative data) : 수치로 관측되며, 관측값은 양(quantity)을 나타냄. i) 연속형 자료(continuous data): 관측 가능한 값이 연속인 자료 (키, 몸무게) ii) 이산형 자료(discrete data): 관측 가능한 값이 셀 수 있는 자료 (교통사고건수) (2) 범주형자료(categorical data), 질적자료(qual.. 2021. 1. 6.
반응형