본문 바로가기

전체 글49

통계학과 여론조사의 올바른 해석, 신뢰도 파악 응답자는 정말 진실만 말할까? - 선거철에 투표할 것인가? 라는 질문에 보통 투표에 참여하겠다라고 응답 - 투표의향을 묻는 조사 결과는 항상 실제 투표참여율보다 높음 - 투표의향을 묻는 여론조사 결과는 실제 투표참여율과 크게 차이가 날 수 있음 ( 예1) 제16대 대통령선거 투표율 예측조사 - 조사 결과 - 전국 성인 1,500명 조사 ⇒ 95% 신뢰수준에서 오차한계는 ±2.6%p 수준 - 사회적으로 바람직한 경향에 맞추어 응답하려는 경향으로 편향(bias) 발생 ( 예2) 흡연율 조사 - 고등학교 학생들의 흡연문제가 심각하여 고등학교 학생들을 대상으로 흡연경험 조사 - 조사결과, 전체의 13%가 흡관적으로 담배를 피운다고 대답 - 13%의 흡연율이 과연 고교생의 흡연율 추정에 타당할까? - 어떤 조사방.. 2021. 2. 3.
통계학과 즉석 여론조사 ● 즉석여론조사 사례 자기선택표본으로 인하여 문제가 발생하는 대표적인 사례의 하나가 TV토론이나 프로그램과 관련 하여 즉석에서 진행되는 즉석여론조사(instant poll)이다. TV 시청자들은 전화번호를 눌러 자신의 의견을 1번이나 2번을 눌러 찬성이나 반대 의견을 개진할 수 있다. TV 화면에는 실시간으로 조 사 참여자수와 지지 및 반대 비율이 보기 좋은 그래프와 함꼐 제시된다. o 조사결과는 전체유권자나 성인의 의견을 제대로 반영하지 못하고 있음 - 이 조사의 응답자는 TV와 전화를 보유, 해당 TV프로그램 시청, 즉석에서 진행되는 여론 조사에 대해 약간의 비용을 지불하고도 참여하여 자신의 의견을 개진할 만큼 이 조사에 대하여 충분하게 중요하다고 느끼고 있어야 함. - 조사결과를 전체 유권자 또는 .. 2021. 2. 1.
표본크기와 통계 정확성 표본크기가 크기만 하면 언제나 정확한 결과를 얻을 수 있는가? ● 여론조사에서 표본크기 o 여론조사 결과의 정확도를 결정하는 중요한 요소 o 표본크기가 작더라도 정확한 경우 - c 새로운 나온 음료수의 맛 : 1병이면 충분 - 혈액 검사 : 5cc 채혈 ⇒ 모집단 내 조사단위가 동질적이고 랜덤추출하였다면 적은 수의 표본으로 정확한 조사 가능 ● 예 : 「리터러리 다이제스트(Literary Digest)」의 선거예측조사 ※ 표본크기가 크더라도 왜곡된 결과를 얻은 경우의 대표적인 예 o 미국의 선거여론조사(1936년 대선) : 루즈벨트(민주당)와 랜든(공화당)의 경합 - 「리터러리 다이제스트(Literary Digest)」 : 사상최대의 여론조사 실시(천만장의 설문지 회수된 약 240만장으로 분석 예측함) .. 2021. 1. 30.
통계학과 여론조사, ● 여론조사 - 국민 여론을 파악하기 위해서 수행 - 일반 대중의 의견을 알기 위해 응답자에게 설문지를 통해 질문하고 응답을 받음으로써 정보를 수집하는 방법 - 여론조사는 적은 비용과 짧은 시간안에 여론을 파악할 수 있는 유용한 도구 ● 여론조사의 정보 수집방법 o 총조사(census) 또는 전수조사 - 관심 대상 집단의 전체 구성원을 모두 조사하는 방법 - 국가의 중요한 정책수립을 기초자료 마련을 목적으로 함 - 엄청난 인력과 예산이 소요됨 - 조사자체가 방대하여 조사과정에 대한 관리가 어렵고 자료입력, 처리과정 등에 오류 발 생가능성이 높음 - 단순한 내용의 조사만 가능 - 예 : 인구 주택 총조사, 사업체 기초통계조사 o 표본조사(sample survey) - 관심 대상 집단에서 일부를 추출하여 조.. 2021. 1. 29.
여론조사와 선거에서의 통계학 ● 여론조사 - 신문, 방송과 인터넷을 통해서 다양한 여론조사의 결과를 접하는 시대 - 업무 또는 sns상에서 간단한 의견을 묻는 조사도 가능함 ● 몇가지 사례 1. 선거예측 여론조사 o 제16대 대통령 선거시 노무현 후보(민주당)와 정몽준 후보(국민통합21)가 여론조사를 통해 후보단일화 실시 - 여론조사 결과 노후보가 단일후보로 확정 - 여론조사 결과를 통해 대통령 후보 단일화를 이룬 전대미문의 사례 - 여론조사가 의사결정에 중요하고 결정적인 영향을 미칠수 있다는 점을 보여주는 사례 o 2007년 한나라당 대선후보 경선 당시에 이명박 후보는 선거인단 투표에서 박근혜 후보에 게 뒤졌지만 여론조사에서 높은 지지를 얻어 결과적으로 승리 o 여론조사 결과는 대통령 선거나 국회의원 선거의 당선예측뿐만 아니라 각.. 2021. 1. 28.
백분위수, 사분위수, 상자그림 통계학 ● 제 100× p백분위수 (the 100× p-th Percentile) (0 (np) 번째 값과 (np+1) 번째 값의 산술평균이 제 100*p 백분위수이다. (ii) np 가 정수가 아니면 -> np 의 정수부분에서 1을 더한 값 을 m 이라 두자. (m은 np 보다 큰 최소의 정수가 된다.) m 번째 관측값이 제 100*p 백분위수이다. 예제) n=15. p=0.50 p=0.20 31 35 37 38 38 38 39 40 40 41 42 43 44 45 78 ● 사분위수 (quartile) 와 사분위수범위 (Interquartile Range) 제 25 백분위수 를  으로 표기하고, 제 1 사분위수 (first quartile) 이라 한다. 제 50 백분위수  제 2 사분위수 (second.. 2021. 1. 28.
통계학에서의 평균과 중앙값 ※ 표본평균, 중앙값의 비교 표본평균은 가장 많이 쓰이는 중심위치의 측도이지만, 이상치에 민감하게 반응한다. 반면, 중앙값은 이상치에는 강하나 자료 전체를 이용하지 않는다. 따라서, 전체의 경향을 볼 때 극 단적인 관측값의 영향을 배제하고 싶으면 중앙값이 바람직하고, 전체 관측값을 모두 포함하 고 싶으면 평균을 사용하는 것이 바람직하다. ● 가중평균 - 자료에 경중의 차이가 있으며 필요에 따라 각 자료에 일정한 가중값을 곱하여 구함. ▶ 예 : 최초 망년회에서 0.6ℓ의 맥주, 2차에서 0.4ℓ의 소주, 3차에서 0.1ℓ의 위스키를 마 셨다고 가정하자. 맥주의 알코올 도수가 4%, 소주가 13%, 위스키가 43%일 때, 평균 알코올 도수는 몇 %인가 ? - 예제 : 어느 콩밭에서 60개의 콩깍지를 임의로.. 2021. 1. 8.
통계학의 수치를 통한 연속형 자료 수치를 통한 연속형 자료의 요약 데이터의 기술(description)" 내용과 관련 표나 그림으로 자료값들의 흩어진 상태를 시각적으로 빠르고 쉽게 전달할 수 있지만, 작성자에 따라 다를 수 있으므로 일관성과 객관성이 부족한 면이 있다. 반면, 몇 개의 의미 있는 수치만으로 방대한 자료값들이 흩어진 상태를 대략적으로 파악할 수 있다. 중심위치의 측도 (measure of center) : 평균 (Mean), 중앙값 (Median) 산포(퍼진 정도)의 측도 (measure of dispersion) : 분산 (Variance) or 표준편차 (Standard deviation), 사분위수 범위 (Interquartile Range) ※ 표본자료이면서, 연속형 자료인 n 개의 관측값들     ⋯.. 2021. 1. 7.
반응형