본문 바로가기
STUDY (공부)/STATISTICS (통계)

통계학과 정규분포

by phd.갖고싶은자 2021. 1. 6.

정규분포

 

정규분포(normal distribution) - 가우스분포 - C. Gauss(1777-1855) : 물리학 실험 시 수반되는 계측오차에 대한 확률분포로서, 가우스 분포(Gauss distribution)라 불리우는 연속확률분포를 제안 - 물리학 뿐만 아니라 다른 모든 학문 분야에서도 확률모형으로 또는 근사적 확률모형으로 적용되었으며 통계학의 초기 발전단계에서는 모든 자료의 기둥그래프가 이 분포의 곡선과 같은 형태여야만 옳고, 그렇지 않은 경우에는 자료의 수집 과정에 잘못이 있다고 믿었다. 이러한 이유로 이 분포에정규(normal)”라는 이름을 붙임. - 정규분포(normal distribution)는 통계적 추론의 중추적 역할을 하고 있다.

정규분포를 통해 알 수 있는 것은 가장 많이 관찰되는 값이 평균값인 동시에 중앙값이고 그 값을 중심으로 일정 범위 내에 대부분의 자료가 존재

: 어느 회사에서 생산된 형광등의 수명이 평균 1500시간, 표준편차 150시간인 정규분 포를 따를 때 각 구간에 포함되는 제품의 비율은 다음과 같다.  ±      사이에 68.3%  ±      사이에 95.4%  ±      사이에 99.7% , 를 알면 분포의 모양에 대한 정보를 갖고 있는 셈이다. ⑥     일 때,       ∼  : 표준정규분포정규분포의 특징 a. 종형(bell-shaped) b. 평균()에 대하여 좌우대칭 (에서 높이가 최대 ) c. 분산(  )값에 따라 산포도가 결정

 

) 대통령 선거에서 전국 유권자 중 1,000명을 뽑아 선거결과를 예측한다. 여론조사는 같은 시점에 실시하더라도 조사회사별로 다르다. 여론조사 결과가 달라지는 것은 모집단에서 뽑은 표본이 다르기 때문이다. 따라서 표본평균, 표본비율은 변동한다. - 통계량 : 표본평균, 표본비율과 같이 표본으로부터 얻은 특성값을 계산 - 표본분포 : 통계량의 분포 - 표본평균과 표본비율의 분포는 표본크기가 증가함에 따라 원래 모집단의 분포와 관계없이 정규분포에 근접함중심극한정리

- 표본수가 일정 수 이상이면 표본평균과 표본비율은 정규분포를 바탕으로 분석해도 됨

 

중심극한정리(Central limit theorem) 동일한 분포 (모평균 , 모분산   ) 에서 독립적으로 뽑은 크기인 임의표본의 표본평균  는 표본수가 커짐에 따라 정규분포를 따른다.(표본크기이 충분히 클 때 근사적으로 정규분포를 따른다.( )) ① 표본평균 의 평균은 모집단의 평균과 같으며 표본의 크기이 클수록 그 분산이 0에 가까워져서, 결국 표본의 크기가 클 때 는 모집단의 평균인근처에 밀집되어 분포정규분포가 통계학적 추론에서 중추적 역할을 하는 이유 : 모집단의 분포가 이산형, 연 속형, 비스듬하게 치우친 형태와 상관없이, 표본의 크기가 클 때 표본평균 X의 분포는 근사적으로 정규분포가 된다

 

 

불확실한 확률

 

엘즈버그 패러독스 : (다니엘 엘즈버그의 실험) 항아리를 하나 골라서 공의 색깔을 맞추면 상금을 받는다. 여러분은 어떤 항아리를 선택할 것인가? - 항아리 1 : 빨강공 50 + 검정공 50 = 100 - 항아리 2 : 빨강공 + 검정공 = 100 - 사람들은 빨강공 50, 검정공 50개의 공이 들어있는 첫 번째 항아리를 선택

사람들은 두 번째 항아리에서 극단적인 경우 빨강공이 하나도 없을 때를 상정하여 이 항아 리를 선택하지 않음이 실험을 통해 알 수 있는 것은 사람들은 불확실한 리스크를 싫어함 - 어떤 일에 정보가 부족한 경우 사람들은 여러 가지 상상을 만들어서 최악의 경우를 회피 하는 결정을 함.

댓글