표본 분포

testwiki
둘러보기로 이동 검색으로 이동

틀:위키데이터 속성 추적 표본 분포(sampling distribution 또는 finite-sample distribution) 또는 표집분포는 크기 n의 확률 표본(random sample)의 확률 변수(random variable)의 분포(distribution)이다. 하나의 표본으로부터 계산된 통계량(statistic)은 여러가지가 있을 수 있으나 평균을 가장 많이 사용하므로 아래에서 평균을 사용한 표본 분포를 대표적으로 기술한다.

표본 평균의 분포

모집단에서 임의로 추출된 표본의 평균을 표본 평균이라고 하며 표본 평균도 그 값이 변하는 확률 변수인데 그 확률 분포표본 평균분포라고한다. 이 확률 분포로부터 표본 평균(X¯)들 간의 평균분산도 구할 수 있다. 이 분포에 대해 일반적으로 다음과 같은 사실이 알려지고 있다. 정규 분포 𝒩(μ,σ2)를 하는 모집단으로부터의 크기 n인 임의표본의 평균 X¯의 분포에 대하여

  • [1] E(X¯)=μ, V(X¯)=σ2n
  • [2] X¯의 분포는 X¯𝒩(μ,σ2n)이다.
  • [3] 모집단이 정규분포하지 않아도 n이 충분히 크면 위의 사실이 근사적으로 성립한다.

이것이 중심 극한 정리의 주요한 부분이며 이 정리에 의하면 모집단정규 분포를 따르지 않아도 이 분포는 정규 분포를 따른다. 이 것을 이용해 통계적 추론을 하게 된다. 표준 오차는 이 분포의 표준 편차이다.

이항 분포의 경우는 B(n,p)n이 충분히 커질 때(보통 np>5,nq>5일 때), 𝒩(np,npq)로 근사할 수 있다.

표집분포

특히 표집 분포(sampling distribution)은 연구 대상이 되는 모집단에서 다중 복수의 표본들을 추출한 자료들을 통해서 통계적 가설을 검증할 때 필요한 분포이다. 따라서 모집단으로부터의 충분한 여러 표집(sampling)에서 얻게되는 표본들의 표본평균들은 표집분포를 갖게되고 이 표집분포는 모집단의 분포에 수렴한다. 이러한 중심극한정리(cetral limit theorem)에서 표집분포의 평균값(μX)은 모집단의 평균값(μ)에 근사하게 된다.

μX=μ

표준오차

σX2=σ2n=σn=σX

표집오차(sampling error)는 모집단의 표준편차에 근사한다.

같이 보기

각주

틀:각주

외부 링크

틀:전거 통제 틀:토막글