스튜던트 t 분포

testwiki
imported>TedBot님의 2024년 5월 18일 (토) 11:18 판 (봇: 문단 이름 변경 (참고 문헌 → 각주))
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)
둘러보기로 이동 검색으로 이동

틀:위키데이터 속성 추적 틀:확률분포 정보 스튜던트 t 분포(Student t分布, 틀:Llang)는 정규 분포의 평균을 측정할 때 주로 사용되는 분포이다.

정의

스튜던트 t 분포는 다음 확률변수의 분포로 정의된다.

ZV/ν

여기에서 Z표준정규분포, V자유도 ν카이제곱 분포이다.

t 분포는 종모양으로서 t=0에서 좌우대칭을 이룬다. t 분포의 모양을 결정하는 것은 자유도이며, 자유도가 커질수록 표준정규분포에 가깝게 된다.[1]틀:Rp

정규분포에서의 추정

어떤 정규분포의 평균μ이고 분산σ2일 때, 그 분포에서 n개의 표본을 추출한 것을 X1,,Xn라고 표기한다. 표본평균과 표본분산은 다음과 같다.

X=1n(X1++Xn)
S2=1n1i=1n(XiX)2

이 값들은 실제 평균과 분산에 대한 불편추정값이다. 이때,

V=(n1)S2σ2

은 자유도가 n1카이제곱 분포가 된다는 것이 Cochran 정리에 의해 알려져 있다. 또한

Z=(Xμ)nσ

는 평균이 0이고 분산이 1인 정규분포를 가지며, V,Z는 서로 독립이라는 것을 증명할 수 있다.

이때 Z에서 σ2 대신 S2로 대체한 추축량(pivot quantity)은 다음과 같다.

TZV/ν=(Xμ)nS

이때 T에는 σ2가 사용되지 않으므로, 이 분포는 분산을 모를 때의 평균값 μ를 추정하는 데에 사용이 가능하다. 이때 T의 분포는 자유도 n-1인 t-분포가 된다.

구간 추정

자유도 n-1인 t 분포 T에 대해,

Pr(A<T<A)=0.9

을 만족하는 실수 A는 수치적으로 계산이 가능하다. 이때,

Pr(A<T<A)=Pr(A<XμS/n<A)=Pr(XnASn<μ<X+ASn)=0.9

이므로, 정규분포의 평균은 90%의 신뢰도로 X±ASn 신뢰구간에 속하게 된다.

역사

프리드리히 로베르트 헬메르트(틀:Llang)가 1875년에 도입하였다.[2][3][4][5] 이듬해 야코프 뤼로트(틀:Llang)도 같은 분포를 재발견하였다.[6][7] 그러나 헬메르트와 뤼로트의 논문은 영문 학계에 널리 알려지지 않았다.

1908년에 윌리엄 고셋이 "스튜던트"(틀:Llang, ‘학생’)라는 필명으로 1908년 재발견하였다.[8] 고셋은 기네스 양조 공장에서 일했고, 맥주에 사용되는 보리의 질을 시험하기 위해 이 분포를 도입하였고, 경쟁사들에게 기네스의 획기적인 통계 기법을 숨기기 위해 필명을 사용하였다고 한다.[9]틀:Rp 이후 저명한 통계학자인 로널드 피셔는 이 분포를 "스튜던트 분포"라고 불렀고, t라는 기호를 사용하였다.[10] 피셔 이후 이 분포는 고셋의 필명을 따 "스튜던트 t 분포"로 알려지게 되었다.

각주

틀:각주

같이 보기

틀:확률분포