카이제곱 분포

testwiki
둘러보기로 이동 검색으로 이동

틀:위키데이터 속성 추적 틀:확률분포 정보 카이제곱 분포(χ제곱分布, 틀:Llang) 또는 χ2 분포k개의 서로 독립적인 표준정규 확률변수를 각각 제곱한 다음 합해서 얻어지는 분포이다. 이 때 k자유도라고 하며, 카이 제곱 분포의 매개변수가 된다. 카이 제곱 분포는 신뢰구간이나 가설검정 등의 모델에서 자주 등장한다.

카이 제곱 분포는 감마 분포의 특수한 형태로 감마 분포에서 k=ν/2, θ=2인 분포를 나타낸다.

f(x;k)=12k/2Γ(k/2)xk/21ex/2𝟏{x0}

정의

양의 정수 k가 주어졌다고 하고, k개의 독립적이고 표준정규분포를 따르는 확률변수 X1,,Xk를 정의하자.

그렇다면 자유도 k의 카이 제곱 분포확률변수

Q=i=1kXi2

의 분포이다. 즉, Qχk2이다.

성질

카이 제곱 분포의 확률밀도함수는 다음과 같다.

f(x;k)=12k/2Γ(k/2)xk/21ex/2𝟏{x0}

여기에서 Γ(k/2)감마 함수이다.

누적분포함수는 다음과 같다.

F(x;k)=γ(k/2,x/2)Γ(k/2)=P(k/2,x/2)

여기에서 γ(s, x)하부 불완전 감마 함수이다.

비대칭도8/k, 첨도12/k이다. 따라서 k가 충분히 크지 않은 경우 카이 제곱 분포를 중심극한정리를 통해 곧바로 정규분포로 근사하는 것은 오차가 많이 발생한다. 그 대신, 다른 방식의 근사 방식이 제안되어 있다.

  • 로널드 피셔2χk2를 정규분포로 근사하는 방법을 제안했다. 이때 평균은 2k1, 분산은 1이 된다.
  • χk2/k3를 정규분포로 근사할 수 있다. 평균은 12/(9k), 분산은 2/(9k)가 된다.

참고 문헌

틀:각주

같이 보기

틀:확률분포

틀:전거 통제