디리클레 분포

testwiki
둘러보기로 이동 검색으로 이동

틀:위키데이터 속성 추적

다양한 α 값에 대한 3차원 디리클레 분포의 모습. 왼쪽 위에서부터 시계방향으로 α=(6, 2, 2), (3, 7, 5), (6, 2, 6), (2, 3, 4)이다.

디리클레 분포(Dirichlet distribution)는 연속 확률분포의 하나로, k차원의 실수 벡터 중 벡터의 요소가 양수이며 모든 요소를 더한 값이 1인 경우 (이를 k1차원 단체라고 한다)에 대해 확률값이 정의되는 분포이다.

디리클레 분포는 베이즈 통계학에서 다항 분포에 대한 사전 켤레확률이다. 이 성질을 이용하기 위해, 디리클레 분포는 베이즈 통계학에서의 사전 확률로 자주 사용된다.

분포

2 이상의 자연수 k와 양의 상수 α1,,αk에 대하여, 디리클레 분포의 확률 밀도 함수는 다음과 같이 정의된다. 실수값 x1,,xk가 모두 양의 실수이며 i=1kxi=1을 만족할 때

f(x1,,xk;α1,,αk)=1B(α)i=1kxiαi1

의 값을 가지며, 그 외의 경우는 0의 값을 가진다. 이때 α=(α1,,αk)이며, B(α)정규화 상수로서 다음의 값을 가진다.

B(α)=i=1kΓ(αi)Γ(i=1kαi) (Γ감마 함수)

디리클레 분포에서 k=2인 경우 베타 분포가 된다.

성질

사전 켤레확률

디리클레 분포 θDir(α)와 그에 대한 다항 분포 X|θMultinomial(θ)에 대하여, X가 주어졌을 때 θ사후 확률 θ|X는 다음과 같이 나타낼 수 있다.

θ|XDir(α+X)

즉, 디리클레 분포는 다항 분포에 대한 사전 켤레확률인 성질을 가지며, 사후 확률 분포는 α 벡터에 덧셈하는 것으로 계산이 가능하다.

같이 보기

틀:전거 통제