기브스 표집 문서 원본 보기
←
기브스 표집
둘러보기로 이동
검색으로 이동
문서 편집 권한이 없습니다. 다음 이유를 확인해주세요:
요청한 명령은 다음 권한을 가진 사용자에게 제한됩니다:
사용자
.
문서의 원본을 보거나 복사할 수 있습니다.
{{위키데이터 속성 추적}} '''기브스 표집'''(Gibbs sampling)은 두개 이상의 [[확률 변수]]의 [[결합 확률 분포]]로부터 일련의 표본을 생성하는 [[확률적 알고리즘]]으로, 결합 확률 분포나 그에 관련된 확률 계산을 근사하기 위해 사용된다.<ref>{{저널 인용|저자=George Casella, Edward I. George|제목= Explaining the Gibbs sampler|저널=The American Statistician'}}</ref> 기브스 표집은 [[메트로폴리스-해스팅스 알고리즘]]의 특별한 예이고, 따라서 [[마르코프 연쇄 몬테 카를로]] 알고리즘의 한 예이다. 이 알고리즘은 물리학자 [[조사이어 윌러드 기브스]]의 이름을 따서 명명되었다. == 알고리즘 == <math>n</math>개의 확률변수 <math>(X_1, \cdots, X_n)</math>의 결합 확률 분포 <math>p(x_1, \cdots, x_n)</math>로부터 <math>k</math>개의 표본 <math>X</math>를 얻으려고 할 때, 기브스 표집은 다음과 같이 동작한다. # 임의의 <math>X^{(0)} = (x_1^{(0)}, \cdots, x_n^{(0)})</math>을 선택한다. # 각 변수 <math>x_1, \cdots, x_n</math>에 대하여, 현재의 값을 기반으로 한 새로운 값을 조건부 확률분포 <math>p(x_i^{(t)}|x_1^{(t)}, \cdots, x_{i-1}^{(t)}, x_{i+1}^{(t-1)}, \cdots, x_{n}^{(t-1)})</math>에서 표집한다. # <math>X^{(t)} = (x_1^{(t)}, \cdots, x_n^{(t)})</math>를 <math>X</math>에 추가한다. 실제 사용 시에는 처음 수집되는 표본을 사용하지 않고 버리게 된다. 이것은 기브스 표집에서 수집되는 표본은 서로 독립적이지 않고 [[마르코프 연쇄]]에 속하기 때문인데, 표본의 앞 부분은 초기 상태 <math>X^{(0)}</math>에 크게 의존하지만 충분히 많은 시행이 지난 후에는 초기 상태에 관계없이 <math>p</math>에 기반한 표본을 수집할 수 있다. ===조건부 확률분포와 결합 확률분포의 관계=== 위의 조건부 확률분포는 결합 확률분포에 비례한다. :<math>p(x_j|x_1,\dots,x_{j-1},x_{j+1},\dots,x_n) = \frac{p(x_1,\dots,x_n)}{p(x_1,\dots,x_{j-1},x_{j+1},\dots,x_n)} \propto p(x_1,\dots,x_n)</math> == 수학적 배경 == 기브스 표집에서 주어진 표본 <math>x</math>에 대하여, <math>i</math>번째 변수를 변경하여 다음 표집 <math>y</math>을 수집할 확률은 다음과 같다. :<math>\Pr(x|y) = \begin{cases} \frac{p(y)}{\sum_{z \in \Theta: z \sim_i x} p(z) } & x \sim_i y \\ 0 & \text{otherwise} \end{cases}</math> 여기에서 <math>\Theta</math>는 모든 가능한 표본의 집합을 의미하며, <math>x \sim_i y</math>는 <math>x</math>와 <math>y</math>가 i번째를 제외한 모든 값이 같다는 것을 의미한다. 이때 다음의 성질이 성립한다. :<math>p(x) \Pr(y|x) = p(y) \Pr(x|y)</math> 이러한 성질은 변수를 하나만 변경하는 것이 아니라 각 변수를 차례대로 변경하여 <math>x^{(t-1)}</math>에서 <math>x^{(t)}</math>를 얻을 때에도 동일하게 보존된다. 이때 <math>\Theta</math>와 위의 표집 확률을 기반으로 하는 [[마르코프 연쇄]]를 구성하면, 이 마르코프 연쇄는 [[가역적 마르코프 연쇄|가역적]](reversible)이다. 가역적 성질은 정상(stationary) 성질을 포함하는데, 이것은 표본을 연속적으로 수집할 때 표본의 수집 확률은 초기 표본에 관계없이 <math>p</math>에 수렴한다는 것을 의미한다. == 단점 == 기브스 표집은 변수를 하나씩 바꾸어가며 표본을 수집하기 때문에, 중간 상태의 확률이 작을 경우 올바른 근사를 위해 많은 표본이 필요하다는 단점이 있다. 가령 0과 1의 두 값을 갖는 변수 두 개에 대한 확률 분포 <math>p(x_1, x_2)</math>에 대하여, <math>p(x_1=0, x_2=0)</math>과 <math>p(x_1=1, x_2=1)</math>의 값은 높지만 <math>p(x_1=0, x_2=1)</math>과 <math>p(x_1=1, x_2=0)</math>의 값이 작을 경우, <math>(0,0)</math>에서 <math>(1,1)</math>를 표집하기 위해서는 <math>(0,1)</math>이나 <math>(1,0)</math>을 먼저 지나쳐야 하지만 이들의 확률이 작기 때문에 표본이 적을 경우 잘 표집되지 않을 수 있다.<ref>{{저널 인용|저자=Radford M. Neal|제목 = Suppressing Random Walks in Markov Chain Monte Carlo Using Ordered Overrelaxation|연도=1995|url=http://arxiv.org/abs/bayes-an/9506004}}</ref> 특히 <math>p(x_1=0, x_2=1)</math>과 <math>p(x_1=1, x_2=0)</math>이 0일 때에는 표집이 불가능한데, 이것은 기브스 표집이 가정하는 마르코프 연쇄의 정상 성질이 깨지기 때문이다. == 둘러보기 == * [[기브스 상태]] * [[표집 (통계)]] * [[오픈벅스]] (소프트웨어 패키지) == 참고 문헌 == <references/> {{전거 통제}} [[분류:몬테카를로 방법]] [[분류:표집]]
이 문서에서 사용한 틀:
틀:위키데이터 속성 추적
(
원본 보기
)
틀:저널 인용
(
원본 보기
)
틀:전거 통제
(
원본 보기
)
기브스 표집
문서로 돌아갑니다.
둘러보기 메뉴
개인 도구
로그인
이름공간
문서
토론
한국어
보기
읽기
원본 보기
역사 보기
더 보기
검색
둘러보기
대문
최근 바뀜
임의의 문서로
미디어위키 도움말
특수 문서 목록
도구
여기를 가리키는 문서
가리키는 글의 최근 바뀜
문서 정보