피셔 정보 계량 문서 원본 보기
←
피셔 정보 계량
둘러보기로 이동
검색으로 이동
문서 편집 권한이 없습니다. 다음 이유를 확인해주세요:
요청한 명령은 다음 권한을 가진 사용자에게 제한됩니다:
사용자
.
문서의 원본을 보거나 복사할 수 있습니다.
{{위키데이터 속성 추적}} [[정보 기하학]]에서 '''피셔 정보 계량'''은<ref>{{저널 인용|제목=A Simple Approximation Method for the Fisher–Rao Distance between Multivariate Normal Distributions|저널=Entropy|성=Nielsen|이름=Frank|날짜=2023|권=25|호=4|쪽=654|arxiv=2302.08175|bibcode=2023Entrp..25..654N|doi=10.3390/e25040654|pmc=10137715|pmid=37190442}}</ref> 매끄러운 통계적 다양체, ''즉,'' [[확률 공간]]에서 정의된 확률 측도를 갖는 매끄러운 다양체에서 정의할 수 있는 특정 [[리만 다양체|리만 계량]]이다. 측정들 사이의 정보 차이를 계산하는 데 사용할 수 있다. 이 계량은 여러 측면에서 흥미롭다. Chentsov의 정리에 따르면 통계 모델의 피셔 정보 계량은 충분한 통계 하에서 불변인 유일한 리만 계량이다.<ref>{{서적 인용|제목=Methods of Information Geometry|성=Amari|이름=Shun-ichi|성2=Nagaoka|이름2=Horishi|연도=2000|출판사=Oxford University Press|위치=New York|쪽=37–40|장=Chentsov's theorem and some historical remarks|isbn=0-8218-0531-2}}</ref><ref>{{저널 인용|제목=Chentsov's theorem for exponential families|저널=Information Geometry|성=Dowty|이름=James G.|날짜=2018|권=1|호=1|쪽=117–135|arxiv=1701.08895|doi=10.1007/s41884-018-0006-4}}</ref> 이는 상대 엔트로피의 극소 형태(''즉'', [[쿨백-라이블러 발산]])로 이해될 수도 있다. 구체적으로는 발산의 [[헤세 행렬]]이다. 또는 변수를 적절하게 변경한 후 평평한 공간 [[유클리드 거리|유클리드 계량]]에 의해 유도된 계량으로 이해될 수도 있다. 복소 사영 힐베르트 공간으로 확장되면 [[푸비니-슈투디 계량]]이 된다. 혼합 상태로 표현하면 양자 Bures 계량이다. 순수하게 행렬로 보았을 때, [[피셔 정보|피셔 정보 행렬]]로 알려져 있다. 관측된 무작위 변수의 관점에서 숨겨진 매개변수를 추정하는 데 사용되는 측정 기술로 여겨지며 관측된 정보라고 한다. == 정의 == 좌표 <math>\theta=(\theta_1, \theta_2, \ldots, \theta_n)</math>가 주어진 통계적 다양체가 주어지면, 확률 밀도를 <math>\theta</math>의 함수 <math>p(x,\theta)</math>로 쓴다. 여기서 <math>x</math>는 (이산 또는 연속) [[확률 변수]] ''<math>X</math>''에 대한 값 공간 ''<math>R</math>''에서 추출된다. 확률은 <math>\int_R p(x,\theta) \,dx = 1</math>로 정규화된다. 여기서 <math>p(x,\theta)\,dx</math>는 <math>X</math>의 분포이다. 피셔 정보 계량은 다음과 같은 형식을 취한다. : <math> g_{jk}(\theta) = \int_R \frac{\partial^2 i(x,\theta)}{\partial \theta_j \,\partial \theta_k} p(x,\theta) \, dx = \mathrm{E} \left[ \frac{\partial^2 i(x,\theta)}{\partial \theta_j \,\partial \theta_k} \right]. </math> 적분은 ''<math>R</math>''의 모든 값 ''<math>x</math>''에 대해 수행된다. 변수 <math>\theta</math>는 이제 [[리만 다양체]]의 좌표이다. 이름표 ''<math>j</math>''와 ''<math>k</math>는'' 다양체의 국소 좌표축을 나타낸다. [[마르코프 연쇄|마르코프 과정]]에서와 마찬가지로, 확률이 깁스 측도에서 파생되면 <math>\theta</math>는 [[라그랑주 승수법|라그랑주 승수]]로 이해될 수도 있다. 라그랑주 승수는 어떤 수량의 [[기댓값|기대값]]을 일정하게 유지하는 것과 같은 제약 조건을 적용하는 데 사용된다. ''<math>n</math>''개의 서로 ''다른'' 기대값을 일정하게 유지하는 ''<math>n</math>개의'' 제약 조건이 있는 경우 다양체의 차원은 원래 공간보다 ''<math>n</math>'' 차원 더 작다. 이 경우 계량은 [[분배 함수 (확률론)|분배 함수]]에서 명시적으로 유도될 수 있다. 거기서 유도가 제시된다. [[정보 이론]]에서 <math>i(x,\theta) = -\log{}p(x,\theta)</math>로 대입하면 위 정의의 동등한 형식은 다음과 같다. : <math> g_{jk}(\theta) = - \int_R \frac{\partial^2 \log p(x,\theta)}{\partial \theta_j \,\partial \theta_k} p(x,\theta) \, dx. </math> 등식이 위의 정의와 동일하다는 것을 보여주기 위해 다음을 참고하라. : <math> \mathrm{E} \left[ \frac{\partial\log{}p(x,\theta)}{\partial \theta_j} \right]=0 </math> 이고, 양 변에 <math>\frac{\partial}{\partial\theta_{k}}</math>를 취한다. == 예 == 피셔 정보 계량은 [[지수족]]에 대해 특히 간단하다. <math display="block">p(x, \theta) = \exp\!\bigl[\ \eta(\theta) \cdot T(x) - A(\theta) + B(x)\ \bigr] </math> 계량은 다음과 같다. <math display="block">g_{jk}(\theta) = \frac{\partial^2 A(\theta)}{\partial \theta_j \,\partial \theta_k} - \frac{\partial^2 \eta(\theta)}{\partial \theta_j \,\partial \theta_k} \cdot \mathrm{E}[T(x)]</math>자연 매개변수를 사용하는 경우 계량은 특히 간단한 형식을 갖는다. 이 경우, <math>\eta(\theta) = \theta</math>이고, 따라서 계량은 <math>\nabla^2_\theta A</math>과 같다. . === 정규 분포 === [[다변량 정규분포]] <math>\mathcal N(\mu, \Sigma)</math><math display="block">-\ln p(x | \mu, \Sigma) = \frac 12 (x - \mu)^T \Sigma^{-1}(x - \mu) + \frac 12 \ln\det(\Sigma) + C </math> <math>T = \Sigma^{-1} </math>가 precision 행렬이라 하자. <math>g_{\mu, \Sigma} = 0 </math>이므로 계량은 평균 부분과 정밀도/분산 부분으로 분할된다. 평균 부분은 정밀도 행렬 <math>g_{\mu_i, \mu_j} = T_{ij}</math>이다. 정밀도 부분은 <math>g_{T,T} = -\frac 12 \nabla_T^2 \ln\det T </math> . 특히, 단일 변수 정규 분포의 경우, <math>g = \begin{bmatrix} t & 0 \\ 0 & (2t^2)^{-1} \end{bmatrix} = \sigma^{-2}\begin{bmatrix} 1 & 0 \\ 0 & 2 \end{bmatrix} </math>. <math>x = \mu/\sqrt 2, y = \sigma </math>라 하면 <math>ds^2 = 2\frac{dx^2 + dy^2}{y^2} </math>이다. 이는 푸앵카레 반평면이다. 두 개의 일변수 정규 분포 사이의 측지선은 <math>\sigma </math>축 또는 <math>\mu/\sqrt 2 </math> 축 중심에 있는 반원호 중 하나에 평행하다. <math>\delta_{\mu_0}, \delta_{\mu_1}</math>를 연결하는 측지선은 <math display="block">\phi \mapsto \mathcal N\left( \frac{\mu_0 + \mu_1}{2} + \frac{\mu_1 - \mu_0}{2} \cos\phi, \sigma^2 \sin^2\phi \right)</math>여기서 <math>\sigma = \frac{\mu_1 - \mu_0}{2\sqrt 2}</math>이고, 호 길이 매개변수화는 <math>s = \sqrt 2 \ln \tan(\phi/2)</math>과 같다. == 쿨백-라이블러 발산과의 관계 == 또는 ''상대 엔트로피'' 또는 [[쿨백-라이블러 발산]]의 2차 도함수로 계량을 얻을 수 있다.<ref>{{서적 인용|제목=Elements of Information Theory|url=https://archive.org/details/elementsofinform0000cove_m4w2|성=Cover|이름=Thomas M.|성2=Thomas|이름2=Joy A.|연도=2006|판=2nd|출판사=John Wiley & Sons|위치=Hoboken|isbn=0-471-24195-4}}</ref> 이를 얻기 위해 두 가지 확률 분포<math>P(\theta) </math>와 <math>P(\theta_0)</math>를 고려한다. 이는 서로 무한소만큼 떨어져있다. : <math>P(\theta) = P(\theta_0) + \sum_j \Delta\theta^j \left.\frac{\partial P}{\partial \theta^j}\right|_{\theta_0}</math> <math>\Delta\theta^j</math>는 ''j'' 방향으로 <math>\theta</math>의 무한소 변화이다. <math>P(\theta) = P(\theta_0)</math>일 때 쿨벡-라이블러 발산 <math>D_{\mathrm{KL}}[P(\theta_0)\| P(\theta)]</math>이 절대 최소값은 0을 가지므로, <math>\theta = \theta_0</math>에서 2차까지 멱급수 전개된다: : <math>f_{\theta_0}(\theta) := D_{\mathrm{KL}}[P(\theta_0) \| P(\theta)] = \frac{1}{2} \sum_{jk}\Delta\theta^j\Delta\theta^k g_{jk}(\theta_0) + \mathrm{O}(\Delta\theta^3)</math> . 대칭 행렬 <math>g_{jk}</math>은 양의 (반) 정부호이며, 임계값 <math>\theta_0</math>에서 함수 <math>f_{\theta_0}(\theta)</math>의 [[헤세 행렬]]이다. 이는 직관적으로 "통계적 미분 다양체에서 무한소만큼 떨어진 두 점 사이의 거리는 두 점 사이의 정보 차이이다."라고 생각할 수 있다. == 루파이너 기하학과의 관계 == 루파이너 계량 과 바인홀트 계량은 평형 통계 역학에서 발견되는 것과 같은 깁스 분포에 대해 계산된 피셔 정보 계량이다.<ref name="brody">{{저널 인용|제목=Information geometry in vapour-liquid equilibrium|저널=Journal of Physics A|성=Brody|이름=Dorje|성2=Hook|이름2=Daniel|연도=2008|권=42|호=2|쪽=023001|arxiv=0809.1166|doi=10.1088/1751-8113/42/2/023001}}</ref><ref name="crooks">{{저널 인용|제목=Measuring thermodynamic length|저널=Physical Review Letters|성=Crooks|이름=Gavin E.|연도=2009|권=99|호=10|쪽=100602|arxiv=0706.0559|doi=10.1103/PhysRevLett.99.100602|pmid=17930381}}</ref> == 자유 엔트로피의 변화 == [[리만 다양체]]에서 곡선의 [[작용 (물리학)|작용]]은 다음과 같이 주어진다. : <math>A=\frac{1}{2}\int_a^b \frac{\partial\theta^j}{\partial t} g_{jk}(\theta)\frac{\partial\theta^k}{\partial t} dt</math> 여기서 경로 매개변수는 시간 ''t''이다. 이 작용은 시스템이 ''a'' 시간에서 ''b'' 시간으로 이동할 때 시스템의 [[엔트로피|자유 엔트로피]]에 변화를 주는 것으로 이해될 수 있다.<ref name="crooks">{{저널 인용|제목=Measuring thermodynamic length|저널=Physical Review Letters|성=Crooks|이름=Gavin E.|연도=2009|권=99|호=10|쪽=100602|arxiv=0706.0559|doi=10.1103/PhysRevLett.99.100602|pmid=17930381}}</ref> 구체적으로 자유 엔트로피의 변화로 : <math>\Delta S = (b-a) A \, </math> 를 얻는다. 이러한 관찰은 [[화학공업|화학]] 및 가공 산업에 실제적으로 적용되는 결과를 가져왔다.: 시스템의 자유 엔트로피 변화를 최소화하려면 프로세스의 원하는 끝점 사이의 극소 [[측지선|측지]] 경로를 따라야 한다. 측지선은 작용이 곡선의 길이 제곱에 의해 아래로 제한된다는 [[코시-슈바르츠 부등식]]으로 인해 엔트로피를 최소화한다. == 젠슨-섀넌 발산과의 관계 == 피셔 계량을 사용하면 작용과 곡선 길이가 젠슨-섀넌 발산과 관련될 수도 있다.<ref name="crooks">{{저널 인용|제목=Measuring thermodynamic length|저널=Physical Review Letters|성=Crooks|이름=Gavin E.|연도=2009|권=99|호=10|쪽=100602|arxiv=0706.0559|doi=10.1103/PhysRevLett.99.100602|pmid=17930381}}</ref> 구체적으로, : <math>(b-a)\int_a^b \frac{\partial\theta^j}{\partial t} g_{jk}\frac{\partial\theta^k}{\partial t} \,dt = 8\int_a^b dJSD</math> 여기서 피적분 함수 ''dJSD는'' 선택한 경로를 따라 젠슨-섀넌 발산의 무한소 변화로 이해된다. 마찬가지로, [[곡선의 길이|곡선 길이]]에 대해 다음과 같다. : <math>\int_a^b \sqrt{\frac{\partial\theta^j}{\partial t} g_{jk}\frac{\partial\theta^k}{\partial t}} \,dt = \sqrt{8}\int_a^b \sqrt{dJSD}</math> 즉, 젠슨-섀넌 발산의 제곱근은 단지 피셔 계량(다음의 제곱근으로 나눈 값)이다. [[확률 질량 함수|이산 확률 공간]], 즉 유한 집합의 확률 공간에 대해 피셔 계량은 단순히 변수를 적절하게 변경한 후 단위 구의 양의 오탄트 (예: <math>R^2</math>에서 "사분면")로 제한된 [[유클리드 거리|유클리드 계량]]으로 이해될 수 있다. 점 <math>y=(y_0,\cdots,y_n)</math>으로 매개변수화된 <math>N+1</math> 차원 유클리드 공간을 생각하자. 유클리드 공간의 계량은 다음과 같이 제공된다. : <math>h=\sum_{i=0}^N dy_i \; dy_i</math> 여기서 <math>\textstyle dy_i</math>는 제 1형식이다; 이는 여접공간의 기저 벡터이다. <math>\textstyle \frac{\partial}{\partial y_j}</math>는 [[접공간]]의 기저 벡터로 사용되므로 : <math> dy_j\left(\frac{\partial}{\partial y_k}\right) = \delta_{jk}</math>. 유클리드 계량은 다음과 같이 쓸 수 있다. : <math>h^\mathrm{flat}_{jk} = h\left(\frac{\partial}{\partial y_j}, \frac{\partial}{\partial y_k}\right) = \delta_{jk}</math> 위첨자 'flat'은 좌표 형식으로 작성될 때 이 계량이 평면 공간 <math>y</math> 좌표를 기준으로 한다는 점을 상기시키기 위한 것이다. <math>N+1</math> 차원 유클리드 공간에 매장된 ''N''차원 단위 구는 다음과 같이 정의될 수 있다. : <math>\sum_{i=0}^N y_i^2 = 1</math> 이 매장은 구에 계량을 유도하며 주변 공간의 유클리드 계량에서 직접 물려받는다. 좌표가 구 표면에 있도록 제한되도록 주의하면서 위와 정확히 동일한 형식을 취한다. 이는 예를 들어 [[라그랑주 승수법|라그랑주 승수]]를 사용하여 수행할 수 있다. 이제 변수 변환 <math>p_i=y_i^2</math>을 고려하자. 구형 조건은 이제 확률 정규화 조건이 된다. : <math>\sum_i p_i = 1</math> 계량은 다음과 같이 된다. : <math>\begin{align} h &=\sum_i dy_i \; dy_i = \sum_i d\sqrt{p_i} \; d\sqrt{p_i} \\ &= \frac{1}{4}\sum_i \frac{dp_i \; dp_i}{p_i} = \frac{1}{4}\sum_i p_i\; d(\log p_i) \; d(\log p_i) \end{align}</math> 마지막은 피셔 정보 계량의 4분의 1로 인식될 수 있다. 프로세스를 완료하려면 확률이 다양체 변수 <math>\theta</math>의 매개변수 함수라는 점을 기억하라. 즉, <math>p_i = p_i(\theta)</math>. 따라서 위의 내용은 매개변수 다양체에 대한 계량을 유도한다. : <math>\begin{align} h & = \frac{1}{4}\sum_i p_i(\theta) \; d(\log p_i(\theta))\; d(\log p_i(\theta)) \\ &= \frac{1}{4}\sum_{jk} \sum_i p_i(\theta) \; \frac{\partial \log p_i(\theta)} {\partial \theta_j} \frac{\partial \log p_i(\theta)} {\partial \theta_k} d\theta_j d\theta_k \end{align}</math> 또는 좌표 형식에서 피셔 정보 계량은 다음과 같다. : <math> \begin{align} g_{jk}(\theta) = 4h_{jk}^\mathrm{fisher} &= 4 h\left(\frac{\partial}{\partial \theta_j}, \frac{\partial}{\partial \theta_k}\right) \\ & = \sum_i p_i(\theta) \; \frac{\partial \log p_i(\theta)} {\partial \theta_j} \; \frac{\partial \log p_i(\theta)} {\partial \theta_k} \\ & = \mathrm{E}\left[ \frac{\partial \log p_i(\theta)} {\partial \theta_j} \; \frac{\partial \log p_i(\theta)} {\partial \theta_k} \right] \end{align}</math> 이전과 마찬가지로 : <math> d\theta_j\left(\frac{\partial}{\partial \theta_k}\right) = \delta_{jk}.</math> 이 표현이 <math>\theta</math> 좌표에 적용 가능함을 상기시키기 위해 위 첨자 '피셔'가 표시된다. 비좌표 형식은 유클리드(평면 공간) 계량과 동일하다. 즉, 통계적 다양체에 대한 피셔 정보 계량은 변수를 적절하게 변경한 후 구의 양의 오르탄트로 제한된 유클리드 계량(4배)이다. 확률변수 <math>p</math>는 이산적이지 않고 연속적일 때, 이 논의는 여전히 유효하다. 이는 두 가지 방법 중 하나로 볼 수 있다. 한 가지 방법은 모든 조작이 잘 정의되고 수렴되는지 확인하기 위해 무한 차원 공간에서 위의 모든 단계를 신중하게 재구성하고 한계를 적절하게 정의하는 등의 작업을 수행하는 것이다. 다른 방법은 다음과 같다. [[미하일 레오니도비치 그로모프|그로모프]]가 지적한 바에 따르면, [[범주론]]적 접근 방식을 사용하는 것이다. 즉, 위의 조작은 확률 범주에서 여전히 유효하다는 점에 유의하라. 여기서 이러한 범주는 [[보흐너 적분|라돈-니코딤 성질]]을 갖게 된다. 즉, [[라돈-니코딤 정리]]가 이 범주에 적용된다. 여기에는 [[힐베르트 공간]]이 포함된다. 이는 제곱 적분 가능하며 위의 조작에서는 제곱에 대한 합을 제곱에 대한 적분으로 안전하게 대체하는 데 충분하다. == 푸비니–슈투디 계량 == 유클리드 계량에서 피셔 계량을 유도하는 위의 조작은 복소 사영 힐베르트 공간으로 확장될 수 있다. 이 경우 [[푸비니-슈투디 계량]]을 얻는다.<ref name="facchi">{{저널 인용|제목=Classical and Quantum Fisher Information in the Geometrical Formulation of Quantum Mechanics|저널=Physics Letters A|성=Facchi|이름=Paolo|성2=Kulkarni|이름2=Ravi|연도=2010|권=374|호=48|쪽=4801–4803|arxiv=1009.5219|bibcode=2010PhLA..374.4801F|doi=10.1016/j.physleta.2010.10.005|저자표시=1|성3=Man'ko|이름3=V. I.|성4=Marmo|이름4=Giuseppe|성5=Sudarshan|이름5=E. C. G.|성6=Ventriglia|이름6=Franco}}</ref> 푸비니-슈투디 계량이 양자 역학에서 정보를 측정하는 수단을 제공하므로 이는 놀라운 일이 아니다. 헬스트롬 계량이라고도 알려진 뷰래스 계량은 푸비니-슈투디 계량과 동일하지만<ref name="facchi" /> 후자는 일반적으로 아래와 같이 순수 상태로 작성되는 반면 Bures 계량은 혼합 상태로 작성된다. 복소 좌표의 페이즈를 0으로 설정하면 위와 같이 피셔 정보 계량의 정확히 1/4을 얻을 수 있다. 하나는 [[극좌표계|극좌표]]로 작성된 [[확률 진폭]]을 구성하는 동일한 트릭으로 시작한다. : <math>\psi(x;\theta) = \sqrt{p(x; \theta)} \; e^{i\alpha(x;\theta)} </math> 여기서, <math>\psi(x;\theta)</math>는 복소수 [[확률 진폭]]이다. <math>p(x; \theta)</math>와 <math>\alpha(x;\theta) </math>는 실수이다. 이전 계산은 <math>\alpha(x;\theta)=0</math>을 설정하여 얻는다. 확률이 [[단체 (수학)|단체]]내에 있는 일반적인 조건은 다음과 같다. : <math>\int_X p(x;\theta) \, dx =1</math> 제곱 진폭이 정규화된다는 아이디어로 동등하게 표현된다. : <math>\int_X \vert \psi(x;\theta)\vert^2 \, dx = 1</math> <math>\psi(x;\theta)</math>이 실수일 때 이것은 구의 표면이다. 양자 역학 [[브라-켓 표기법|브라켓 표기법]]을 사용하여 극소 형태로 작성된 [[푸비니-슈투디 계량]]은 다음과 같다. : <math>ds^2 = \frac{\langle \delta \psi \mid \delta \psi \rangle} {\langle \psi \mid \psi \rangle} - \frac {\langle \delta \psi \mid \psi \rangle \; \langle \psi \mid \delta \psi \rangle} {{\langle \psi \mid \psi \rangle}^2}. </math> 이 표기법에서는 <math> \langle x\mid \psi\rangle = \psi(x;\theta)</math>이고 전체 측도 공간 ''X'' 에 대한 적분은 다음과 같이 작성된다. : <math> \langle \phi \mid \psi\rangle = \int_X \phi^*(x;\theta) \psi(x;\theta) \, dx. </math> 표현식 <math>\vert \delta \psi \rangle</math>는 아주 작은 변화로 이해될 수 있다. 동등하게, 여접공간에서는 1-형식으로 이해될 수 있다. 무한소 표기법을 사용하면 위 확률의 극좌표 형식은 다음과 같다. : <math>\delta\psi = \left(\frac{\delta p}{2p} + i \delta \alpha\right) \psi</math> 위의 내용을 푸비니–슈투디 계량에 대입하면 다음이 제공된다. : <math>\begin{align} ds^2 = {} & \frac{1}{4}\int_X (\delta \log p)^2 \;p\,dx\\[8pt] {}&+ \int_X (\delta \alpha)^2 \;p\,dx - \left(\int_X \delta \alpha \;p\,dx\right)^2 \\[8pt] & {} + \frac{i}{2} \int_X (\delta \log p \delta\alpha - \delta\alpha \delta \log p) \;p\,dx \end{align} </math> <math>\delta\alpha=0</math>라 두면 위에서 첫 번째 항은 피셔 정보 계량의 1/4이라는 점을 분명히 알 수 있다. 위의 전체 형식은 표준 리만 기하학의 표기법을 변경하여 약간 더 명확하게 만들 수 있으므로 계량은 [[접공간]]에 작용하는 대칭 [[미분 형식|2 형식]]이 된다. 표기 변경은 <math>\delta \to d</math> 와 <math>ds^2\to h</math>로 간단히 교체만 하면 된다. 적분은 단지 기대값일 뿐이라는 점에 유의하라. 그래서: : <math>\begin{align}h ={}& \frac{1}{4} \mathrm{E}\left[(d\log p)^2\right] + \mathrm{E}\left[(d\alpha)^2\right] - \left(\mathrm{E}\left[d\alpha\right]\right)^2\\[8pt] {}&+ \frac{i}{2}\mathrm{E}\left[d\log p\wedge d\alpha\right] \end{align} </math> 허수 항은 [[심플렉틱 벡터 공간|심플렉틱 형식]]이며 [[기하학적 위상|베리 페이즈]] 또는 [[기하학적 위상|기하학적 페이즈]]이다. 첨자 표기법에서 계량은 다음과 같다. : <math>\begin{align}h_{jk} = {} & h\left(\frac{\partial}{\partial\theta_j}, \frac{\partial}{\partial\theta_k}\right) \\[8pt] = {} & \frac{1}{4} \mathrm{E}\left[ \frac{\partial\log p}{\partial\theta_j} \frac{\partial\log p}{\partial\theta_k} \right]\\[8pt] {}&+ \mathrm{E}\left[ \frac{\partial\alpha}{\partial\theta_j} \frac{\partial\alpha}{\partial\theta_k} \right] - \mathrm{E}\left[ \frac{\partial\alpha}{\partial\theta_j} \right] \mathrm{E}\left[ \frac{\partial\alpha}{\partial\theta_k} \right] \\[8pt] & {} + \frac{i}{2}\mathrm{E}\left[ \frac{\partial\log p}{\partial\theta_j} \frac{\partial\alpha}{\partial\theta_k} - \frac{\partial\alpha}{\partial\theta_j} \frac{\partial\log p}{\partial\theta_k} \right] \end{align}</math> 다시 말하지만, 첫 번째 항은 <math>\alpha=0</math>로 놓으면 피셔 정보 계량의 4분의 1로 명확하게 표시될 수 있다. 동등하게, 푸비니-슈투디 계량은 평면 유클리드 계량의 복소 확장에 의해 유도된 복소 사영 힐베르트 공간의 계량으로 이해될 수 있다. 이것과 Bures 계량의 차이점은 Bures 계량이 혼합 상태로 작성된다는 것이다. == 연속값 확률 == 다음과 같이 좀 더 형식적이고 추상적인 정의를 내릴 수 있다.<ref>{{저널 인용|제목=Fisher information metric and Poisson kernels|저널=Differential Geometry and Its Applications|성=Itoh|이름=Mitsuhiro|성2=Shishido|이름2=Yuichi|url=https://tsukuba.repo.nii.ac.jp/record/16749/files/DGA_26-4.pdf|연도=2008|권=26|호=4|쪽=347–356|doi=10.1016/j.difgeo.2007.11.027}}</ref> ''X를'' [[방향 (다양체)|유향 다양체]]라고 하고, <math>(X,\Sigma,\mu)</math>를 ''X''에 대한 측도라 하자. 마찬가지로 <math>(\Omega, \mathcal{F},P)</math>이 <math>\Omega=X</math>, [[시그마 대수]] <math>\mathcal{F}=\Sigma</math> 그리고 확률 <math>P=\mu</math>인 [[확률 공간]]이라 하자. ''X''의 통계적 다양체 ''S'' (''X'')는 ''X''에서 모든 측도 <math>\mu</math>의 공간으로 정의된다.(시그마 대수 <math>\Sigma</math>이 고정됨) 이 공간은 무한차원 공간이며 일반적으로 [[프레셰 공간]]으로 여겨진다. ''S'' (''X'')의 점은 측도이다. 점 <math>\mu\in S(X)</math>를 고르고 [[접공간]] <math>T_\mu S</math>를 고려하자. 피셔 정보 계량은 접공간의 [[내적 공간|내적]]이다. [[기호의 남용|표기법을 남용]] 하면 다음과 같이 쓸 수 있다. : <math>g(\sigma_1,\sigma_2)=\int_X \frac{d\sigma_1}{d\mu}\frac{d\sigma_2}{d\mu}d\mu</math> 여기서, <math>\sigma_1</math>와 <math>\sigma_2</math>는 접공간의 벡터이다. 즉, <math>\sigma_1,\sigma_2\in T_\mu S</math> . 표기법의 남용은 접벡터를 도함수인 것처럼 작성하고 적분을 작성할 때 외부 ''d를'' 삽입하는 것이다. 적분은 전체 공간 ''X''에 걸쳐 측도 <math>\mu</math>를 사용하여 수행되어야 한다. 실제로 이러한 표기법의 남용은 [[측도|측도론]]에서는 완벽하게 정상적인 것으로 여겨진다. 이는 [[라돈-니코딤 정리|라돈-니코딤 미분]]에 대한 표준 표기법이다. 적분이 잘 정의되기 위해서는 공간 ''S''(''X'')가 [[보흐너 적분|Radon-Nikodym 성질]]을 가져야 하며, 보다 구체적으로 접공간은 제곱 적분 가능한 벡터로 제한된다. 제곱 적분성은 [[코시 열|코시 수열]]이 [[약한 위상|약위상]]에서 유한 값으로 수렴한다고 말하는 것과 동일하다. 공간에는 극한값이 포함되어 있다. [[힐베르트 공간]]은 이 속성을 가지고 있음에 주목하라. 이러한 계량의 정의는 여러 단계에서 이전 정의와 동일하다고 볼 수 있다. 먼저, 매끄럽게 변하는 매개변수 <math>\theta</math>에 의해 매개변수화되는 측도 <math>\mu</math>만 고려하여 ''S'' (''X'')의 부분 다양체를 선택한다. 그렇다면 만약 <math>\theta</math>가 유한차원이라면 부분다양체도 마찬가지이다. 마찬가지로 접공간은 <math>\theta</math>과 같은 차원을 갖는다. 추가적인 언어 남용과 함께 [[지수 사상 (리만 기하학)|지수 사상]]은 접공간의 벡터에서 기저 다양체의 점까지 사상을 제공한다는 점에 주목한다. 따라서 만약 <math>\sigma\in T_\mu S</math>는 접공간의 벡터이면 <math>p=\exp(\sigma)</math>는 <math>p\in S(X)</math>와 관련된 해당 확률이다. (지수 사상을 <math>\mu</math>로 [[평행 운송|평생운송]]한 후.) 반대로, 주어진 점이 <math>p\in S(X)</math>, 로그는 접공간에 점을 제공한다(대략적으로 말하면 원점에서 점 <math>\mu</math>으로 이동해야 함). 따라서 이전에 주어진 더 간단한 정의에서는 로그 모양을 갖는다. == 같이 보기 == * [[크라메르-라오 하한]] * [[피셔 정보]] * 헬링거 거리 * [[정보 기하학]] == 각주 == {{각주}} == 참고자료 == * Garvesh Raskutti Sayan Mukherjee, (2014). ''거울 하강의 정보 기하학'' https://arxiv.org/pdf/1310.7780.pdf * {{저널 인용|제목=Far-from-equilibrium measurements of thermodynamic length|저널=Physical Review E|성=Feng|이름=Edward H.|성2=Crooks|이름2=Gavin E.|연도=2009|권=79|호=1 Pt 1|쪽=012104|arxiv=0807.0621|bibcode=2009PhRvE..79a2104F|doi=10.1103/PhysRevE.79.012104|pmid=19257090}} * Shun'ichi Amari (1985) ''Differential-geometrical methods in statistics'', Lecture Notes in Statistics, Springer-Verlag, Berlin. * Shun'ichi Amari, Hiroshi Nagaoka (2000) ''Methods of information geometry'', Translations of mathematical monographs; v. 191, American Mathematical Society. * Paolo Gibilisco, Eva Riccomagno, Maria Piera Rogantin and Henry P. Wynn, (2009) ''Algebraic and Geometric Methods in Statistics'', Cambridge U. Press, Cambridge. [[분류:미분기하학]]
이 문서에서 사용한 틀:
틀:각주
(
원본 보기
)
틀:서적 인용
(
원본 보기
)
틀:위키데이터 속성 추적
(
원본 보기
)
틀:저널 인용
(
원본 보기
)
피셔 정보 계량
문서로 돌아갑니다.
둘러보기 메뉴
개인 도구
로그인
이름공간
문서
토론
한국어
보기
읽기
원본 보기
역사 보기
더 보기
검색
둘러보기
대문
최근 바뀜
임의의 문서로
미디어위키 도움말
특수 문서 목록
도구
여기를 가리키는 문서
가리키는 글의 최근 바뀜
문서 정보