누적 분포 함수 문서 원본 보기
←
누적 분포 함수
둘러보기로 이동
검색으로 이동
문서 편집 권한이 없습니다. 다음 이유를 확인해주세요:
요청한 명령은 다음 권한을 가진 사용자에게 제한됩니다:
사용자
.
문서의 원본을 보거나 복사할 수 있습니다.
{{위키데이터 속성 추적}} [[파일:Normal Distribution CDF.svg|섬네일|[[정규 분포]]의 누적분포함수]] [[확률론]]에서 '''누적분포함수'''(累積分布函數, {{llang|en|cumulative distribution function}}, 약자 {{lang|en|'''cdf'''}})는 주어진 [[확률 변수]]가 특정 값보다 작거나 같은 [[확률]]을 나타내는 [[함수]]이다. == 정의 == [[확률 공간]] <math>(\Omega,\mathcal F,\operatorname{Pr})</math> 위의 실숫값 [[확률 변수]] <math>X\colon\Omega\to(\mathbb R,\mathcal B(\mathbb R))</math>의 '''(우연속) 누적분포함수''' <math>F_X\colon\mathbb R\to\mathbb R</math>는 다음과 같다. :<math>F_X(x)=\operatorname{Pr}(X\in(-\infty,x])\qquad\forall x\in\mathbb R</math> 보다 일반적으로, [[확률 공간]] <math>(\Omega,\mathcal F,\operatorname{Pr})</math> 위의 실숫값 [[확률 벡터]] <math>X=(X_1,\dots,X_n)\colon\Omega\to(\mathbb R^n,\mathcal B(\mathbb R^n))</math>의 '''(우연속) 누적분포함수''' <math>F_X\colon\mathbb R^n\to\mathbb R</math>는 다음과 같다. :<math>F_X(x_1,\dots,x_n)=\operatorname{Pr}(X_1\in(-\infty,x_1],\dots,X_n\in(-\infty,x_n])\qquad\forall(x_1,\dots,x_n)\in\mathbb R^n</math> 위 정의에 등장하는 반닫힌구간들을 열린구간으로 대체하면 '''좌연속 누적분포함수'''의 정의를 얻는다. == 성질 == === 함수로서의 성질 === 임의의 함수 <math>F\colon\mathbb R\to\mathbb R</math>에 대하여, 다음 두 조건이 서로 [[동치]]이다. * <math>F</math>는 어떤 [[확률 변수]]의 누적분포함수이다. * 다음 조건들을 만족시킨다. ** ([[증가 함수]]) 만약 <math>x,y\in\mathbb R</math>이며 <math>x\le y</math>라면, <math>F(x)\le F(y)</math> ** ([[우연속 함수]]) 임의의 <math>x\in\mathbb R</math>에 대하여, <math>F(x^+)=F(x)</math> ** <math>F(-\infty)=0</math> ** <math>F(\infty)=1</math> 여기서 <math>F(x^+)</math>는 [[우극한]]이며, <math>F(-\infty)</math>와 <math>F(\infty)</math>는 음과 양의 무한대에서의 극한이다. 보다 일반적으로, 임의의 함수 <math>F\colon\mathbb R^n\to\mathbb R</math>에 대하여, 다음 두 조건이 서로 [[동치]]이다. * <math>F</math>는 어떤 [[확률 벡터]]의 누적분포함수이다. * 다음 조건들을 만족시킨다. ** 만약 <math>x,y\in\mathbb R^n</math>이며 <math>x_i\le y_i\forall i\in\{1,\dots,n\}</math>이라면, <math>\textstyle\sum_{t\in\{x_1,y_1\}\times\cdots\times\{x_n,y_n\}}(-1)^{|\{i\colon t_i=x_i\}|}F(t)\ge 0</math>. (이 조건과 세 번째 조건은 <math>F</math>가 각 변수에 대하여 [[증가 함수]]임을 함의한다.) ** ([[우연속 함수]]) 임의의 <math>x\in\mathbb R^n</math>에 대하여, <math>F(x^+)=F(x)</math> ** 임의의 <math>i\in\{1,\dots,n\}</math> 및 <math>x_1,\dots,x_{i-1},x_{i+1},\dots,x_n\in\mathbb R</math>에 대하여, <math>F(x_1,\dots,x_{i-1},-\infty,x_{i+1},\dots,x_n)=0</math> ** <math>F(\infty,\dots,\infty)=1</math> 여기서 :<math>F(x^+)=\lim_{y_1\to x_1^+,\dots,y_n\to x_n^+}F(y)</math> :<math>F(x_1,\dots,x_{i-1},-\infty,x_{i+1},\dots,x_n)=\lim_{x_i\to-\infty}F(x)</math> :<math>F(\infty,\dots,\infty)=\lim_{x_1\to\infty,\dots,x_n\to\infty}F(x)</math> 이다. === 확률 분포와의 관계 === [[확률 변수]] 또는 [[확률 벡터]]의 누적분포함수는 그 [[확률 분포]]를 유일하게 결정한다. 이는 누적분포함수에 대한 [[르베그-스틸티어스 측도]]와 일치한다. 그러나 누적분포함수는 확률 변수 자체를 유일하게 결정하지는 않는다. [[확률 변수]] <math>X</math>가 구간 <math>(a,b]</math>에 속할 확률과 특정 실수 <math>x\in\mathbb R</math>를 취할 확률은 누적분포함수 <math>F_X</math>를 통해 각각 다음과 같이 나타낼 수 있다. :<math>\operatorname{Pr}(X\in(a,b])=F_X(b)-F_X(a)</math> :<math>\operatorname{Pr}(X=x)=F_X(x)-F_X(x^-)</math> 보다 일반적으로, [[확률 벡터]] <math>X=(X_1,\dots,X_n)</math>가 <math>(a_1,b_1]\times\cdots\times(a_n,b_n]</math>에 속할 확률과 특정 값 <math>x=(x_1,\dots,x_n)\in\mathbb R^n</math>을 취할 확률은 각각 다음과 같다. :<math>\operatorname{Pr}(X_1\in(a_1,b_1],\dots,X_n\in(a_n,b_n])=\sum_{t\in\{a_1,b_1\}\times\cdots\times\{a_n,b_n\}}(-1)^{|\{i\colon t_i=a_i\}|}F_X(t)</math> :<math>\operatorname{Pr}(X_1=x_1,\dots,X_n=x_n)=\lim_{\epsilon\to 0^+}\sum_{t\in\{x_1-\epsilon,x_1\}\times\cdots\times\{x_n-\epsilon,x_n\}}(-1)^{|\{i\colon t_i=x_i-\epsilon\}|}F_X(t)</math> === 이산성·연속성·특이성과의 관계 === [[파일:Discrete probability distribution illustration.png|섬네일|이산 확률 분포, 연속 확률 분포, 이산적인 부분과 연속적인 부분이 모두 존재하는 분포에 대한 각각의 누적분포함수]] [[확률 변수]] <math>X</math>에 대하여, 다음 두 조건이 서로 [[동치]]이다. * <math>X</math>는 [[이산 확률 변수]]이다. (즉, <math>\operatorname{Pr}(X\in A)=1</math>인 [[가산 집합]] <math>A\in\mathcal B(\mathbb R)</math>이 존재한다.) * <math>\textstyle\sum_{x\in\mathbb R}\left(F_X(x)-\lim_{y\to x^-}F_X(y)\right)=1</math> 특히, [[계단 함수]]를 누적분포함수로 하는 [[확률 변수]]는 [[이산 확률 변수]]이다. 그러나 그 역은 성립하지 않는다. [[확률 변수]] <math>X</math>에 대하여, 다음 두 조건이 서로 [[동치]]이다. * <math>X</math>는 [[연속 확률 변수]]이다. (즉, 임의의 <math>x\in\mathbb R</math>에 대하여, <math>\operatorname{Pr}(X=x)=0</math>이다.) * <math>F_X</math>는 [[연속 함수]]이다. [[확률 변수]] <math>X</math>에 대하여, 다음 두 조건이 서로 [[동치]]이다. * <math>X</math>는 [[절대 연속 확률 변수]]이다. (즉, 확률 분포 <math>\operatorname{Pr}(X\in\bullet)</math>는 [[르베그 측도]]에 대한 [[절대 연속 측도]]이다. 또는, <math>X</math>는 [[확률 밀도 함수]]를 갖는다.) * <math>F_X</math>는 임의의 [[닫힌구간]]에서 [[절대 연속 함수]]이다. [[확률 변수]] <math>X</math>에 대하여, 다음 두 조건이 서로 [[동치]]이다. * <math>X</math>는 [[특이 확률 변수]]이다. (즉, 확률 분포 <math>\operatorname{Pr}(X\in\bullet)</math>와 [[르베그 측도]]는 서로 [[특이 측도]]이다.) * 르베그 [[거의 어디서나]] <math>F_X'=0</math>이다. 임의의 누적분포함수 <math>F</math>는 이산 누적분포함수 <math>F_{\operatorname{disc}}</math>와 절대 연속 누적분포함수 <math>F_{\operatorname{a.c.}}</math>, 특이 연속 누적분포함수 <math>F_{\operatorname{s.c.}}</math>의 음이 아닌 계수의 [[아핀 결합]]으로 나타낼 수 있다. :<math>F=cF_{\operatorname{disc}}+c'F_{\operatorname{a.c.}}+c''F_{\operatorname{s.c.}}</math> :<math>c,c',c''\ge 0</math> :<math>c+c'+c''=1</math> === 독립성과의 관계 === 같은 [[확률 공간]] 위의 [[확률 변수]] 또는 [[확률 벡터]]들의 집합 <math>\mathcal X</math>에 대하여, 다음 두 조건이 서로 [[동치]]이다. * <math>\mathcal X</math>는 서로 [[독립 (확률론)|독립]]이다. * 임의의 서로 다른 <math>X_1,\dots,X_n\in\mathcal X</math> 및 임의의 <math>x_i\in\operatorname{dom}F_{X_i}</math> (<math>i=1,\dots,n</math>)에 대하여, <math>F_{(X_1,\dots,X_n)}(x_1,\dots,x_n)=F_{X_1}(x_1)\cdots F_{X_n}(x_n)</math> {{증명}} 첫 번째 조건은 두 번째 조건을 자명하게 함의한다. 이제 두 번째 조건을 가정하고 첫 번째 조건을 증명하자. 유한 개의 확률 변수 :<math>\mathcal X=\{X_1,\dots,X_n\}</math> :<math>X_i\colon(\Omega,\mathcal F,\operatorname{Pr})\to(\mathbb R,\mathcal B(\mathbb R))</math> 의 경우의 증명은 다음과 같다. 일반적인 경우는 이와 유사하게 증명할 수 있다. :<math>\mathcal C=\{(-\infty,x]\colon x\in\mathbb R\}</math> 라고 하자. 그렇다면 <math>\mathcal C</math>는 [[π계]]를 이루며, <math>\mathcal B(\mathbb R)</math>는 <math>\mathcal C</math>를 포함하는 최소의 [[시그마 대수]]이다. 다음과 같은 집합을 생각하자. :<math>\mathcal L_n=\{B_n\in\mathcal B(\mathbb R)|\forall B_1,\dots,B_{n-1}\in\mathcal C\colon\operatorname{Pr}(X_1\in B_1,\dots,X_n\in B_n)=\operatorname{Pr}(X_1\in B_1)\cdots\operatorname{Pr}(X_n\in B_n)\}</math> 그렇다면, 가정한 조건에 따라 <math>\mathcal C\subseteq\mathcal L_n</math>이다. 또한, <math>\mathcal L_n</math>은 [[λ계]]를 이룸을 보일 수 있다. [[딘킨 π-λ 정리]]에 따라, <math>\mathcal L_n=\mathcal B(\mathbb R)</math>이다. 이제, 다음과 같은 집합을 생각하자. :<math>\mathcal L_{n-1}=\{B_{n-1}\in\mathcal B(\mathbb R)|\forall B_1,\dots,B_{n-2}\in\mathcal C,B_n\in\mathcal B(\mathbb R)\colon\operatorname{Pr}(X_1\in B_1,\dots,X_n\in B_n)=\operatorname{Pr}(X_1\in B_1)\cdots\operatorname{Pr}(X_n\in B_n)\}</math> 그렇다면, <math>\mathcal L_n=\mathcal B(\mathbb R)</math>이므로 <math>\mathcal C\subseteq\mathcal L_{n-1}</math>이며, <math>\mathcal L_{n-1}</math>은 [[λ계]]를 이룬다. 따라서 <math>\mathcal L_{n-1}=\mathcal B(\mathbb R)</math>이다. 이와 같은 과정을 반복하면 결국 임의의 <math>B_1,\dots,B_n\in\mathcal B(\mathbb R)</math>에 대하여, :<math>\operatorname{Pr}(X_1\in B_1,\dots,X_n\in B_n)=\operatorname{Pr}(X_1\in B_1)\cdots\operatorname{Pr}(X_n\in B_n)</math> 이라는 사실을 얻는다. 즉, <math>\{X_1,\dots,X_n\}</math>은 서로 [[독립 (확률론)|독립]]이다. {{증명 끝}} == 같이 보기 == * [[기술통계학]] == 참고 문헌 == * {{서적 인용 |성1=Athreya |이름1=Krishna B. |성2=Lahiri |이름2=Soumendra N. |제목=Measure Theory and Probability Theory |언어=en |총서=Springer Texts in Statistics |출판사=Springer |위치=New York, NY |날짜=2006 |isbn=978-0-387-32903-1 |issn=1431-875X |doi=10.1007/978-0-387-35434-7 |zbl=1125.60001 }} == 외부 링크 == * {{eom|제목=Distribution function}} * {{매스월드|id=DistributionFunction|제목=Distribution function}} {{전거 통제}} [[분류:확률론]]
이 문서에서 사용한 틀:
틀:Eom
(
원본 보기
)
틀:Lang
(
원본 보기
)
틀:Llang
(
원본 보기
)
틀:매스월드
(
원본 보기
)
틀:서적 인용
(
원본 보기
)
틀:위키데이터 속성 추적
(
원본 보기
)
틀:전거 통제
(
원본 보기
)
틀:증명
(
원본 보기
)
틀:증명 끝
(
원본 보기
)
누적 분포 함수
문서로 돌아갑니다.
둘러보기 메뉴
개인 도구
로그인
이름공간
문서
토론
한국어
보기
읽기
원본 보기
역사 보기
더 보기
검색
둘러보기
대문
최근 바뀜
임의의 문서로
미디어위키 도움말
특수 문서 목록
도구
여기를 가리키는 문서
가리키는 글의 최근 바뀜
문서 정보