푸아송 분포 문서 원본 보기
←
푸아송 분포
둘러보기로 이동
검색으로 이동
문서 편집 권한이 없습니다. 다음 이유를 확인해주세요:
요청한 명령은 다음 권한을 가진 사용자에게 제한됩니다:
사용자
.
문서의 원본을 보거나 복사할 수 있습니다.
{{위키데이터 속성 추적}} {{확률분포 정보 |종류=질량 |pdf 그림=Poisson pmf.svg |pdf 그림설명=다양한 <math>\lambda</math>에 대한 푸아송 분포의 모습 |cdf 그림=Poisson cdf.svg |기호=<math>\mathrm{Pois}(\lambda)</math>, <math>\mathrm{Poisson}(\lambda)</math> |매개변수=<math>\lambda > 0</math> |받침=0 이상의 [[정수]] |pmf=<math>\frac{\lambda^k}{k!}\cdot e^{-\lambda}</math> |cdf=<math>e^{-\lambda} \sum_{i=0}^{\lfloor k\rfloor} \frac{\lambda^i}{i!} = \frac{\Gamma(\lfloor k+1\rfloor, \lambda)}{\lfloor k\rfloor !}</math> (이때 <math>\Gamma(x,y)</math>는 [[불완전 감마 함수]], <math>\lfloor x \rfloor</math>는 [[바닥 함수]]) |기대값=<math>\lambda</math> |분산=<math>\lambda</math> |최빈값=<math>\lceil\lambda\rceil - 1</math> |왜도=<math>\lambda^{-1/2}\,</math> |mgf=<math>\exp(\lambda (e^{t}-1))\,</math> |특성함수=<math>\exp(\lambda (e^{it}-1))\,</math> }} '''푸아송 분포'''(Poisson分布, {{llang|en|Poisson distribution}})는 [[확률론]]에서 단위 시간 안에 어떤 사건이 몇 번 발생할 것인지를 표현하는 [[이산 확률 분포]]이다. 단위 시간 대신 다른 단위(가령, 공장의 생산량 묶음 단위인 [[로트]](lot) 등)를 사용할 수 있다. 이때 일어날 확률은 일정하고, 매우 작아야 한다. == 역사 == 19세기에 [[시메옹 드니 푸아송]]이 1838년 저서 《민사 사건과 형사 사건 재판에서의 확률에 관한 연구 및 일반적인 확률 계산 법칙에 대한 서문》({{llang|fr|Probabilité des jugements en matière criminelle et en matière civile, précédées des règles générales du calcul des probabilitiés}})<ref>{{서적 인용|이름=S.D.|성=Poisson|저자링크=시메옹 드니 푸아송|제목=Probabilité des jugements en matière criminelle et en matière civile, précédées des règles générales du calcul des probabilitiés|위치=Paris, France|출판사=Bachelier|날짜=1837|언어=fr}}</ref>에서 최초로 사용하였다. == 정의 == 정해진 시간 안에 어떤 사건이 일어날 횟수에 대한 [[기댓값]]을 <math>\lambda</math>라고 했을 때, 그 사건이 <math>k</math>회 일어날 확률은 다음과 같다. :<math>f(k; \lambda)=\frac{\lambda^k e^{-\lambda}}{k!},\,\!</math> 여기서 <math>e</math>는 [[자연상수]]이다. == 특성 == # 어떤 단위구간(예, 1일)동안 이를 더 짧은 작은 단위의 구간(예: 1시간)로 나눌 수 있고 이러한 더 짧은 단위구간 중에 어떤 사건이 발생할 확률은 전체 척도 중에서 항상 일정해야 한다. # 두 개 이상의 사건이 동시에 발생할 확률은 0에 가깝다. # 어떤 단위구간의 사건의 발생은 다른 단위구간의 발생으로부터 독립적이다. # 특정 구간에서의 사건 발생확률은 그 구간의 크기에 비례한다. # 푸아송분포 확률 변수의 [[기댓값]]과 [[분산]]은 모두 λ이다. == 응용 == 다음과 같은 확률적인 문제를 알아내기 위해 쓰이고 있다. * 주어진 일정 시간 동안에 도착한 고객의 수 * 1킬로미터 도로에 있는 흠집의 수 * 주어진 일정 생산시간 동안 발생하는 불량 수 * 하룻동안 발생하는 출생자 수 * 어떤 시간 동안 톨게이트를 통과하는 차량의 수 * 어떤 페이지 하나를 완성하는 데 발생하는 오타의 발생률 * 어떤 특정 량의 방사선을 [[DNA]]에 쬐였을 때 발생하는 [[돌연변이]]의 수 * 어떤 특정 면적의 다양한 종류의 나무가 섞여 자라는 삼림에서 소나무의 수 * 어떤 특정 진도 이상의 지진이 발생하는 수 == 푸아송 가정에 어긋나는 사례 == * 1분마다 학생회관에 도착할 학생들의 수는 푸아송 분포를 따르지 않을 수도 있다. 왜냐하면, 그 비율이 일정하지 않기 때문이다. (수업 중에는 그 비율이 낮고, 쉬는 시간에는 그 비율이 높을 것이다.) 또, 각 학생들의 도착 사건이 독립적이지 않다. (학생들은 보통 그룹지어서 이동하는 경향이 있다) * 매년 캘리포니아에서 진도 5의 지진 발생 수는 푸아송 분포를 따르지 않을 것이다. 왜냐하면 한 번의 지진이 그 다음 일어날 지진의 가능성에 영향을 끼치기 때문이다. * 집중 치료 병동의 환자들 중, 그 병동에서 보낼 날의 수는 푸아송 분포를 따르지 않을 것이다. 왜냐하면, 병동에서 하루도 지내지 않는 경우는 없기 때문이다. 이러한 경우 zero-truncated poisson distribution을 통한 모델링이 가능하다. * 한 번도 사건이 일어나지 않는 시간 간격의 수가 기본 푸아송 분포를 통해 예측된 것보다 더 많은 경우 (쉽게 생각하면 푸아송 분포에서 계산된 P(k=0)보다 더 높은 P(k=0)을 가지는 경우), zero-inflated 모델을 적용할 수 있다. == 다른 분포와의 관계 == === 이항 분포 === 푸아송 분포는 시행 횟수가 무한히 많아지고, 예상 성공 횟수가 고정되어 있으므로 이항 분포의 한 사례라고 볼 수 있다. 따라서 <math>n</math>이 충분히 크고, <math>p</math>가 충분히 작으면 이항 분포의 정규 근사로 이끌어 낼 수 있다. 푸아송 분포는 <math>n</math>이 100 이상이고, <math>np</math>가 10 이하인 경우 좋은 결과값을 얻을 수 있는 근사치라고 판단할 수 있다. <math>F_B</math>와 <math>F_P</math>를 각각 베르누이 분포와 푸아송 분포의 확률 질량 함수라고 하면, 다음과 같은 관계가 나타난다. <math>F_B(k; n,p)\approx F_P(k; \lambda=np ) </math> 이 식을 도출해내는 데에는 확률 생성 함수(probability generating function)를 사용한다. 베르누이 시도에서 한번의 성공의 확률을 <math>\lambda \leq 1</math> 이라고 가정하고 각 간격을 <math>n</math>으로 하여 이항 분포로 나타낼 수 있다. <math>P_k^{(n)}=\binom{n}{k}\left ( \frac{\lambda}{n} \right )^k\left ( 1- \frac{\lambda}{n} \right )^{n-k} </math> 이 함수의 생성 함수는 다음과 같다. <math>P^{(n)}(x)=\sum_{k=0}^n p_k^{(n)}x^k=\sum_{k=0}^n\binom{n}{k}\left ( \frac{\lambda}{n} \right )^k\left ( 1- \frac{\lambda}{n} \right )^{n-k}x^k=\sum_{k=0}^n\binom{n}{k}\left ( x \frac{\lambda}{n} \right )^k\left ( 1- \frac{\lambda}{n} \right )^{n-k}=(1-\frac{\lambda}{n}+ \frac{\lambda}{n}x)^n </math> 여기에서 <math>n</math>을 <math>\infty</math>로 보내고 곱셈의 극한 정의를 지수 함수로 바꾸면 푸아송 분포의 생성함수로 바뀌게 된다. <math>\lim_{n \to \infty}P^{(n)}(x)=\lim_{n \to \infty} \left ( 1+ \frac{\lambda(x-1)}{n} \right )^n =e^{\lambda(x-1)} =\sum_{k=0}^\infty \frac{e^{-\lambda}\lambda^k}{k! }x^k</math> === 일반적 사항 === * 푸아송 분포를 따르고 서로 독립인 확률변수 <math>X_1 , X_2</math>에 대하여, 확률변수 <math>Y=X_1-X_2</math>는 skellam distribution을 따른다. * 푸아송 분포를 따르고 서로 독립인 확률변수 <math>X_1, X_2</math>에 대하여, <math>X_1+X_2=k</math>라는 조건이 주어진다면 <math>X_1, X_2</math>는 종속적이게 되고, <math>X_1+X_2</math>의 조건부 분포 <math>X_1</math>는 이항 분포를 따른다. <math>X_1|X_1+X_2=k \sim Binomial\left ( k, \frac{\lambda_1}{\lambda_1+\lambda_2} \right )</math> 두 푸아송 분포의 합이 주어졌을 때 각 변수의 확률을 이항 분포로 모델링 할 수 있다는 것이고, 달리 말하면 두 독립적인 푸아송 분포의 조건부 분포는 이항 분포로 나타낼 수 있다. 일반화하여, <math>X_1, X_2, ..., X_n</math>이 매개변수 <math>\lambda_1, \lambda_2,..., \lambda_n</math>를 갖는 서로 독립인 푸아송 확률 변수라면 다음과 같이 이항 분포로 나타낼 수 있다. <math>X_i|\sum_{j=i}^n X_j=k\sim Binom \left ( k,\frac{\lambda_i}{\sum_{j=1}^n\lambda_j} \right )</math> 더하여, 여러 개의 푸아송 분포를 따르는 변수들이 주어지면, 각 푸아송 변수가 특정 비율로 성공할 확률을 다항 분포(Multinomial distribution)로 나타낼 수 있다. 즉, 여러 개의 서로 독립인 푸아송 변수가 있으면, 그 조건부분포는 다항 분포로 표현될 수 있다. <math>X_i \sim Multinom\left ( k,\frac{\lambda_i}{\sum_{j=1}^n\lambda_j} \right )</math> * <math>X \sim Pois(\lambda)</math> 이고, <math>X=k</math> 일 때, <math>Y</math>의 조건부 분포가 <math>Y| (X=k) \sim B(k,p)</math>이면, <math>Y</math>의 분포는 푸아송 분포 <math>Y \sim Pois(\lambda p)</math>를 따른다. 또한, <math>X=k</math>일때, <math>Y_i</math>가 다항 분포를 따르면, <math>\left \{ Y_i \right \}| (X=k)\sim Multinom(k,p)</math>이며, 각 <math>Y_i</math>는 서로 독립적인 푸아송 분포 <math>Y_i \sim Pois(\lambda p_i)</math>를 따른다. 이때 상관계수 <math>\rho (Y_i,Y_j)=0 </math>이다. 즉 두 변수는 선형적 상관관계가 없고, 독립적이다. * 제곱근 변환: <math>X</math>~<math>Pois(\lambda)</math> 인 경우 <math>Y=2 \sqrt{X} \approx N(2\sqrt{\lambda} ,1)</math> 그리고 <math>Y=\sqrt{X} \approx N(\sqrt{X};1/4)</math> 이 변환을 거친후에는 변환되지 않은 변수보다 정상성에 대한 수렴이 휠씬 빠르다. 다소 복잡하지만 다른 분산 안정화 변환도 사용 가능한데, 그 중 하나가 앤스컴 변환(Anscombe transform)이다. *t>0인 모든 t에 대해 시간 간격 [0,t] 내의 도착 횟수가 평균 <math>\lambda t</math>인 푸아송 분포를 따르면, 도착간 시간 간격의 차례는 평균 <math>1/\lambda</math>인 독립적이고 동일한 지수 분포를 따른다. *푸아송 분포와 카이제곱 분포의 누적 분포 함수는 다음과 같은 관계식이 나타난다. <math>F_{poisson}(k;\lambda )=1-F_{x^2}(2 \lambda ;2(k+1)) {k|k\in N}</math> <math>P(X=k)=F_{x^2}(2 \lambda;2(k+1))-F_{x^2}(2 \lambda;2k)</math> == 같이 보기 == {{위키공용분류}} * [[이산 확률 분포]] * [[이항 분포]] * [[베르누이 분포]] == 각주 == {{각주}} == 외부 링크 == * {{eom|title=Poisson distribution|first=A.V.|last=Prokhorov|언어=en}} * {{매스월드|id=PoissonDistribution|title=Poisson distribution}} {{확률분포}} {{전거 통제}} [[분류:이산분포]] [[분류:계승과 이항식 주제]] [[분류:확률분포]]
이 문서에서 사용한 틀:
틀:Eom
(
원본 보기
)
틀:Llang
(
원본 보기
)
틀:각주
(
원본 보기
)
틀:매스월드
(
원본 보기
)
틀:서적 인용
(
원본 보기
)
틀:위키공용분류
(
원본 보기
)
틀:위키데이터 속성 추적
(
원본 보기
)
틀:전거 통제
(
원본 보기
)
틀:확률분포
(
원본 보기
)
틀:확률분포 정보
(
원본 보기
)
푸아송 분포
문서로 돌아갑니다.
둘러보기 메뉴
개인 도구
로그인
이름공간
문서
토론
한국어
보기
읽기
원본 보기
역사 보기
더 보기
검색
둘러보기
대문
최근 바뀜
임의의 문서로
미디어위키 도움말
특수 문서 목록
도구
여기를 가리키는 문서
가리키는 글의 최근 바뀜
문서 정보