Notice
Recent Posts
Recent Comments
Link
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
Archives
Today
Total
관리 메뉴

codingfarm

이산형 확률분포(Discrete Distribution) - 음이항분포(negative binomial distribution) 본문

통계학/수리통계학

이산형 확률분포(Discrete Distribution) - 음이항분포(negative binomial distribution)

scarecrow1992 2020. 4. 12. 13:36
음이항분포는 베르누이 시행을 미리정한 성공횟수 r회가 될때까지 반복 시행할때 확률변수 X가 나타내는 분포를 말한다.
  pmf는 아래와 같다.
g(x)=x1Cr1pr(1p)xr=x1Cr1prqxr,x=r,r+1

음이항분포는 n번의 시행(여러번의 베르누이 독립시행)에서 n1번의 실패에 대한 확률을 구하는 것이다.

 베르누이 시행을 독립으로 반복하는 확률실험에서 Xr회 성공하는데 필요한 시행 횟수라 하면, 확률의 곱셈법칙에 의해 Xpmf g(x)x1번째의 시행까지에서 정확하게 r1회 성공할 확률

x1Cr1pr1(1p)xr=x1Cr1pr1qxr

r번째의 시행에서 성공할 확률 p를 곱하는 것과 같다. 그러므로 확률변수 Xpmf

g(x)=x1Cr1pr(1p)xr=x1Cr1prqxr,x=r,r+1

으로 주어진다면 X는 모수 r=1,20<p<1를 갖는 음이항분포를 갖는다.

 

음이항분포라는 명칭의 이유로는 음의 지수 r을 갖는 h(w)=(1w)r의 이항급수전개 결과로 붙여진 것이다. 맥로우린 급수전개를 이용하면

(1w)r=k=0h(k)(0)k!wk=k=0r+k1Cr1wk,1<w<1.

이제 마지막 등식에서 x=k+r이라 놓으면 k=xr이고

(1w)r=k=0r+xr1Cr1wxr=x=rx1Cr1wxr

이것은 pr을 제외하고 w=q일 때의 음이항확률의 총합이다. 음이항분포의 확률의 총합은 다음과 같이 1이 된다.

x=rg(x)=x=rx1Cr1prqxr=prqxr=pr(1q)r=1

 

r=1일 때 X기하분포(geometric distribution)를 갖는다고 하는데 이는 pmf가 기하급수의 항으로 구성되기 때문이다.

즉, 기하분포베르누이 시행에서 처음 성공까지 시도한 횟수 X의 분포이다.

g(x)=p(1p)x1,x=1,2,3,

기하분포의 누적 분포 함수(cdf)는 아래와 같다.
P(X>k)=x=k+1(1p)x1p=(1p)kp1(1p)=(1p)k=qk
P(Xk)=kx=1(1p)x1p=1P(X>k)=1(1p)k=1qk

기하급수가 |r|<1일때

k=0ark=k=1ark1=a1r

이 됨을 이용하면 기하분포에 대해

x=1g(x)=x=1(1p)x1p=p1(1p)=1

이 되어 g(x)pmf의 성질을 만족시킴을 확인하였다.

k가 정수일 때 기합급수의 합으로부터

P(X>k)=x=k+1(1p)x1p=(1p)kp1(1p)=(1p)k=qk

이다. 따라서 양의 정수 k에서 분포함수의 값은

P(Xk)=kx=1(1p)x1p=1P(X>k)=1(1p)k=1qk

이다.

 

음이항분포의 평균과 분산

μ=rp
σ2=r(1p)p2

평균과 분산을 구하기 위해 음이항분포의 mgf를 계산해본다

(1p)et<1 혹은 t<ln(1p)에 대해

M(t)=x=retxx1Cr1pr(1p)xr=(pet)rx=rx1Cr1[(1p)et]xr=(pet)r[1(1p)et]r

따라서

M(t)=(pet)r(r)[1(1p)et]r1[(1p)et]+r(pet)r1(pet)[1(1p)et]r=r(pet)r[1(1p)et]r1

이고

M

따라서

\begin{align*} M'(0)&=rp^rp^{-r-1}=rp^{-1}&\\ M''(0) &=r(r+1)p^rp^{-r-2}(1-p)+r^2p^rp^{-r-1}&\\  &=rp^{-2}[(1-p)(r+1)+rp]&\\  &=rp^{-2}(r+1-p)& \end{align*}

그러므로

\displaystyle \mu=\frac{r}{p} 그리고 \displaystyle \sigma^2=\frac{r(r+1-p)}{p^2}-\frac{r^2}{p^2}=\frac{r(1-p)}{p^2}

 

위 그림은 음이항분포의 두개 모수인 pr의 값에 따른 확률 히스토그램을 보여준다.

적률 생성 함수가 존재한다면 t=0에서 모든 차수의 도함수가 된다. 따라서 M(t)를 맥로우린의 급수, 즉
M(t)=M(0)+M'(0)\left(\frac{t}{1!}\right)+M''(0)\left(\frac{t^2}{2!}\right)+M'''(0)\left(\frac{t^3}{3!}\right)+\cdots
으로 표현할 수 있다.

M(t) 맥로우린 급수전개가 존재하고 적률이 주어진다면 맥로우린 급수를 합하여 M(t)의 식을 명백한 형태로 구할 수 있다. 이는 다음 예에서 확인 가능하다.

\blacksquare

 

연습문제