일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- two pointer
- union find
- Brute Force
- Trie
- 스토어드 프로시저
- DP
- Hash
- String
- Dijkstra
- 이진탐색
- 그래프
- Stored Procedure
- SQL
- 다익스트라
- Two Points
- MYSQL
- binary search
- Today
- Total
codingfarm
이산형 확률분포(Discrete Distribution) - 음이항분포(negative binomial distribution) 본문
이산형 확률분포(Discrete Distribution) - 음이항분포(negative binomial distribution)
scarecrow1992 2020. 4. 12. 13:36음이항분포는 베르누이 시행을 미리정한 성공횟수 r회가 될때까지 반복 시행할때 확률변수 X가 나타내는 분포를 말한다.
pmf는 아래와 같다.
g(x)=x−1Cr−1pr(1−p)x−r=x−1Cr−1prqx−r,x=r,r+1⋯
음이항분포는 n번의 시행(여러번의 베르누이 독립시행)에서 n−1번의 실패에 대한 확률을 구하는 것이다.
베르누이 시행을 독립으로 반복하는 확률실험에서 X를 r회 성공하는데 필요한 시행 횟수라 하면, 확률의 곱셈법칙에 의해 X의 pmf g(x)는 x−1번째의 시행까지에서 정확하게 r−1회 성공할 확률
x−1Cr−1pr−1(1−p)x−r=x−1Cr−1pr−1qx−r
과 r번째의 시행에서 성공할 확률 p를 곱하는 것과 같다. 그러므로 확률변수 X의 pmf가
g(x)=x−1Cr−1pr(1−p)x−r=x−1Cr−1prqx−r,x=r,r+1⋯
으로 주어진다면 X는 모수 r=1,2⋯와 0<p<1를 갖는 음이항분포를 갖는다.
◼
음이항분포라는 명칭의 이유로는 음의 지수 −r을 갖는 h(w)=(1−w)−r의 이항급수전개 결과로 붙여진 것이다. 맥로우린 급수전개를 이용하면
(1−w)−r=∞∑k=0h(k)(0)k!wk=∞∑k=0r+k−1Cr−1wk,−1<w<1.
이제 마지막 등식에서 x=k+r이라 놓으면 k=x−r이고
(1−w)−r=∞∑k=0r+x−r−1Cr−1wx−r=∞∑x=rx−1Cr−1wx−r
이것은 pr을 제외하고 w=q일 때의 음이항확률의 총합이다. 음이항분포의 확률의 총합은 다음과 같이 1이 된다.
∞∑x=rg(x)=∞∑x=rx−1Cr−1prqx−r=prqx−r=pr(1−q)−r=1
◼
r=1일 때 X는 기하분포(geometric distribution)를 갖는다고 하는데 이는 pmf가 기하급수의 항으로 구성되기 때문이다.
즉, 기하분포란 베르누이 시행에서 처음 성공까지 시도한 횟수 X의 분포이다.
g(x)=p(1−p)x−1,x=1,2,3,⋯
기하분포의 누적 분포 함수(cdf)는 아래와 같다.
P(X>k)=∞∑x=k+1(1−p)x−1p=(1−p)kp1−(1−p)=(1−p)k=qk
P(X≤k)=k∑x=1(1−p)x−1p=1−P(X>k)=1−(1−p)k=1−qk
기하급수가 |r|<1일때
∞∑k=0ark=∞∑k=1ark−1=a1−r
이 됨을 이용하면 기하분포에 대해
∞∑x=1g(x)=∞∑x=1(1−p)x−1p=p1−(1−p)=1
이 되어 g(x)는 pmf의 성질을 만족시킴을 확인하였다.
k가 정수일 때 기합급수의 합으로부터
P(X>k)=∞∑x=k+1(1−p)x−1p=(1−p)kp1−(1−p)=(1−p)k=qk
이다. 따라서 양의 정수 k에서 분포함수의 값은
P(X≤k)=k∑x=1(1−p)x−1p=1−P(X>k)=1−(1−p)k=1−qk
이다.
◼
음이항분포의 평균과 분산
μ=rp
σ2=r(1−p)p2
평균과 분산을 구하기 위해 음이항분포의 mgf를 계산해본다
(1−p)et<1 혹은 t<−ln(1−p)에 대해
M(t)=∞∑x=retxx−1Cr−1pr(1−p)x−r=(pet)r∞∑x=rx−1Cr−1[(1−p)et]x−r=(pet)r[1−(1−p)et]r
따라서
M′(t)=(pet)r(−r)[1−(1−p)et]−r−1[−(1−p)et]+r(pet)r−1(pet)[1−(1−p)et]−r=r(pet)r[1−(1−p)et]−r−1
이고
M″
따라서
\begin{align*} M'(0)&=rp^rp^{-r-1}=rp^{-1}&\\ M''(0) &=r(r+1)p^rp^{-r-2}(1-p)+r^2p^rp^{-r-1}&\\ &=rp^{-2}[(1-p)(r+1)+rp]&\\ &=rp^{-2}(r+1-p)& \end{align*}
그러므로
\displaystyle \mu=\frac{r}{p} 그리고 \displaystyle \sigma^2=\frac{r(r+1-p)}{p^2}-\frac{r^2}{p^2}=\frac{r(1-p)}{p^2}

위 그림은 음이항분포의 두개 모수인 p와 r의 값에 따른 확률 히스토그램을 보여준다.
적률 생성 함수가 존재한다면 t=0에서 모든 차수의 도함수가 된다. 따라서 M(t)를 맥로우린의 급수, 즉
M(t)=M(0)+M'(0)\left(\frac{t}{1!}\right)+M''(0)\left(\frac{t^2}{2!}\right)+M'''(0)\left(\frac{t^3}{3!}\right)+\cdots
으로 표현할 수 있다.
M(t) 맥로우린 급수전개가 존재하고 적률이 주어진다면 맥로우린 급수를 합하여 M(t)의 식을 명백한 형태로 구할 수 있다. 이는 다음 예에서 확인 가능하다.
\blacksquare
연습문제
'통계학 > 수리통계학' 카테고리의 다른 글
포아송분포표(Poisson Distribution Table) (0) | 2020.04.14 |
---|---|
이산형 확률분포(Discrete Distribution) - 포아송분포(Poisson Distribution) (0) | 2020.04.14 |
이항분포표(Binomial Distribution Table) (0) | 2020.04.01 |
이산형 확률분포(Discrete Distribution)- 이항분포(The Binomial Distribution) (0) | 2020.04.01 |
이산형 확률분포(Discrete Distribution)- 특별한 수학적 기댓값 (0) | 2020.03.14 |