Notice
Recent Posts
Recent Comments
Link
«   2024/11   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
Archives
Today
Total
관리 메뉴

codingfarm

연속형 확률분포 - 감마분포(The Gamma Distributions) 본문

통계학/수리통계학

연속형 확률분포 - 감마분포(The Gamma Distributions)

scarecrow1992 2020. 4. 23. 01:26

$\bullet$ 평균 $\lambda$를 갖는 (근사)포아송과정에서 첫발생이 일어날때까지의 시간/간격은 지수분포를 가진다.

$\bullet$ $\alpha$개의 발생이 일어날때까지 시간/공간을 $w$라 할때 확률변수 $w$는 감마분포를 따른다.

감마분포의 $pdf$, $cdf$, 특성값
$$f(w)=\dfrac{\lambda(\lambda w)^{\alpha-1}}{(\alpha-1)!}e^{-\lambda w}$$
$$F(w)=1-\sum_{k=0}^{\alpha-1}\dfrac{(\lambda w)^ke^{-\lambda w}}{k!}$$

시간을 $x$로 치환하고 감마함수로 표현하면
$$f(x)=\dfrac{1}{\Gamma(\alpha) \theta^\alpha}x^{\alpha-1}e^{-x/\theta},\;\;\;\;\;\;\;0\leq x\ < \infty$$
$$\mu=\alpha \theta,\;\;\;\;\;\sigma^2=\alpha \theta^2$$

 

포아송분포에서 $\alpha$ 개의 사건이 발생할때 까지 기다리는 시간이 $W$라 가정하자.

대기시간 $w$에서 $\alpha$개의 사건이 일어날 확률은 $P(W=w)$이다.

$w$의 $cdf$는 $w \geq 0$일때 아래와 같이 정의 할 수 있다.

$P(W<w)\; :$ $\alpha$개의 사건이 일어나는 시간이 $w$ 미만일 확률

위 사건의 여집합의 확률은 $P(W>w)$ 이며, 이는 $\alpha$ 개의 사건이 일어나는 시간이 $w$ 초과일 확률로 볼 수 있다.

핵심은 $w$이후에서 $\alpha$개의 사건이 발생하면 되는것이다. 이는 $\alpha -1$이나 $\alpha -2$ 개의 사건이 $w$ 이후에 발생해도 된다고 볼 수 있다.

즉, $w$시간 까지 $0 \sim \alpha-1$개의 사건이 일어날 확률과 같다고 볼 수 있다.

그러므로

$$\begin{align*} 
F(w)&=P(W \leq w)=1 - P(W>w)\\ 
&=1-P([0,w]에서\;\alpha-1\;이하개의\;사건이\;발생한다)\\ 
&=1-\sum_{k=0}^{\alpha-1}\dfrac{(\lambda w)^ke^{-\lambda w}}{k!} 
\end{align*}$$

으로 주어진다.

 

여기서

$\displaystyle \dfrac{(\lambda w)^ke^{-\lambda w}}{k!}$ : 구간 $w$에서 평균 $\lambda$만큼의 사건 발생하는 포아송분포에서 사건이 $k$번 발생할 확률 

 

 

$w$가 연속형확률변수이므로 $F'(w)$가 존재한다.

$F'(w)=w의\;pdf$

그러므로 $w>0$에 대해 $F(w)$를 미분해보도록 하자

$$F(w)=1-\sum_{k=0}^{\alpha-1}\dfrac{(\lambda w)^k e^{\lambda w}}{k!}=1-\left(e^{\lambda w}+\sum_{k=1}^{\alpha-1}\dfrac{(\lambda w)^k e^{\lambda w}}{k!} \right)$$

$F(w)$를 $w$에 대해미분하기 위해선 제일 우변의 $\displaystyle \sum_{k=1}^{\alpha-1}\dfrac{(\lambda w)^k e^{\lambda w}}{k!}$를 미분한 결과를 우선 알아야한다. 그럼 곱의 미분에 의해

$$\left(\displaystyle\sum_{k=1}^{\alpha-1}\dfrac{(\lambda w)^k e^{\lambda w}}{k!}\right)'=e^{-\lambda w}\left[\dfrac{k(\lambda w)^{k-1}\lambda}{k!}-\dfrac{(\lambda w)^k\lambda}{k!}\right]$$

이므로

$$\begin{align*}
F'(w)&=\lambda e^{-\lambda w}-e^{-\lambda w}\sum_{k=1}^{\alpha-1}\left[\dfrac{k(\lambda w)^{k-1}\lambda}{k!}-\dfrac{(\lambda w)^k\lambda}{k!}\right]\\
&=\lambda e^{-\lambda w}-e^{-\lambda w}\left[\lambda-\dfrac{\lambda(\lambda w)^{\alpha-1}}{(\alpha-1)!}\right]\\
&=\dfrac{\lambda(\lambda w)^{\alpha-1}}{(\alpha-1)!}e^{-\lambda w}
\end{align*}$$

그러므로 확률변수 $w$의 $pdf$는

$$f(w)=\dfrac{\lambda(\lambda w)^{\alpha-1}}{(\alpha-1)!}e^{-\lambda w}$$

$w<0$이면  $F(w)=0$이고 $f(w)=0$ 이다.

$\blacksquare$

 

 

이제 $pdf$를 감마함수(gamma function)를 이용해 표현해보자

$$\Gamma(t)=\int_{0}^{\infty}y^{t-1}e^{-y}dy\;\;\;,t>0$$

$y^{t-1} > 0$ 그리고 $e^{-y}>0$ 이므로 피적분함수가 양수이다. 그러므로 $t>0$에 대해 적분값은 항상 양수이다.

$t>1$이라면 부분적분에 의해

$$\begin{align*}
\Gamma(t)&=\left[ -y^{t-1}e^{-y} \right]_{0}^{\infty}+\int_{0}^{\infty} (t-1)y^{t-2}e^{-y}dy\\
&=(t-1)\int_{0}^{\infty}y^{t-2}e^{-y}dy=(t-1)\Gamma(t-1)
\end{align*}$$

 

예를들어 $\Gamma(6)=5\Gamma(5)$이고 $\Gamma(3)=2\Gamma(2)=(2)(1)\Gamma(1)$이며, $\displaystyle \Gamma(1)=\int_{0}^{\infty} e^{-y} dy =1$ 이다.

$t=n(positive\;integer)$ 일때 $\Gamma(t)=(t-1)\Gamma(t-1)$ 이므로

$\Gamma(n)=(n-1)\Gamma(n-1)=(n-1)(n-2)\cdots(2)(1)\Gamma(1)=(n-1)(n-2)\cdots(2)(1)$

그러므로 $n$이 양의 정수일때.

$$\Gamma(n)=(n-1)!$$

와 같다.

이로부터 $\Gamma(1)=0!=1$ 임을 알 수 있다.

 

이제 감마함수를 이용해서 감마분포의 $pdf$를 정의하는 특성값을 정의한다.

확률변수 $X$의 $pdf$가.

$$\frac{1}{\Gamma(\alpha)\theta^\alpha}x^{\alpha-1}x^{-x/\theta},\;\;\;\;\;0\leq x<\infty$$

로 주어진다면 $X$는 감마분포(gamma distribution)을 갖는다.

 

포아송과정에서 $\alpha$개의 사건이 발생할때가지 기다리는 신간을 나타내는 확률변수 $w$는 모수$\alpha$와 $\displaystyle \theta=\frac{1}{\lambda}$을 갖는 감마분포를 갖는다.

$pdf$의 성질인 $\int_{-\infty}^{\infty}f(x)\;dx=1$ 임을 감마분포의 $pdf$도 가짐을 확인해보자.

$f(x) \geq 0$ 이고

$$\int_{-\infty}^{\infty}f(x)dx=\int_{0}^{\infty}\frac{x^{\alpha-1}e^{-x/\theta}}{\Gamma(\alpha)\theta^\alpha}dx$$

$y=\dfrac{x}{\theta}$의 변환에 의해

$$\int_{0}^{\infty}\frac{(\theta y)^{\alpha-1}e^{-y}} {\Gamma(\alpha)\theta^\alpha} \theta\;dy=\frac{1}{\Gamma(\alpha)}\int_{0}^{\infty}y^{\alpha-1}e^{-y}\;dy=\frac{\Gamma(\alpha)}{\Gamma(\alpha)}=1$$

$\blacksquare$

 

감마분포의 평균과 분산을 구해보자. 먼저 $mgf$를 계산한다

$X$의 $mgf$는

$$M(t)=\frac{1}{(1-\theta t)^\alpha}\;\;\;\;,t<\dfrac{1}{\theta}$$

이며

$$\mu=\alpha \theta,\;\;\;\;\;\sigma^2=\alpha \theta^2$$

이다.

평균의 의미는 $\alpha$번째 사건이 발생하기 까지 걸린 경과시간의 평균이며

이는 각 사건간의 대기시간인 $\theta$에 $\alpha$를 곱한 값이라는 우리의 직관과 일치한다.

 

위 그림은 $\alpha$와 $\theta$의 값에 따라 감마 $pdf$의 형태가 달라짐을 보여준다.

고전된 $\theta(\alpha)$에 대해서는 $\alpha(\theta)$가 증가함에 따라 $pdf$는 오른쪽으로 이동하고 낮아진다.

$\theta=\dfrac{1}{\lambda}$이므로 $\theta$가 증가하면 $\lambda$는 감소한다. 즉, $\theta_2>\theta_1$ 이면 $\lambda_2<\lambda_1$이다.

즉, 단위구간에서 평균발생건수$\lambda$가 감소하면 $\alpha$개의 발생을 관측할때까지의 대기시간이 증가한다는 우리의 직관과 일치함을 알 수 있다.

Comments