일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- Brute Force
- 스토어드 프로시저
- SQL
- two pointer
- Two Points
- Trie
- MYSQL
- Hash
- Stored Procedure
- DP
- binary search
- 이진탐색
- 다익스트라
- Dijkstra
- union find
- String
- 그래프
- Today
- Total
codingfarm
연속형 확률분포 - 감마분포(The Gamma Distributions) 본문
$\bullet$ 평균 $\lambda$를 갖는 (근사)포아송과정에서 첫발생이 일어날때까지의 시간/간격은 지수분포를 가진다.
$\bullet$ $\alpha$개의 발생이 일어날때까지 시간/공간을 $w$라 할때 확률변수 $w$는 감마분포를 따른다.
감마분포의 $pdf$, $cdf$, 특성값
$$f(w)=\dfrac{\lambda(\lambda w)^{\alpha-1}}{(\alpha-1)!}e^{-\lambda w}$$
$$F(w)=1-\sum_{k=0}^{\alpha-1}\dfrac{(\lambda w)^ke^{-\lambda w}}{k!}$$
시간을 $x$로 치환하고 감마함수로 표현하면
$$f(x)=\dfrac{1}{\Gamma(\alpha) \theta^\alpha}x^{\alpha-1}e^{-x/\theta},\;\;\;\;\;\;\;0\leq x\ < \infty$$
$$\mu=\alpha \theta,\;\;\;\;\;\sigma^2=\alpha \theta^2$$
포아송분포에서 $\alpha$ 개의 사건이 발생할때 까지 기다리는 시간이 $W$라 가정하자.
대기시간 $w$에서 $\alpha$개의 사건이 일어날 확률은 $P(W=w)$이다.
$w$의 $cdf$는 $w \geq 0$일때 아래와 같이 정의 할 수 있다.
$P(W<w)\; :$ $\alpha$개의 사건이 일어나는 시간이 $w$ 미만일 확률
위 사건의 여집합의 확률은 $P(W>w)$ 이며, 이는 $\alpha$ 개의 사건이 일어나는 시간이 $w$ 초과일 확률로 볼 수 있다.
핵심은 $w$이후에서 $\alpha$개의 사건이 발생하면 되는것이다. 이는 $\alpha -1$이나 $\alpha -2$ 개의 사건이 $w$ 이후에 발생해도 된다고 볼 수 있다.
즉, $w$시간 까지 $0 \sim \alpha-1$개의 사건이 일어날 확률과 같다고 볼 수 있다.
그러므로
$$\begin{align*}
F(w)&=P(W \leq w)=1 - P(W>w)\\
&=1-P([0,w]에서\;\alpha-1\;이하개의\;사건이\;발생한다)\\
&=1-\sum_{k=0}^{\alpha-1}\dfrac{(\lambda w)^ke^{-\lambda w}}{k!}
\end{align*}$$
으로 주어진다.
여기서
$\displaystyle \dfrac{(\lambda w)^ke^{-\lambda w}}{k!}$ : 구간 $w$에서 평균 $\lambda$만큼의 사건 발생하는 포아송분포에서 사건이 $k$번 발생할 확률
$w$가 연속형확률변수이므로 $F'(w)$가 존재한다.
$F'(w)=w의\;pdf$
그러므로 $w>0$에 대해 $F(w)$를 미분해보도록 하자
$$F(w)=1-\sum_{k=0}^{\alpha-1}\dfrac{(\lambda w)^k e^{\lambda w}}{k!}=1-\left(e^{\lambda w}+\sum_{k=1}^{\alpha-1}\dfrac{(\lambda w)^k e^{\lambda w}}{k!} \right)$$
$F(w)$를 $w$에 대해미분하기 위해선 제일 우변의 $\displaystyle \sum_{k=1}^{\alpha-1}\dfrac{(\lambda w)^k e^{\lambda w}}{k!}$를 미분한 결과를 우선 알아야한다. 그럼 곱의 미분에 의해
$$\left(\displaystyle\sum_{k=1}^{\alpha-1}\dfrac{(\lambda w)^k e^{\lambda w}}{k!}\right)'=e^{-\lambda w}\left[\dfrac{k(\lambda w)^{k-1}\lambda}{k!}-\dfrac{(\lambda w)^k\lambda}{k!}\right]$$
이므로
$$\begin{align*}
F'(w)&=\lambda e^{-\lambda w}-e^{-\lambda w}\sum_{k=1}^{\alpha-1}\left[\dfrac{k(\lambda w)^{k-1}\lambda}{k!}-\dfrac{(\lambda w)^k\lambda}{k!}\right]\\
&=\lambda e^{-\lambda w}-e^{-\lambda w}\left[\lambda-\dfrac{\lambda(\lambda w)^{\alpha-1}}{(\alpha-1)!}\right]\\
&=\dfrac{\lambda(\lambda w)^{\alpha-1}}{(\alpha-1)!}e^{-\lambda w}
\end{align*}$$
그러므로 확률변수 $w$의 $pdf$는
$$f(w)=\dfrac{\lambda(\lambda w)^{\alpha-1}}{(\alpha-1)!}e^{-\lambda w}$$
$w<0$이면 $F(w)=0$이고 $f(w)=0$ 이다.
$\blacksquare$
이제 $pdf$를 감마함수(gamma function)를 이용해 표현해보자
$$\Gamma(t)=\int_{0}^{\infty}y^{t-1}e^{-y}dy\;\;\;,t>0$$
$y^{t-1} > 0$ 그리고 $e^{-y}>0$ 이므로 피적분함수가 양수이다. 그러므로 $t>0$에 대해 적분값은 항상 양수이다.
$t>1$이라면 부분적분에 의해
$$\begin{align*}
\Gamma(t)&=\left[ -y^{t-1}e^{-y} \right]_{0}^{\infty}+\int_{0}^{\infty} (t-1)y^{t-2}e^{-y}dy\\
&=(t-1)\int_{0}^{\infty}y^{t-2}e^{-y}dy=(t-1)\Gamma(t-1)
\end{align*}$$
예를들어 $\Gamma(6)=5\Gamma(5)$이고 $\Gamma(3)=2\Gamma(2)=(2)(1)\Gamma(1)$이며, $\displaystyle \Gamma(1)=\int_{0}^{\infty} e^{-y} dy =1$ 이다.
$t=n(positive\;integer)$ 일때 $\Gamma(t)=(t-1)\Gamma(t-1)$ 이므로
$\Gamma(n)=(n-1)\Gamma(n-1)=(n-1)(n-2)\cdots(2)(1)\Gamma(1)=(n-1)(n-2)\cdots(2)(1)$
그러므로 $n$이 양의 정수일때.
$$\Gamma(n)=(n-1)!$$
와 같다.
이로부터 $\Gamma(1)=0!=1$ 임을 알 수 있다.
이제 감마함수를 이용해서 감마분포의 $pdf$를 정의하는 특성값을 정의한다.
확률변수 $X$의 $pdf$가.
$$\frac{1}{\Gamma(\alpha)\theta^\alpha}x^{\alpha-1}x^{-x/\theta},\;\;\;\;\;0\leq x<\infty$$
로 주어진다면 $X$는 감마분포(gamma distribution)을 갖는다.
포아송과정에서 $\alpha$개의 사건이 발생할때가지 기다리는 신간을 나타내는 확률변수 $w$는 모수$\alpha$와 $\displaystyle \theta=\frac{1}{\lambda}$을 갖는 감마분포를 갖는다.
$pdf$의 성질인 $\int_{-\infty}^{\infty}f(x)\;dx=1$ 임을 감마분포의 $pdf$도 가짐을 확인해보자.
$f(x) \geq 0$ 이고
$$\int_{-\infty}^{\infty}f(x)dx=\int_{0}^{\infty}\frac{x^{\alpha-1}e^{-x/\theta}}{\Gamma(\alpha)\theta^\alpha}dx$$
$y=\dfrac{x}{\theta}$의 변환에 의해
$$\int_{0}^{\infty}\frac{(\theta y)^{\alpha-1}e^{-y}} {\Gamma(\alpha)\theta^\alpha} \theta\;dy=\frac{1}{\Gamma(\alpha)}\int_{0}^{\infty}y^{\alpha-1}e^{-y}\;dy=\frac{\Gamma(\alpha)}{\Gamma(\alpha)}=1$$
$\blacksquare$
감마분포의 평균과 분산을 구해보자. 먼저 $mgf$를 계산한다
$X$의 $mgf$는
$$M(t)=\frac{1}{(1-\theta t)^\alpha}\;\;\;\;,t<\dfrac{1}{\theta}$$
이며
$$\mu=\alpha \theta,\;\;\;\;\;\sigma^2=\alpha \theta^2$$
이다.
평균의 의미는 $\alpha$번째 사건이 발생하기 까지 걸린 경과시간의 평균이며
이는 각 사건간의 대기시간인 $\theta$에 $\alpha$를 곱한 값이라는 우리의 직관과 일치한다.
위 그림은 $\alpha$와 $\theta$의 값에 따라 감마 $pdf$의 형태가 달라짐을 보여준다.
고전된 $\theta(\alpha)$에 대해서는 $\alpha(\theta)$가 증가함에 따라 $pdf$는 오른쪽으로 이동하고 낮아진다.
$\theta=\dfrac{1}{\lambda}$이므로 $\theta$가 증가하면 $\lambda$는 감소한다. 즉, $\theta_2>\theta_1$ 이면 $\lambda_2<\lambda_1$이다.
즉, 단위구간에서 평균발생건수$\lambda$가 감소하면 $\alpha$개의 발생을 관측할때까지의 대기시간이 증가한다는 우리의 직관과 일치함을 알 수 있다.
'통계학 > 수리통계학' 카테고리의 다른 글
정규 분포(Normal Distribution) (0) | 2020.06.24 |
---|---|
연속형 확률분포 - 카이제곱분포(chi-square distribution) (0) | 2020.04.30 |
연속형 확률분포 - 지수분포(The Exponential Distributions) (0) | 2020.04.21 |
연속형 확률분포 - 연속형 확률변수(Continuous Random Variables of The Continuous Type ) (0) | 2020.04.21 |
포아송분포표(Poisson Distribution Table) (0) | 2020.04.14 |