일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Dijkstra
- String
- 스토어드 프로시저
- 이진탐색
- two pointer
- Brute Force
- Stored Procedure
- binary search
- Two Points
- 그래프
- Hash
- union find
- MYSQL
- SQL
- 다익스트라
- Trie
- DP
- Today
- Total
codingfarm
연속형 확률분포 - 감마분포(The Gamma Distributions) 본문
∙∙ 평균 λλ를 갖는 (근사)포아송과정에서 첫발생이 일어날때까지의 시간/간격은 지수분포를 가진다.
∙∙ αα개의 발생이 일어날때까지 시간/공간을 ww라 할때 확률변수 ww는 감마분포를 따른다.
감마분포의 pdfpdf, cdfcdf, 특성값
f(w)=λ(λw)α−1(α−1)!e−λwf(w)=λ(λw)α−1(α−1)!e−λw
F(w)=1−α−1∑k=0(λw)ke−λwk!F(w)=1−α−1∑k=0(λw)ke−λwk!
시간을 xx로 치환하고 감마함수로 표현하면
f(x)=1Γ(α)θαxα−1e−x/θ,0≤x <∞f(x)=1Γ(α)θαxα−1e−x/θ,0≤x <∞
μ=αθ,σ2=αθ2μ=αθ,σ2=αθ2
포아송분포에서 αα 개의 사건이 발생할때 까지 기다리는 시간이 WW라 가정하자.
대기시간 ww에서 αα개의 사건이 일어날 확률은 P(W=w)P(W=w)이다.
ww의 cdfcdf는 w≥0w≥0일때 아래와 같이 정의 할 수 있다.
P(W<w):P(W<w): αα개의 사건이 일어나는 시간이 ww 미만일 확률
위 사건의 여집합의 확률은 P(W>w)P(W>w) 이며, 이는 αα 개의 사건이 일어나는 시간이 ww 초과일 확률로 볼 수 있다.
핵심은 ww이후에서 αα개의 사건이 발생하면 되는것이다. 이는 α−1α−1이나 α−2α−2 개의 사건이 ww 이후에 발생해도 된다고 볼 수 있다.
즉, ww시간 까지 0∼α−10∼α−1개의 사건이 일어날 확률과 같다고 볼 수 있다.
그러므로
F(w)=P(W≤w)=1−P(W>w)=1−P([0,w]에서α−1이하개의사건이발생한다)=1−α−1∑k=0(λw)ke−λwk!
으로 주어진다.
여기서
(λw)ke−λwk! : 구간 w에서 평균 λ만큼의 사건 발생하는 포아송분포에서 사건이 k번 발생할 확률
w가 연속형확률변수이므로 F′(w)가 존재한다.
F′(w)=w의pdf
그러므로 w>0에 대해 F(w)를 미분해보도록 하자
F(w)=1−α−1∑k=0(λw)keλwk!=1−(eλw+α−1∑k=1(λw)keλwk!)
F(w)를 w에 대해미분하기 위해선 제일 우변의 α−1∑k=1(λw)keλwk!를 미분한 결과를 우선 알아야한다. 그럼 곱의 미분에 의해
(α−1∑k=1(λw)keλwk!)′=e−λw[k(λw)k−1λk!−(λw)kλk!]
이므로
F′(w)=λe−λw−e−λwα−1∑k=1[k(λw)k−1λk!−(λw)kλk!]=λe−λw−e−λw[λ−λ(λw)α−1(α−1)!]=λ(λw)α−1(α−1)!e−λw
그러므로 확률변수 w의 pdf는
f(w)=λ(λw)α−1(α−1)!e−λw
w<0이면 F(w)=0이고 f(w)=0 이다.
◼
이제 pdf를 감마함수(gamma function)를 이용해 표현해보자
Γ(t)=∫∞0yt−1e−ydy,t>0
yt−1>0 그리고 e−y>0 이므로 피적분함수가 양수이다. 그러므로 t>0에 대해 적분값은 항상 양수이다.
t>1이라면 부분적분에 의해
Γ(t)=[−yt−1e−y]∞0+∫∞0(t−1)yt−2e−ydy=(t−1)∫∞0yt−2e−ydy=(t−1)Γ(t−1)
예를들어 Γ(6)=5Γ(5)이고 Γ(3)=2Γ(2)=(2)(1)Γ(1)이며, Γ(1)=∫∞0e−ydy=1 이다.
t=n(positiveinteger) 일때 Γ(t)=(t−1)Γ(t−1) 이므로
Γ(n)=(n−1)Γ(n−1)=(n−1)(n−2)⋯(2)(1)Γ(1)=(n−1)(n−2)⋯(2)(1)
그러므로 n이 양의 정수일때.
Γ(n)=(n−1)!
와 같다.
이로부터 Γ(1)=0!=1 임을 알 수 있다.
이제 감마함수를 이용해서 감마분포의 pdf를 정의하는 특성값을 정의한다.
확률변수 X의 pdf가.
1Γ(α)θαxα−1x−x/θ,0≤x<∞
로 주어진다면 X는 감마분포(gamma distribution)을 갖는다.
포아송과정에서 α개의 사건이 발생할때가지 기다리는 신간을 나타내는 확률변수 w는 모수α와 θ=1λ을 갖는 감마분포를 갖는다.
pdf의 성질인 ∫∞−∞f(x)dx=1 임을 감마분포의 pdf도 가짐을 확인해보자.
f(x)≥0 이고
∫∞−∞f(x)dx=∫∞0xα−1e−x/θΓ(α)θαdx
y=xθ의 변환에 의해
∫∞0(θy)α−1e−yΓ(α)θαθdy=1Γ(α)∫∞0yα−1e−ydy=Γ(α)Γ(α)=1
◼
감마분포의 평균과 분산을 구해보자. 먼저 mgf를 계산한다
X의 mgf는
M(t)=1(1−θt)α,t<1θ
이며
μ=αθ,σ2=αθ2
이다.
평균의 의미는 α번째 사건이 발생하기 까지 걸린 경과시간의 평균이며
이는 각 사건간의 대기시간인 θ에 α를 곱한 값이라는 우리의 직관과 일치한다.

위 그림은 α와 θ의 값에 따라 감마 pdf의 형태가 달라짐을 보여준다.
고전된 θ(α)에 대해서는 α(θ)가 증가함에 따라 pdf는 오른쪽으로 이동하고 낮아진다.
θ=1λ이므로 θ가 증가하면 λ는 감소한다. 즉, θ2>θ1 이면 λ2<λ1이다.
즉, 단위구간에서 평균발생건수λ가 감소하면 α개의 발생을 관측할때까지의 대기시간이 증가한다는 우리의 직관과 일치함을 알 수 있다.
'통계학 > 수리통계학' 카테고리의 다른 글
정규 분포(Normal Distribution) (0) | 2020.06.24 |
---|---|
연속형 확률분포 - 카이제곱분포(chi-square distribution) (0) | 2020.04.30 |
연속형 확률분포 - 지수분포(The Exponential Distributions) (0) | 2020.04.21 |
연속형 확률분포 - 연속형 확률변수(Continuous Random Variables of The Continuous Type ) (0) | 2020.04.21 |
포아송분포표(Poisson Distribution Table) (0) | 2020.04.14 |