일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 다익스트라
- MYSQL
- 그래프
- DP
- binary search
- 스토어드 프로시저
- Trie
- Two Points
- Dijkstra
- Stored Procedure
- Brute Force
- 이진탐색
- Hash
- String
- union find
- two pointer
- SQL
- Today
- Total
codingfarm
이산형 확률분포(Discrete Distribution)- 이항분포(The Binomial Distribution) 본문
이산형 확률분포(Discrete Distribution)- 이항분포(The Binomial Distribution)
scarecrow1992 2020. 4. 1. 14:12어떤 사건들이 베르누이 시행으로 $n$번 발생되며 성공확률이 $p$일 경우
확률 변수 $x$를 성공 횟수로 두면 $x$는 이항분포를 따르며 아래의 개념들이 성립한다.
$$f(x)={}_n C_x p^x(1-p)^{n-x}$$
$$\mu = np$$
$$\sigma^2 = npq$$
베르누이 실험(bernoulli experiment)
$\circ \;$ 실험의 결과가 상호배타적이고 전체를 포괄하는 두 결과중 하나로 나타내는 확률실험
ex) 하나의 동전을 던져 앞면과 뒷면을 관찰하는 실험, 남$\cdot$여로 구별되는 신생아의 성별, 양$\cdot$부량 으로 판정되는 품질검사
$\circ \;$성공확률을 $p$, 실패확률을 $q$로 두면 $q=1-p$이고 베르누이 실험이 시행때마다 성공의 확률 $p$가 같고 독립적으로 반복해서 이루어지는 시행을 베르누이 시행 (Bernoullis trial)이라 한다.
베르누이 시행에서 성공의 경우를 $X=1$, 실패의 경우를 $X=0$을 갖는다 하면 $X$를 베르누이 확률 변수 라고 한다. 확률변수 $X$의 $pmf$가
$f(x)=p^x(1-p)^{1-x}, x=0,1$
으로 주어질 경우 $X$는 베르누이 분포(Bernoulli Distribution)을 갖는다.
X의 평균과 분산, 표준편차는
$$\begin{align*}
&\mu=E(X)=\sum_{x=0}^{1}xp^x(1-p)^{1-x}=(0)(1-p)+(1)(p)=p\\
&\sigma^2=Var(X)=\sum_{x=0}^{1}(x-p)^2p^x(1-p)^{1-x}=(0-p)^2(1-p)+(1-p)^2p=p(1-p)=pq\\
&\sigma=\sqrt{p(1-p)}=\sqrt{pq}
\end{align*}$$
$n$번의 시행중 $x$번 성공할 경우의 수는
$\displaystyle {}_nC_x=\frac{n!}{x!(n-x)!}$
$X_i$가 $i$번째 베르누이 시행에서의 베르누이확률실험이면 $P(X_i=0)=1-p, P(X_i=1)=p$ 이다.
각 시행은 독립적이기에 $x$번 성공하고 $n-x$번 실패할 확률은
$p^x(1-p)^{n-x}$
$X$의 $pmf$인 $f(x)=P(X=x)$는 서로 배반은 ${}_nC_x$가지 사상들의 확률의 합니다.
즉,
$f(x)={}_nC_xp^x(1-p)^{n-x},x=0,1,2,\cdots,n$
확률 $f(x)$는 $n$번의 베르누이 시행에서 $x$번 성공할 확률이며 이항확률이라 하고 확률변수 X는 이항분포(binomial distribution)을 갖는다고 한다.
이항 확률을 따르는 누적분포함수는 하나하나 계산해야 하지만
그렇게 하지 않고 이항분포표를 통해 빠르게 확인 할 수 있다.
이항실험은 아래의 성질을 만족시킨다.
1. 베르누이(성공-실패) 실험이 $n$회 시행된다. 이때 $n$은 상수이다.
2. 각 시행은 독립이다.
3. 각 시행에서 성공의 확률은 $p$이고 실패의 확률은 $q=1-p$이다.
4. 확률변수 $X$는 $n$회 시해에서 성공의 횟수와 같다.
n이 양의 정수라면 이항전개식(binomial expansion)은 아래와 같다.
$\displaystyle (a+b)^n=\sum_{x=0}^{n}{}_nC_xb^xa^{n-x}$
위 식에서 $b=p$ 그리고 $a=1-p$라 놓으면
$\displaystyle \sum_{x=0}^{n}{}_nC_xp^x(1-p)^{n-x}=[(1-p)+p]^n=1$
이다. 이는 $f(x)$가 $pmf$이기 위한 조건이다.(모든 사건에 대한 확률의 총합은 1이다.)
이항 전개식을 사용하여 이항 분포에 대한 mgf를 구하고 이 mgf를 이용하여 이항분포의 평균과 분산을 구해본다.
$X$의 $mgf$는
$$\begin{align*}
M(t)&=E(e^{tx})=\sum_{x=0}^{n}e^{tx}{}_nC_xp^x(1-p)^{n-x}\\
&=\sum_{x=0}^{n}(pe^t)^x(1-p)^{n-x}\\
&=[(1-p)+pe^t]^n,\;\;-\infty<t<\infty
\end{align*}$$
$M(t)$의 1차 및 2차 도함수는 아래와 같다
$\displaystyle M'(t)=n[(1-p)+pe^t]^{n-1}$
$\displaystyle M''(t)=n(n-1)[(1-p)+pe^t]^{n-2}(pe^t)^2+n[(1-p)+pe^t]^{n-1}(pe^t)$
이산확률변수 $X$의 평균은
$\mu=E(X)=M'(0)=np$
분산은
$\displaystyle \begin{align*}\sigma^2&=E(X^2)-[E(X)]^2=M''(0)-[M'(0)]^2\\&=n(n-1)p^2+np-(np)^2=np(1-p)=npq\end{align*}$
특히 $n=1$일때 $X$는 베르누이 분포를 가지며 모든 실수 $t$에 대하여
$M(t)=(1-p)+pe^t$
이고 $\mu=p, \sigma^2=p(1-p)$이다.
'통계학 > 수리통계학' 카테고리의 다른 글
이산형 확률분포(Discrete Distribution) - 포아송분포(Poisson Distribution) (0) | 2020.04.14 |
---|---|
이산형 확률분포(Discrete Distribution) - 음이항분포(negative binomial distribution) (0) | 2020.04.12 |
이항분포표(Binomial Distribution Table) (0) | 2020.04.01 |
이산형 확률분포(Discrete Distribution)- 특별한 수학적 기댓값 (0) | 2020.03.14 |
이산형 확률분포(Discrete Distribution)- 확률변수, 수학적 기댓값 (0) | 2020.03.07 |