Notice
Recent Posts
Recent Comments
Link
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
Archives
Today
Total
관리 메뉴

codingfarm

이산형 확률분포(Discrete Distribution)- 이항분포(The Binomial Distribution) 본문

통계학/수리통계학

이산형 확률분포(Discrete Distribution)- 이항분포(The Binomial Distribution)

scarecrow1992 2020. 4. 1. 14:12
어떤 사건들이 베르누이 시행으로 $n$번 발생되며 성공확률이 $p$일 경우
확률 변수 $x$를 성공 횟수로 두면 $x$는 이항분포를 따르며 아래의 개념들이 성립한다.
$$f(x)={}_n C_x p^x(1-p)^{n-x}$$
$$\mu = np$$
$$\sigma^2 = npq$$ 

 

베르누이 실험(bernoulli experiment)

$\circ \;$ 실험의 결과가 상호배타적이고 전체를 포괄하는 두 결과중 하나로 나타내는 확률실험

ex) 하나의 동전을 던져 앞면과 뒷면을 관찰하는 실험, 남$\cdot$여로 구별되는 신생아의 성별, 양$\cdot$부량 으로 판정되는 품질검사

$\circ \;$성공확률을 $p$, 실패확률을 $q$로 두면 $q=1-p$이고 베르누이 실험이 시행때마다 성공의 확률 $p$가 같고 독립적으로 반복해서 이루어지는 시행을 베르누이 시행 (Bernoullis trial)이라 한다.

 

베르누이 시행에서 성공의 경우를 $X=1$, 실패의 경우를 $X=0$을 갖는다 하면 $X$를 베르누이 확률 변수 라고 한다. 확률변수 $X$의 $pmf$가

$f(x)=p^x(1-p)^{1-x}, x=0,1$

으로 주어질 경우 $X$는 베르누이 분포(Bernoulli Distribution)을 갖는다.

X의 평균과 분산, 표준편차는

$$\begin{align*}
&\mu=E(X)=\sum_{x=0}^{1}xp^x(1-p)^{1-x}=(0)(1-p)+(1)(p)=p\\
&\sigma^2=Var(X)=\sum_{x=0}^{1}(x-p)^2p^x(1-p)^{1-x}=(0-p)^2(1-p)+(1-p)^2p=p(1-p)=pq\\
&\sigma=\sqrt{p(1-p)}=\sqrt{pq}
\end{align*}$$

 

$n$번의 시행중 $x$번 성공할 경우의 수는

$\displaystyle {}_nC_x=\frac{n!}{x!(n-x)!}$

$X_i$가 $i$번째 베르누이 시행에서의 베르누이확률실험이면 $P(X_i=0)=1-p, P(X_i=1)=p$ 이다.

각 시행은 독립적이기에 $x$번 성공하고 $n-x$번 실패할 확률은

$p^x(1-p)^{n-x}$

$X$의 $pmf$인 $f(x)=P(X=x)$는 서로 배반은 ${}_nC_x$가지 사상들의 확률의 합니다.

즉,

$f(x)={}_nC_xp^x(1-p)^{n-x},x=0,1,2,\cdots,n$

확률 $f(x)$는 $n$번의 베르누이 시행에서 $x$번 성공할 확률이며 이항확률이라 하고 확률변수 X는 이항분포(binomial distribution)을 갖는다고 한다.

 

이항 확률을 따르는 누적분포함수는 하나하나 계산해야 하지만

그렇게 하지 않고 이항분포표를 통해 빠르게 확인 할 수 있다.

 

이항실험은 아래의 성질을 만족시킨다.

1. 베르누이(성공-실패) 실험이 $n$회 시행된다. 이때 $n$은 상수이다.

2. 각 시행은 독립이다.

3. 각 시행에서 성공의 확률은 $p$이고 실패의 확률은 $q=1-p$이다.

4. 확률변수 $X$는 $n$회 시해에서 성공의 횟수와 같다.

 

n이 양의 정수라면 이항전개식(binomial expansion)은 아래와 같다.

$\displaystyle (a+b)^n=\sum_{x=0}^{n}{}_nC_xb^xa^{n-x}$

위 식에서 $b=p$ 그리고 $a=1-p$라 놓으면

$\displaystyle \sum_{x=0}^{n}{}_nC_xp^x(1-p)^{n-x}=[(1-p)+p]^n=1$

이다. 이는 $f(x)$가 $pmf$이기 위한 조건이다.(모든 사건에 대한 확률의 총합은 1이다.)

 

이항 전개식을 사용하여 이항 분포에 대한 mgf를 구하고 이 mgf를 이용하여 이항분포의 평균과 분산을 구해본다.

$X$의 $mgf$는

$$\begin{align*}
M(t)&=E(e^{tx})=\sum_{x=0}^{n}e^{tx}{}_nC_xp^x(1-p)^{n-x}\\
&=\sum_{x=0}^{n}(pe^t)^x(1-p)^{n-x}\\
&=[(1-p)+pe^t]^n,\;\;-\infty<t<\infty
\end{align*}$$

 

$M(t)$의 1차 및 2차 도함수는 아래와 같다

$\displaystyle M'(t)=n[(1-p)+pe^t]^{n-1}$

$\displaystyle M''(t)=n(n-1)[(1-p)+pe^t]^{n-2}(pe^t)^2+n[(1-p)+pe^t]^{n-1}(pe^t)$

이산확률변수 $X$의 평균은

$\mu=E(X)=M'(0)=np$

분산은

$\displaystyle \begin{align*}\sigma^2&=E(X^2)-[E(X)]^2=M''(0)-[M'(0)]^2\\&=n(n-1)p^2+np-(np)^2=np(1-p)=npq\end{align*}$

특히 $n=1$일때 $X$는 베르누이 분포를 가지며 모든 실수 $t$에 대하여

$M(t)=(1-p)+pe^t$

이고 $\mu=p, \sigma^2=p(1-p)$이다.

 

 

 

 

Comments