Notice
Recent Posts
Recent Comments
Link
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
Archives
Today
Total
관리 메뉴

codingfarm

이산형 확률분포(Discrete Distribution)- 확률변수, 수학적 기댓값 본문

통계학/수리통계학

이산형 확률분포(Discrete Distribution)- 확률변수, 수학적 기댓값

scarecrow1992 2020. 3. 7. 20:54

확률 변수(Random Variable)

표본 공간 S를 갖는 확률 실험이 주어질때, 각 원소 sS에 대해 오직 하나의 실수 X(s)=x를 대응시키는 함수 X를 확률 변수라 한다.

즉, 어떤 사건, 사상에 수치가 부여된 함수라고 볼 수 있다.

 X의 공간(space)는 실수의 집합 {x:X(s)=x,sS}이다.

 표본공간 S가 수가 아닐때에 S의 기술을 편리하게 해준다

 표본공간 S의 원소가 실수일 경우 X(s)=s이다. 그래서 X는 항등함수이고 X의 공간은 S이다.

 

이산형 확률 변수(random variables of the discrete type)

이산형 확률변수 X에 대해 확률 P(X=x)를 보통 f(x)로 표기한다.

f(x)는 보통 확률 질량 함수(probability mass function ; pmf), 확률 함수(probability function), 도수함수(frequency function), 확률 밀도 함수(probability density function) 이라고도 한다.

이산형 확류변수 X의 확률 질량 함수(pmf) f(x)는 다음의 성질을 만족하는 함수이다.

X를 실수공간의 부분집합인 S를 공간으로 갖는 확률 변수라 한다. 공간 S가 유한(finite)이거나 양의 정수들에 1:1 대응 관계를 갖는다면, 즉 S의 원소를 셀수있다면, 확률 변수 X를 이간형 확률 변수라 하고, X는 이산형 확률 분포를 갖는다고 한다.

a) f(x)>0,xS
b) xSf(x)=1
c) P(XA)=xAf(x), 여기서AS
S는 X의 공간(space) 혹은 받침/지지(support)라고 한다.

 

누적 분포 함수(cumulate distribution function ; cdf)

F(x)=P(Xx),<x<

F(x)를 확률변수 X의 누적 분포함수 혹은 분포함수(distirubution function)라고 한다.

pdf가 불연속적이라 할지라도 cdf는 항상 연속이다.

 

이산형 확률분포에서

x가 최소 n일 확률은 1F(n1)과 같다.

연속형 확률 분포에서

x가 최소 t일 확률은 1F(t)과 같다.

 

 

균일 분포(uniform distribution)

pmf가 공간위에 상수라면(즉, 모든 random variable에 대해 p(x)가 같은 값일 경우) cdf는 공간위에서 균일(uniform) 하다.

가령 m개의 모든 r.v에 대해 f(x)=1m이다.(x=1,2,3,,m)

x의 cdf는 다음과 같다.

{0,x<1km,kxk+1,k=1,2,,m11,mx




 

초기하분포(hypergeometric distribution)

공간S는 음이 아닌 정수 X들의 집합이며 xxn,nN1,nxN2를 만족한다.

이때 확률변수 XN1중에서 뽑는 갯수를 말하며 이를 초기하분포라 한다.

비복원 추출에서 N개 중에 k가 원하는 것이고 n번 추출 했을때 원하는것이 k개가 뽑히는 확률의 분포

 

가령 N개의 칩이 든 주머니에서 N1개는 빨간칩이고 N2개는 파란칩일때 n개의 칩을 비복원 추출시에 x개의 빨간칩이 뽑힐 확률은 아래와 같이 계산한다.

전사건 : NCn

목표사건: N1CxN2Cnx

f(x)=P(X=x)=N1CxN2CnxNCn

 

 

 

상대도수 히스토그램(relative frequency histogram)

확률실험이 n회 독립적으로 반복된다 하고 A={X=x}라 놓는다. 그러면 상대도수 N(A)nf(x)에 근사할것을 기대한다.

 

 

수학적 기댓값(mathematical expectation)

공간 S를 갖는 이산형 확률변수 X의 pmf가 f(x)이고 총합 

xSu(x)f(x) (혹은 Su(x)f(x) 으로 표기함) 

가 존재하면, 그 합을 u(x)의 수학적 기댓값 또는 기댓값(expected value)이라 하고  E[u(x)]로 표기한다. 즉. 

E[u(x)]=xSu(x)f(x)

 

 기댓값 E[u(x)]는 f(x)=P(X=x),xS 을 가중치로 갖는 u(x),xS 의 가중평균(weighted average)으로 생각 할 수 있다.

 

 E[u(x)] 의 일반적인 정의는 총합이 절대적으로 수렴(absolutely convergence)함을 요구한다. 즉,

xS|u(x)|f(x)

가 수렴하고 유한해야 E[u(x)] 가 존재한다.



 수학적 기댓값 E가 존재할 경우 다음의 성질들을 만족시킨다.

(a) c가 상수이면 E(c)=c

(b) c가 상수이고 u가 함수이면

E[cu(x)]=cE[u(x)]

(c) c1과 c2가 상수이고, u1 과 u2가 함수이면

E[c1u1(x)+c2u2(x)]=c1E[u1(x)]+c2E[u2(x)]

(d) E[ki=1ciui(x)]=ki=1ciE[ui(x)]






확률공간 X도 함수로 표현 가능하다.

가령 Y=u(X)라 놓자. Y도 확률변수 이므로 pmf를 가질수있다.

예를들어 f(x)=4x6 일때 Y=X2의 pmf는 g(y)=4y6,y=1,4,9 이다.

XY의 평균을 각각 구해보겠다.

우선 X의 평균은

x=1f(1)=12x=2f(2)=13x=3f(3)=16

xSxx2f(x)=1212+2213+3216=103

 

그리고 Y의 평균은

x=1f(1)=12x=4f(2)=13x=9f(3)=16

xSxx2f(x)=112+413+916=103


그러므로 아래 등식이 성립함을 알 수 있다.
μY=ySYyg(y)=xSXx2f(x)=103

이다.

즉, 아래의 공식이 성립한다.

ySYyg(y)=xSXx2f(x)

 

즉, 확률변수X의 집합과 X의 확률 p(x)이 주어젔을때 또다른 확률변수 YX사이의 관계식이 주어진다면 Y의 평균을 구할 수 있다.