Notice
Recent Posts
Recent Comments
Link
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
Archives
Today
Total
관리 메뉴

codingfarm

이산형 이변량 분포(Bivariate Distribution of The Discrete Type) 본문

통계학/수리통계학

이산형 이변량 분포(Bivariate Distribution of The Discrete Type)

scarecrow1992 2020. 7. 1. 01:25

이산형 이변량 분포(Bivariate Distribution of The Discrete Type)

두개 이상의 확률변수에 대한 분포에 대해 다뤄본다

ex) 대학 입시에서 내신성적 X와 수능성적 Y의 관계 대학교성적 Z의 예측 가능 여부 확인

초등학생의 키(X), 몸무게(Y), 발사이즈(Z)간의 관계 성인이 됐을때의 키 W 예측 가능한가?

 

X,Y를 이산형 확률 공간에서 정의된 두개의 확률 변수라 하고 XY에 대응하는 2차원 공간을 S라 하자. X=x, Y=y인 확률을
f(x,y)=P(X=x,Y=y)
라 하면, f(x,y)XY의 결합확률질량함수(joint probability mass function; joint pmf)라 하고 다음과 같은 성질을 가진다.
(a) 0f(x,y)1
(b) (x,y)Sf(x,y)=1
(c) P[(X,Y)A]=(x,y)Af(x,y), 여기서 A는 공간 S의 부분집합이다.

예를 통해 개념을 확인해보자

주사위를 2번 던진다. 그러면 확률 1/36을 갖는 36개의 실현치에 대해서 보다 작은 수를 X, 보다 큰수를 Y라 하면 결합 pmf는 다음과 같다.

f(x,y)={1/361x=y62/361x<y6

아래 그림은 공간 S의 여러 실현치에 대한 확률을 보여준다

위 그림은 두개의 주사위를 던젔을때 나온눈에 대한 확률을 보여준다

각 아래쪽과 왼쪽에 적힌 확률은 행확률들과 열확률들의 합이다.

각 열확률들의 합은 Xx공간 Sx={1,2,3,4,5,6}의 값을 취할때의 확률이고

각 행확률들의 합은 Yy공간 Sy={1,2,3,4,5,6}의 값을 취할때의 확률이다.

각 확률들의 합은 XYpmf를 나타낸다.

이러한 확률들은 흔히 확률분포표의 주변에 기록되기에 주변확률질량함수(marginal pmf)라 한다.

 

X,Y가 공간 S에서 결합 pmf f(x,y)를 가질때 X만의 pmf 또는 Y만의 pmf를 각각 X 또는 Y주변확률질량함수(marginal probability mass function)라 하고 아래처럼 정의된다.
fX(x)=yf(x,y)=P(X=x);    xSXfY(y)=xf(x,y)=P(Y=y);    ySY
그리고 확률변수 X,Y
f(x,y)=fX(x)fY(y) 모든 xSX, 모든 ySY일때, 그때에 한해서 X,Y는 독립(independent)라 하고 그렇지 않으면 X,Y는 종속(dependent)라 한다.

2개의 주사위를 던지는 상황에서는 많은 경우에 f(x,y)f(x)f(Y)이다.

가령

f(X=3,Y=3)=1/36f(X=3)=7/36f(Y=3)=5/36f(X=3,Y=3)f(X=3)f(Y=3)

그러므로 XY는 종속이다.

 

 

두 확률변수를 X1,X2라 하자

X1,X2를 공간 S상에서 결합 pmf f(x1,x2)를 갖는 이산형 확률변수 라 하자

u(x1,x2)를 두 확률변수에 대한 함수이면

E[u(X1,X2)]=(x1,x2S)u(x1,x2)f(x1,x2)

u(X1,x2)의 수학적기댓값(mathematical expectation, expected value)라 한다.

여기서

(x1,x2S)|u(x1,x2)|f(x1,x2)

는 유한의 값을 가지며 수렴한다 가정한다.

그리고 Y=u(X1,X2)가 공간 SY상에서 pmf g(Y)를 갖는 확률변수이면

(x1,x2S)u(x1,x2)f(x1,x2)=ySYy g(y)

도 성립한다.

다음과 같은 수학적 기댓값은 그것이 존재할때 특별한 명칭을 갖는다.

1) ui(X1,X2)=Xi,   i=1,2 이면

E[ui(X1,X2)]=E(Xi)=μi

Xi, i=1,2의 평균(mean)이라 한다.

2) 만일 ui(X1,X2)=(Xiμi)2.  i=1,2 이면

E[ui(X1,X2)]=E[(Xiμi)2]=σ2i=Var(Xi)

Xi, i=1,2의 분산(variance)라 한다.

우리는 확률변수가 2개인 경우의 분포에서는 공간 S가 직사강형을 이루고, 결합함수가 각 확률변수들의 곱으로 되어있으면 독립임을 알 수 있다. 이는 확률변수가 다수로 이루어젔을때에 대해서도 일반화 가능하다. 대표적으로 2개의 주사위를 던지는 경우와 예제 4.1-4의 경우에 공간 S는 삼각형을 이루므로 종속이 되고 예제 4.1-3의 공간 S가 직사강형이고 결합함수가 확률변수의 곱으로 되어있으며 독립임에 주목하라

 

Comments