일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Stored Procedure
- Hash
- union find
- Trie
- Two Points
- 다익스트라
- MYSQL
- Brute Force
- DP
- Dijkstra
- SQL
- two pointer
- 스토어드 프로시저
- 그래프
- String
- 이진탐색
- binary search
- Today
- Total
codingfarm
4.3 조건부 분포(Conditional Distribution) 본문
X와 Y가 공간 S에서 jointpmff(x,y)를 가진다.
marginal pmf는 공간 SX와 SY에서 각각 fX(x),fY(y)이다.
사건(event)A={X=x},B={Y=y},(x,y)∈S일때
A∩B={X=x,Y=y} 이다.
왜냐하면
P(A∩B)=P(X=x,Y=y)=f(x,y)
그리고
P(B)=P(Y=y)=fY(y)>0(sinceY∈SY)
일 경우
사건 B가 주어질때 사건 A의 조건부확률(Conditional Probability)는
P(A|B)=P(A∩B)P(B)=f(x,y)fY(y)
이다.
Y=y가 주어질때 X의 조건부 확률 질량 함수(Conditional pmf)는 아래처럼 정의된다.
g(x|y)=f(x,y)fY(y),fY(y)>0
유사하게 X=x가 주어질 때 Y의 conditional pmf는 아래처럼 정의된다.
h(y|x)=f(x,y)fX(x),fX(x)>0
conditional pmf도 확률이므로 확률의 법칙을 따른다
0≤h(y|x)≤1∑yh(y|x)=∑yf(x,y)fX(x)=fX(x)fX(x)=1
P(a<Y<b|X=x)=∑(y:a<y<b)h(y|x)
조건부 기댓값(conditional expectation)의 경우
E[Y|X=x]=∑yyh(y|x)
그러므로
E[u(Y)|X=x]=∑yu(y)h(y|x)
X=x가 주어젔을때 Y의 conditional expectation value 들은 아래와 같다,
μY|x=E(Y|x)=∑yyh(y|x)
σ2Y|X=E{[Y−E(Y|x)]2|x}=∑y[y−E(Y|x)]2h(y|x)=E(Y2|x)−[E(Y|x)]2
E(Y2|x)=∑yy2h(y|x)
E(Y|x)=∑yyh(y|x)
Y=y일때 X의 conditional mean은 변수 y에 대한 함수이다.
X=x일때 Y의 conditional mean은 변수 x에 대한 함수이다.
후자의 경우는 함수가 x의 linear function이라고 가정한다.
즉, E(Y|x)=a+bx의 형태를 띈다
위식에서 나오는 a와 b를 μX,μY,σ2X,σ2Y,ρ
의 항으로 표현해보자.
ρ=E(XY)σXσY
위식에서 표준편차(standard deviation) σX와 σY는 둘다 양수다.
추정하면 분모가 0이 아니므로 상관계수(correlation coefficient)는 존재한다.
μY|x=E(Y|x)=∑yyh(y|x)=∑yf(x,y)fX(x)=a+bx,forx∈Sx
SX는 X의 공간이고 SY는 Y의 공간이다. 그 결과
μY|xfX(x)=∑yyf(x,y)=(a+bx)fX(x),forx∈SX⋯⋯(1)
그리고
μY=∑x∈SX∑yyf(x,y)=∑x∈SX(a+bx)fX(x)=∑x∈SXafX(x)+∑x∈SXbxfX(x)=a+bμX
그러므로
μY=a+bμX⋯⋯(2)
앞서 구한식 ∑yyf(x,y)=(a+bx)fX(x)를 통해
아래식을 구할 수 있다.(양변에 x의 합을 곱한다)
∑x∈SX∑yxyf(x,y)=∑x∈SX(ax+bx2)fX(x)
그러면
E(XY)=aE(X)+bE(X2)
σ2X=E(X2)−{E(X)}2=E(X2)−μ2X
이므로
E(X2)=σ2X+μ2X
그리고
ρ=Cov(X,Y)σXσY=E(XY)−E(X)E(Y)σXσY=aE(X)+bE(X2)−E(X)E(Y)σXσY=aμX+b(σ2X+μ2X)−μXμYσXσY
μXμY+ρσXσY=aμX+b(σ2X+μ2X)⋯⋯(3)
식 (2)와 (3)을 통해서
a=μY−ρσYσYandb=ρσYμX
만약 E(Y|x)가 linear 하다면 아래식과 같음을 암시 가능하다.
E(Y|x)=μY+ρσYσX(x−μX)
반대의 경우는
E(X|y)=μX+ρσXσY(y−μY)
위 식에서 각 직선은
x=μX, E(Y|x=μX)=μY을 지나고
y=μY,E(X|y=μY)=μX을 지난다는 점에서
두 직선은 각각 (μX,μY)을 지남을 알 수 있다.
게다가 E(Y|x)에서 x의 계수인 ρσYσX와
E(X|y)에서 y의 계수인 ρσXσY 의 곱은
ρ2과 같음을 알 수 있다.
그리고 이들의 비율은 σ2Yσ2X과 같다,
이 직관은 아래와 같은 예제에서 유용히 쓰인다.
'통계학 > 수리통계학' 카테고리의 다른 글
피어슨 상관 계수(Pearson Correlation Coefficient) (0) | 2020.08.14 |
---|---|
이산형 이변량 분포(Bivariate Distribution of The Discrete Type) (0) | 2020.07.01 |
정규 분포(Normal Distribution) (0) | 2020.06.24 |
연속형 확률분포 - 카이제곱분포(chi-square distribution) (0) | 2020.04.30 |
연속형 확률분포 - 감마분포(The Gamma Distributions) (0) | 2020.04.23 |