일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- two pointer
- DP
- String
- Trie
- Brute Force
- binary search
- Dijkstra
- Two Points
- SQL
- Stored Procedure
- 그래프
- MYSQL
- 다익스트라
- 이진탐색
- Hash
- union find
- 스토어드 프로시저
- Today
- Total
codingfarm
이산형 확률분포(Discrete Distribution)- 확률변수, 수학적 기댓값 본문
확률 변수(Random Variable)
∙ 표본 공간 S를 갖는 확률 실험이 주어질때, 각 원소 s∈S에 대해 오직 하나의 실수 X(s)=x를 대응시키는 함수 X를 확률 변수라 한다.
즉, 어떤 사건, 사상에 수치가 부여된 함수라고 볼 수 있다.
∙ X의 공간(space)는 실수의 집합 {x:X(s)=x,s∈S}이다.
∙ 표본공간 S가 수가 아닐때에 S의 기술을 편리하게 해준다
∙ 표본공간 S의 원소가 실수일 경우 X(s)=s이다. 그래서 X는 항등함수이고 X의 공간은 S이다.
■
이산형 확률 변수(random variables of the discrete type)
∘이산형 확률변수 X에 대해 확률 P(X=x)를 보통 f(x)로 표기한다.
∘f(x)는 보통 확률 질량 함수(probability mass function ; pmf), 확률 함수(probability function), 도수함수(frequency function), 확률 밀도 함수(probability density function) 이라고도 한다.
∘이산형 확류변수 X의 확률 질량 함수(pmf) f(x)는 다음의 성질을 만족하는 함수이다.
∘X를 실수공간의 부분집합인 S를 공간으로 갖는 확률 변수라 한다. 공간 S가 유한(finite)이거나 양의 정수들에 1:1 대응 관계를 갖는다면, 즉 S의 원소를 셀수있다면, 확률 변수 X를 이간형 확률 변수라 하고, X는 이산형 확률 분포를 갖는다고 한다.
a) f(x)>0,x∈S |
■
누적 분포 함수(cumulate distribution function ; cdf)
∙F(x)=P(X≤x),−∞<x<∞
F(x)를 확률변수 X의 누적 분포함수 혹은 분포함수(distirubution function)라고 한다.
∙ pdf가 불연속적이라 할지라도 cdf는 항상 연속이다.
이산형 확률분포에서
x가 최소 n일 확률은 1−F(n−1)과 같다.
연속형 확률 분포에서
x가 최소 t일 확률은 1−F(t)과 같다.
◼
균일 분포(uniform distribution)
pmf가 공간위에 상수라면(즉, 모든 random variable에 대해 p(x)가 같은 값일 경우) cdf는 공간위에서 균일(uniform) 하다.
가령 m개의 모든 r.v에 대해 f(x)=1m이다.(x=1,2,3,⋯,m)
x의 cdf는 다음과 같다.
{0,x<1km,k≤x≤k+1,k=1,2,⋯,m−11,m≤x
◼
초기하분포(hypergeometric distribution)
∘ 공간S는 음이 아닌 정수 X들의 집합이며 x는 x≤n,n≤N1,n−x≤N2를 만족한다.
이때 확률변수 X는 N1중에서 뽑는 갯수를 말하며 이를 초기하분포라 한다.
∘비복원 추출에서 N개 중에 k가 원하는 것이고 n번 추출 했을때 원하는것이 k개가 뽑히는 확률의 분포
가령 N개의 칩이 든 주머니에서 N1개는 빨간칩이고 N2개는 파란칩일때 n개의 칩을 비복원 추출시에 x개의 빨간칩이 뽑힐 확률은 아래와 같이 계산한다.
전사건 : NCn
목표사건: N1Cx⋅N2Cn−x
f(x)=P(X=x)=N1Cx⋅N2Cn−xNCn
◼
상대도수 히스토그램(relative frequency histogram)
확률실험이 n회 독립적으로 반복된다 하고 A={X=x}라 놓는다. 그러면 상대도수 N(A)n가 f(x)에 근사할것을 기대한다.
◼
수학적 기댓값(mathematical expectation)
∘공간 S를 갖는 이산형 확률변수 X의 pmf가 f(x)이고 총합
∑x∈Su(x)f(x) (혹은 ∑Su(x)f(x) 으로 표기함)
가 존재하면, 그 합을 u(x)의 수학적 기댓값 또는 기댓값(expected value)이라 하고 E[u(x)]로 표기한다. 즉.
E[u(x)]=∑x∈Su(x)f(x)
∘ 기댓값 E[u(x)]는 f(x)=P(X=x),x∈S 을 가중치로 갖는 u(x),x∈S 의 가중평균(weighted average)으로 생각 할 수 있다.
∘ E[u(x)] 의 일반적인 정의는 총합이 절대적으로 수렴(absolutely convergence)함을 요구한다. 즉,
∑x∈S|u(x)|f(x)
가 수렴하고 유한해야 E[u(x)] 가 존재한다.
∘ 수학적 기댓값 E가 존재할 경우 다음의 성질들을 만족시킨다.
(a) c가 상수이면 E(c)=c
(b) c가 상수이고 u가 함수이면
E[cu(x)]=cE[u(x)]
(c) c1과 c2가 상수이고, u1 과 u2가 함수이면
E[c1u1(x)+c2u2(x)]=c1E[u1(x)]+c2E[u2(x)]
(d) E[k∑i=1ciui(x)]=k∑i=1ciE[ui(x)]
확률공간 X도 함수로 표현 가능하다.
가령 Y=u(X)라 놓자. Y도 확률변수 이므로 pmf를 가질수있다.
예를들어 f(x)=4−x6 일때 Y=X2의 pmf는 g(y)=4−√y6,y=1,4,9 이다.
X와 Y의 평균을 각각 구해보겠다.
우선 X의 평균은
x=1f(1)=12x=2→f(2)=13x=3f(3)=16
∑x∈Sxx2f(x)=12⋅12+22⋅13+32⋅16=103
그리고 Y의 평균은
x=1f(1)=12x=4→f(2)=13x=9f(3)=16
∑x∈Sxx2f(x)=1⋅12+4⋅13+9⋅16=103
그러므로 아래 등식이 성립함을 알 수 있다.
μY=∑y∈SYyg(y)=∑x∈SXx2f(x)=103
이다.
즉, 아래의 공식이 성립한다.
∑y∈SYyg(y)=∑x∈SXx2f(x)
즉, 확률변수X의 집합과 X의 확률 p(x)이 주어젔을때 또다른 확률변수 Y와 X사이의 관계식이 주어진다면 Y의 평균을 구할 수 있다.
'통계학 > 수리통계학' 카테고리의 다른 글
이산형 확률분포(Discrete Distribution) - 포아송분포(Poisson Distribution) (0) | 2020.04.14 |
---|---|
이산형 확률분포(Discrete Distribution) - 음이항분포(negative binomial distribution) (0) | 2020.04.12 |
이항분포표(Binomial Distribution Table) (0) | 2020.04.01 |
이산형 확률분포(Discrete Distribution)- 이항분포(The Binomial Distribution) (0) | 2020.04.01 |
이산형 확률분포(Discrete Distribution)- 특별한 수학적 기댓값 (0) | 2020.03.14 |