일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 그래프
- Brute Force
- Dijkstra
- Hash
- union find
- binary search
- MYSQL
- two pointer
- 이진탐색
- 스토어드 프로시저
- 다익스트라
- Trie
- DP
- SQL
- String
- Stored Procedure
- Two Points
- Today
- Total
codingfarm
3. 확률 분포 추정-개요 본문
2장 내용 정리
∘ 관찰된 샘플에서 특징벡터 X를 추출한다.
∘ X는 제일 그럴듯한 부류로 분류되어야 하며, 분류기준은 사후확률 P(wi|X)(posterior probability)로 정의한다. 즉, 사후확률이 제일 큰 부류로 인식하면 된다.
argmaxiP(wi|X)
∘ 하지만 P(wi|X)는 추정이 거의 불가능하다. 따라서 베이스정리를 이용해 사후확률을 사전확률(prior probability) p(Wi)와 우도(likehood) P(X|wi)의 곱으로 대치해서 계산한다.
∘ 2장에서 사전학률과 우도를 미리 알고있다 가정하고 베이시언 분류기를 만들었으나, 3장에서는 이득 활률을 어떻게 추저할지에 집중한다.

P(wi)=NiN, (N : 입력 X의 갯수, Ni : wi에 속하는 입력의 갯수)
우도 P(X|wi)의 추정은 쉽지 않다.

그림 2.4 (a) 처럼 정규 분포의 형태를 띄고 있다면 문제는 크게 쉬워진다. 정규분포를 추정하기 위한 평균벡터 μ와 공분산행렬 Σ만 알면되므로 최대우도법으로 알 수 있다.
하지만 그림 2.4 (b)의 형태를 띈다면 함수의 추정이 쉽지 않으므로 히스토그램 추정법으로 해결해야한다. 하지만 이 방법은 차원의 저주에 시달리게 된다.
다른 부류에 속한 샘플은 서로 영향을 미치지 않는다 가정할 경우 우도는 부류별로 독립적으로 수행 할 수 있다. 그렇기 때문에 "X중에 wi에 속하는 샘플집합 Xi를 가지고 p(x|wi)를 추정하라. 이 과정을 모든 부류에 대해 수행하라" 라고 문제를 표현할 수 있다. 앞으로는 표기의 편리성을 위해 Xi를 가지고 p(x|wi)를 추정하라는 문제는 X로 (x)를 추정하라는 문제로 표기하겠다. 부류별로 독립적으로 추정하므로 부류를 나타내는 첨자 i 를 모두 제거하여 표기한것이다.
아래는 확률분포를 추정하기 위한 여러가지 방법이다.

'AI > 패턴인식' 카테고리의 다른 글
3. 확률 분포 추정 - 파젠창(Parzen Window) (0) | 2020.04.10 |
---|---|
3. 확률 분포 추정 - 히스토그램 추정(histogram estimation) (0) | 2020.04.10 |
3. 확률 분포 추정 - 최대 우도 추정(Maximum Likelihood Estimation) (0) | 2020.04.10 |
2. 베이시언 결정 이론 (0) | 2020.01.29 |
1. 소개 (0) | 2020.01.28 |