최대사후추정기(MAP)와 최대빈도추정기(MLE) 쉽게 이해하기
1. 개념부터 정리해볼까요?
MLE (Maximum Likelihood Estimation):
"지금까지 관측된 데이터가 가장 잘 설명되도록 만드는 확률 모수를 찾는 것."
즉, 데이터만 보고 판단하는 방식입니다.
"지금까지 관측된 데이터가 가장 잘 설명되도록 만드는 확률 모수를 찾는 것."
즉, 데이터만 보고 판단하는 방식입니다.
MAP (Maximum A Posteriori Estimation):
"데이터 + 사전 지식(prior)을 함께 고려해서 가장 가능성 높은 확률 모수를 찾는 것."
즉, 기존 믿음도 반영하는 방식입니다.
"데이터 + 사전 지식(prior)을 함께 고려해서 가장 가능성 높은 확률 모수를 찾는 것."
즉, 기존 믿음도 반영하는 방식입니다.
2. 간단한 예로 이해해봅시다
상황: 동전을 10번 던졌더니 7번 앞면이 나왔습니다. 이 동전이 공정한지 추정해보고 싶습니다.
- MLE: "7번 앞면이 나왔으니까, 앞면 확률은 7/10 = 0.7!"
- MAP: "내가 생각하기에 원래 동전은 대체로 공정하다고 믿어. 데이터도 중요하지만 그 믿음도 반영하자."
→ 따라서 MAP은 0.5(사전 믿음)과 0.7(데이터)을 평균처럼 섞은 중간값(예: 0.65 정도)을 선택합니다.
- MLE: "7번 앞면이 나왔으니까, 앞면 확률은 7/10 = 0.7!"
- MAP: "내가 생각하기에 원래 동전은 대체로 공정하다고 믿어. 데이터도 중요하지만 그 믿음도 반영하자."
→ 따라서 MAP은 0.5(사전 믿음)과 0.7(데이터)을 평균처럼 섞은 중간값(예: 0.65 정도)을 선택합니다.
3. 차이점 요약
- MLE: 오직 데이터에만 의존 → 빠르고 직관적이지만, 데이터가 적으면 불안정할 수 있음
- MAP: 데이터 + 사전 지식을 반영 → 더 안정적이지만, prior를 잘 설정해야 함
4. 언제 사용하면 좋을까요?
- MLE: 데이터가 충분히 많고, 사전 지식이 거의 없을 때
- MAP: 데이터가 적거나, 기존에 알고 있는 정보가 중요할 때
이제 MLE와 MAP이 어떤 개념인지 감이 좀 오시나요?
댓글 없음:
댓글 쓰기