Tech & Traditions

성격 테스트: 성격(잠재 변수)은 직접 보이지 않지만 설문 답변(관찰 변수)으로 추정할 수 있습니다.
학생의 실력: 실력은 보이지 않지만 시험 점수, 문제 풀이 시간 등에서 유추합니다.
날씨 예보: '비가 올 확률'처럼 직접 보이지 않지만 관측한 구름, 습도, 바람으로 예측합니다.

2025년 10월 1일 수요일

잠재 변수는 직접 관찰할 수는 없지만, 여러 관찰값에 영향을 주는 숨겨진 요인입니다. 예를 들어 성격, 지능, 영화 취향 같은 것은 눈으로 바로 볼 수 없지만 설문, 시험, 시청 기록 같은 관찰 가능한 데이터로 추정할 수 있습니다.

비유로 이해하기

머신러닝·통계에서 잠재 변수는 다음처럼 사용됩니다.

어떤 학생의 '수학 실력'(잠재 변수)을 직접 볼 수는 없습니다. 다만 시험1, 시험2, 숙제 점수(관찰 변수)가 높다면 실력이 높다고 추정할 수 있습니다. 여기서 각 관찰 변수는 '실력 + 잡음(우연한 요인)'으로 생각할 수 있습니다.

아래 슬라이더로 숨겨진 값(잠재 변수)을 조절하면, 관찰값(노이즈가 섞인 값)들이 어떻게 달라지는지 볼 수 있습니다.

잠재 변수(숨겨진 값): 0.0

관찰값들 (예: 시험1, 시험2, 과제):

잠재 변수는 직접 측정되지 않는 숨겨진 원인입니다. 여러 관찰값을 통해 모델이 이 값을 추정하면 데이터의 구조를 이해하거나 예측 성능을 높이는 데 큰 도움이 됩니다. 간단히 말해, 보이지 않는 것을 데이터로 추정하는 기술이라고 보시면 됩니다.