MLIP 학습은 어떻게 하는가?
MLIP 학습 과정은 처음 보면 복잡해 보이지만 사실은 원자 문제를 맞추는 인공지능 훈련이라고 생각하면 이해가 쉽습니다.
Machine Learning Interatomic Potential (MLIP)은 원자 사이의 에너지와 힘을 예측하는 AI 모델입니다.
이 모델을 만들기 위해서는 먼저 정답 데이터가 필요합니다. 그래서 MLIP 학습은 정답 데이터를 만드는 것부터 시작합니다.
1단계 : 정답 데이터 만들기
먼저 컴퓨터 물리 계산으로 원자 구조의 정답 데이터를 만듭니다.
이때 사용하는 계산 방법이 Density Functional Theory (DFT)입니다.
DFT는 매우 정확한 계산 방법입니다.
예를 들어 컴퓨터가 다음을 계산합니다.
- 원자 배열
- 그 구조의 에너지
- 각 원자가 받는 힘
예를 들어 데이터는 다음과 같이 만들어집니다.
원자 위치
A 원자 (0,0,0)
B 원자 (1,0,0)
C 원자 (0,1,0)
정답
에너지 = -10.2 eV
힘
A = (0.1, -0.2, 0.0)
B = (-0.1, 0.0, 0.2)
C = (0.0, 0.2, -0.2)
이러한 데이터를 수천 개에서 수십만 개까지 만듭니다.
이 데이터가 바로 MLIP가 배우는 교과서가 됩니다.
2단계 : 원자 주변 환경을 숫자로 변환
인공지능은 원자를 직접 이해하지 못합니다. 그래서 원자 주변 환경을 숫자로 바꾸어야 합니다.
이 과정을 Atomic Descriptor라고 합니다.
예를 들어 원자 A 주변에 다음과 같은 원자가 있다고 가정합니다.
원자 B 거리 = 2.1 Å
원자 C 거리 = 1.8 Å
이처럼 주변 원자 거리와 방향 정보를 숫자로 표현합니다.
즉 다음과 같은 변환이 이루어집니다.
원자 주변 환경 → 숫자 벡터
3단계 : 인공지능 모델 만들기
이제 인공지능 모델을 만듭니다.
보통 사용하는 모델은 Neural Network입니다.
입력
원자 주변 환경 숫자
출력
에너지
즉 AI는 다음과 같은 문제를 계속 풀게 됩니다.
원자 구조 → 에너지 예측
그리고 정답은 DFT 계산으로 얻은 에너지입니다.
AI가 틀리면 오차를 계산하고 계속 수정합니다.
이 과정을 Machine Learning 학습이라고 합니다.
4단계 : 힘도 함께 학습한다
MLIP에서는 힘 예측이 매우 중요합니다.
왜냐하면 힘이 있어야 원자 움직임 시뮬레이션을 할 수 있기 때문입니다.
힘은 사실 에너지의 기울기입니다.
이것을 Gradient라고 합니다.
즉 다음과 같은 관계가 있습니다.
힘 = 에너지 변화율
그래서 학습할 때 인공지능은 다음 두 가지를 동시에 맞추려고 합니다.
- 에너지 오차
- 힘 오차
이 두 가지 오차를 동시에 줄이도록 학습합니다.
5단계 : 학습이 끝난 MLIP
학습이 완료되면 모델은 새로운 원자 구조를 입력받아 다음을 예측할 수 있습니다.
- 에너지
- 힘
이 모델을 이용하면 Molecular Dynamics 시뮬레이션을 수행할 수 있습니다.
이를 통해 다음과 같은 재료 물성을 계산할 수 있습니다.
- 확산
- 열전도
- 탄성
- 결함 구조
핵심 정리
MLIP 학습 과정은 다음과 같습니다.
DFT 계산으로 정답 생성
→ 원자 구조를 숫자로 변환
→ 인공지능이 에너지와 힘을 맞추도록 학습
→ 빠르게 원자 상호작용을 예측하는 모델 완성
쉬운 비유
MLIP는 물리 문제집을 푸는 인공지능 학생과 같습니다.
DFT는 정답이 있는 문제집입니다.
AI는 수천 개의 문제를 풀면서 다음과 같은 패턴을 배우게 됩니다.
원자 구조를 보면 에너지가 이렇게 되는구나
그래서 나중에는 새로운 원자 구조도 빠르게 예측할 수 있게 됩니다.