MLIP를 활용한 물성 예측 전체 프로세스
MLIP(Machine Learning Interatomic Potential)는 원자 간 상호작용을 머신러닝으로 근사하여 기존 DFT(밀도범함수이론)의 높은 정확도를 유지하면서도 훨씬 빠른 속도로 대규모 시뮬레이션을 수행할 수 있게 해주는 기술입니다. 이를 활용하면 배터리 소재, 촉매, 반도체 등 다양한 소재의 물성을 효율적으로 예측할 수 있습니다.
전체 프로세스는 단순히 모델 하나를 학습하는 것이 아니라, 데이터 생성 → 모델 학습 → 검증 → 시뮬레이션 → 물성 계산 → 재학습의 순환 구조로 이루어진 통합 시스템입니다.
1. 문제 정의 및 물성 설정
가장 먼저 수행해야 하는 단계는 “무엇을 예측할 것인가”를 명확히 정의하는 것입니다. 예를 들어 배터리 소재에서는 리튬 이온 확산계수, 전극 안정성, 열적 안정성 등이 중요한 물성이 됩니다.
- 예측 대상 물성 정의 (확산계수, 탄성계수, 열전도도 등)
- 정확도 목표 설정
- 실험 또는 DFT 기준 정의
이 단계는 전체 프로젝트의 방향성을 결정하기 때문에 매우 중요합니다.
2. DFT 기반 데이터 생성
MLIP 모델을 학습하기 위해서는 고품질의 기준 데이터가 필요합니다. 이 데이터는 대부분 DFT 계산을 통해 생성됩니다.
2.1 구조 생성
- 평형 구조
- 변형 구조
- 결함 구조
- 고온/비평형 구조
2.2 DFT 계산 수행
- 에너지 계산
- 원자 힘 계산
- 응력 계산
2.3 데이터 정제
- 이상치 제거
- 중복 제거
- 균형 데이터 구성
이 과정에서 데이터의 다양성과 품질이 MLIP 성능을 결정합니다.
3. 구조 표현 (Representation)
원자 구조는 그대로 AI에 입력할 수 없기 때문에 적절한 수치 표현으로 변환해야 합니다. 이 과정을 Representation이라고 합니다.
- Crystal graph 기반 표현 (GNN 입력 구조)
- SOAP, ACSF 같은 atomic descriptor
- Coulomb matrix
- Composition vector (조성 기반 표현)
이 단계의 핵심은 물리 정보를 최대한 유지하면서 AI가 학습할 수 있는 형태로 변환하는 것입니다.
4. MLIP 모델 학습
이 단계에서는 원자 간 상호작용을 근사하는 모델을 학습합니다.
4.1 모델 선택
- Neural Network Potential (NNP)
- GAP (Gaussian Approximation Potential)
- Graph Neural Network (GNN)
4.2 학습 목표
모델은 에너지와 힘을 동시에 정확하게 예측해야 합니다.
Loss = wE * |E_pred - E_DFT| + wF * |F_pred - F_DFT|
여기서 에너지뿐만 아니라 원자별 힘까지 맞추는 것이 매우 중요합니다.
5. 모델 검증 (Validation)
학습된 모델이 실제 물리 시스템을 잘 반영하는지 확인하는 단계입니다.
- Test dataset 평가
- RMSE 계산
- 물리적 안정성 확인
일반적으로 다음 기준을 만족해야 합니다.
- Energy error < 10 meV/atom
- Force error < 0.05 eV/Å
6. MLIP 기반 시뮬레이션
검증된 MLIP 모델을 사용하면 대규모 분자동역학(MD) 시뮬레이션이 가능합니다. DFT로는 불가능한 수십만~수백만 step 계산도 수행할 수 있습니다.
- 온도/압력 조건 설정
- 장시간 MD 수행
- 대규모 원자계 시뮬레이션
7. 물성 계산
시뮬레이션 결과로부터 실제 물성을 계산하는 단계입니다.
7.1 확산계수
D = (1 / 6t) * ⟨|r(t) - r(0)|²⟩
원자의 평균 제곱 변위(MSD)를 이용하여 계산합니다.
7.2 열전도도
Green-Kubo 방법을 이용하여 열 흐름의 시간 상관함수를 계산합니다.
7.3 탄성계수
응력-변형률 관계를 이용하여 계산합니다.
7.4 반응 에너지
초기 상태와 최종 상태의 에너지 차이로 계산합니다.
8. 결과 검증
계산된 물성이 실제 실험 또는 DFT 결과와 일치하는지 확인합니다.
- DFT 비교
- 실험 데이터 비교
- Sensitivity 분석
9. Active Learning (고급 단계)
모델 정확도를 지속적으로 향상시키기 위한 반복 학습 구조입니다.
- MLIP로 시뮬레이션 수행
- 불확실한 영역 탐지
- DFT 추가 계산
- 재학습
MLIP → 오류 탐지 → DFT → 데이터 추가 → 재학습
결론
MLIP 기반 물성 예측은 단순한 머신러닝 모델이 아니라, 물리 기반 데이터와 AI를 결합한 통합 시뮬레이션 시스템입니다. 이를 통해 기존 대비 수십~수백 배 빠르게 소재 물성을 탐색할 수 있으며, 배터리, 반도체, 촉매 등 다양한 산업 분야에서 핵심 기술로 자리잡고 있습니다.