Multi-fidelity 및 MI 최신 기술 보고서
발신: MI 전문가 시스템 | 주제: 소재 정보학의 효율적 프레임워크
2026년 현재, MI의 핵심 화두는 "데이터의 양(Quantity)보다는 가성비 높은 질(Quality)"입니다. Multi-fidelity는 이를 실현하는 가장 강력한 프레임워크입니다.
1. Multi-fidelity (MF) 기술의 핵심 개념
MI에서 MF는 저정확도(Low-fidelity, LF)의 대량 데이터와 고정확도(High-fidelity, HF)의 소량 데이터를 결합하여, HF 수준의 예측력을 갖춘 모델을 최소 비용으로 구축하는 전략입니다.
- HF 데이터: Hybrid-DFT(HSE06), CC(Coupled Cluster), 또는 고정밀 실험 데이터 (비용 ↑, 정확도 ↑)
- LF 데이터: LDA/GGA 기반 DFT, Newman 모델링, 혹은 간단한 물리 기반 근사치 (비용 ↓, 데이터 양 ↑)
2. 최신 기술 트렌드 (2025~2026)
① MLIP에서의 Multi-fidelity 학습 (MF-MLIP)
'Energy-only' HF 데이터와 'Force-included' LF 데이터를 동시에 학습하는 기법이 표준으로 자리 잡고 있습니다.
- 핵심 원리: LF 수준에서 Force를 학습해 '에너지 곡면의 기울기'를 잡고, HF 에너지로 '절대 정확도'를 보정합니다.
- 동향: One-hot encoding이나 Multi-head 구조를 통한 멀티 데이터 통합 기술이 활발합니다.
② MF-Bayesian Optimization (MF-BO)
다음 탐색 지점을 정할 때 Cost-aware Acquisition Function을 사용하여 HF 계산을 수행할 가치가 있는지를 자동으로 결정합니다. 계산 시간을 최대 98%까지 단축한 사례가 보고되었습니다.
③ Transfer Learning & Δ-Learning의 진화
물리적 경향성은 LF 모델이 잡고, 미세한 차이($\Delta$)만 ML이 보정하는 방식입니다. 대규모 LF 데이터로 사전 학습된 Foundation Model을 Fine-tuning하는 방식이 대세입니다.
3. 배터리 소재 적용 관점 제언
| 단계 | 적용 전략 | 기대 효과 |
|---|---|---|
| Data | Newman 모델링(LF) + 실제 코팅/압연 실험치(HF) 결합 | 실험 횟수의 획기적 감소 |
| Model | GMM 추출 PSD 특징량을 입력값으로 하는 Δ-Learning | 입자 분포 물리 특성 반영 |
| Informatics | 전해질/첨가제 스크리닝 시 MF-BO 도입 | 고비용 MD 시뮬레이션 최소화 |
핵심 요약: 2026년의 MI는 LF의 거시적 경향성과 HF의 미시적 정확도를 어떻게 수학적으로 잘 버무릴 것인가가 기술력의 척도입니다.