MMFF Force 필드를 RDKit로 가져오기: 구현 및 검증
파올로 토스카, 니콜라우스 스티플 & 그레고리 랜드룸
Bringing the MMFF force field to the RDKit: implementation and validation
Journal of Cheminformatics 제6권 제37조(2014년) 본조 인용
초록
광범위한 다양한 구조를 적절히 처리할 수 있는 MMFF94/MMFF94s와 같은 범용 힘 필드(force field)는 Cheminformatics Toolkit의 맥락에서 매우 중요하다. 여기서는 RDKit 내에서 이 힘 필드의 오픈 소스 구현을 제시한다. 새로운 MMFF 기능은 RDKit에서 UFF용으로 이미 사용 가능한 것과 함께 개발된 C++/C#/파이톤/자바 API를 통해 접근할 수 있다. 우리의 구현은 MMFF 저자가 제공한 공식 검증 제품군과 비교하여 충분히 검증되었다. 모든 에너지와 기울기가 정확하게 계산되었다. 더욱이, SMILES 문자열에서 만들어진 3D 분자에 원자 유형과 힘 상수가 정확하게 할당되었다. 완전한 유연성을 제공하기 위해 사용 가능한 API는 MMFF 에너지 표현식에서 개별 용어를 포함/제외하고 제한된 지오메트리 최적화를 수행할 수 있는 직접 액세스를 제공한다. MMFF가 가능한 분자역학 엔진의 가용성은 나머지 RDKit 기능과 결합되고 BSD 라이선스가 적용되는 것으로 학계와 산업계에서 활동하는 연구자들에게 매력적이다.
배경
분자 역학 힘장은 CPU 집약적인 양자 역학적 방법에 비해 계산에 필요한 자원요구가 적기 때문에 분자 시뮬레이션을 위한 계산 화학자의 작업량 정도가 된다. 일반적으로 약물 설계자와 화학정보학자(cheminformaticians)는 일반적으로 생물학적 고분자에서 작은 약물과 같은 분자에 이르기까지 다양한 구조의 스펙트럼에 걸쳐 우수한 성능을 전달하는 힘 분야에 가장 관심이 많다. 이러한 힘 필드(force fields)는 매개 변수 누락으로 인해 거의 실패하지 않기 때문에 배치 워크플로우에서 리간드 또는 수용체/리간드 합성물의 3D 구성을 최적화하는 데 이상적이다. 일반화된 힘장의 예로는 UFF [1], MMFF94 [2]-[8], OPLS [9], [10], GAFF [11] 및 CGenFF [12]이 있다.
이 중 가장 널리 사용되고 인정받는 것 중 하나는 MMFF94로, Merck 연구소의 Halgren에 의해 약 20년 전에 개발되었고 J. Comput에 대한 일련의 5개의 논문에 의해 문서화되었다. 화학. [2]-[6] 몇 년 후, MMFF94는 기하학 최적화 연구에 맞춰 비틀림 및 평면 외 상호 작용의 다른 매개 변수화로 특징지어지는 "정적" MMFF94s 변형[7]에 의해 보완되었다. 본 문서의 나머지 부분에서 "MMFF"는 MMFF94 및 MMFF94s 변형을 총칭한다. MMFF는 최초 도입 당시 사용 중인 대부분의 일반화된 힘장보다 우수한 작은 분자를 다루는 데 견고성과 품질을 보여주었으며, 또한 보다 최근의 OPLS2005 및 GAFF 힘장[14]과 동등하거나 더 우수하다. 그것의 다재다능함과 효율성은 현재 시장에 출시된 모든 주요 상업용 분자 모델링 패키지(CCG MOE, 슈뢰딩거 마에스트로, 몰소프트 ICM, Certara SYBIL-X)와 체민매틱스 툴킷(ChemAxon, OpenEye)에 그것의 구현을 보증한다.
여기서는 오픈 소스 Cheminformatics 툴킷 RDKit [15] 내에서 MMFF의 구현을 제시한다. MMFF 기능은 C++, C#, Python 및 Java API를 통해 액세스할 수 있다. MMFF의 다른 비상업적 구현은 [16]-[19] 존재하지만, 우리의 구현은 Kearsley [20], [21]이 제공한 정의에 따른 완전한 구현이며, 우리가 아는 한 허용 BSD 3항 면허에 따라 이용할 수 있는 유일한 구현이다.
실행
MMFF 에너지 표현은 결합 스트레칭, 각도 휨, 스트레치-벤드, 평면 외 휨, 비틀림, 반데르발스 및 정전기(식 1)의 7가지 용어로 구성된다. 개별 용어의 기능적 형태는 원본 문헌[2].
EMMFF=messebij+messagesEAijk+eEBAijk+∑EOPijk;l+∑ETijkl+evEvdWij+∑EQij
(1)
주어진 분자 시스템에 대한 힘장을 만드는 첫 번째 단계는 각 원자에 정확한 유형을 할당하는 것이다. MMFF는 95개의 숫자 원자 유형으로 인코딩된 각 원자의 화학적 특성과 환경을 기반으로 216개의 상징적인 원자 유형을 식별한다. 올바른 원자 입력은 방향족 플래그의 적절한 속성에 따라 결정적으로 달라집니다. MMFF에 의해 사용되는 방향족 모델은 RDKit 전체에서 일반적으로 사용되는 방향족 모델과 다르기 때문에, 방향족 모델은 분자의 케쿨화된 표현에서 시작하여 MMFF 기준에 따라 다시 인식되어야 한다. 그 후에 원자 유형은 하이드로겐에 이어 무거운 원자에 할당된다.
두 번째 단계로, 원자 중심의 부분 전하는 형식 전하의 할당이 필요한 MMFF 전하 모델[6]에 따라 계산된다.
댓글 없음:
댓글 쓰기