모델링 캠페인을 처리할 때, 모든 구조적 특성이 관심있는 실험 특성을 결정하는 데 관련되지 않을수도 있다는 가설을 세울 수 있다.
마찬가지로, 모든 MD가 모델링 목적에 적합한 것은 아니다.
따라서, 분자 설명자의 선택은 각각의 컴퓨터 지원 프로젝트의 결과에 직접적으로 영향을 미친다.
분자 설명자의 선택은 모델링 기법의 특성보다 QSAR 모델의 사전 예측 성능에 훨씬 더 큰 영향을 미치는 것으로 나타났다. 따라서, 상호 평가의 문제를 가장 잘 다루기 위해서는 최적의 설명자 집합은 상호 검정 문제를 가장 잘 해결한다.
분자 서술자의 선택 외에도, 처리와 사용은 분자 사이의 유사성이 어떻게 표현되는지와 같은 해당 계산 모델에 결정적인 영향을 미친다.
설명자 기반 애플리케이션을 다룰 때 고려해야 할 관련 요소는 소위 "활동 환경"입니다. 활동 환경은 분자 설명자 공간과 실험 활동 공간 사이의 관계로 생각할 수 있다.
즉, 전자를 지도의 지리적 좌표 집합(즉, 위도와 경도)으로 상상하는 경우, 후자는 지도의 각 지점에서 지형의 높이를 나타낸다(그림 3).
활동 환경은 관심 끝점/검사의 특성, 훈련용 콤파운드로 적용되는 화학 공간, 이러한 영역의 화합물의 밀도 분포, 그리고 가장 중요한 것은 사용된 분자 설명자의 특성에 따라 달라진다.
분자 활동 환경은 부드럽게 구르는 언덕, 울퉁불퉁한 협곡과 비슷하거나 중간 시나리오일 수 있다.
완만하게 구르는 언덕(그림 3a)이 있는 경우 분자 구조의 작은 변화(또는 구조 정보를 포착하는 데 사용되는 설명자의 작은 변화)가 활동에 작은 영향을 미칠 것이다. 이 경우, 주어진 분자의 주변은 유사한 활동을 공유하는 점점 더 다양한 구조의 스펙트럼에 의해 채워질 것이다.
반대로, "계곡과 비슷한" 환경이 존재하는 경우(그림 3b), 작은 구조 변화는 활동에 극적인 영향을 미칠 수 있다. 이러한 급격한 변화를 흔히 "활동 절벽"이라고 한다.
일반적으로 “활동 절벽”은 주변 분자가 효력, 활동 또는 독성의 큰 차이를 보이는 화학 공간의 영역으로 정의된다.
활동 절벽의 연구는 "작은 화학적 변화 = 큰 활동 변화" 특성을 고려할 때 많은 구조-활동 기반 적용에 높은 관심을 갖고 있다.
한편, 활동 절벽은 계산 화학자들에게 기본적인 구조-활동 관계를 이해하기 위한 기본적인 정보를 제공하지만, 다른 한편으로는 해당 모델의 일반화 능력에도 영향을 미친다.
이러한 맥락에서 분자 설명자는는 분자 구조가 어떻게 정보로 변환되고, 그에 따라 분자 간의 유사성이 어떻게 인식되는지를 결정하는 근본적인 역할을 한다. 따라서, 분자 설명자 공간의 적절한 선택은 활동 절벽의 존재를 감소시키거나 강조할 수 있으며, 독성학적 문제를 위한 완만하게 구르는 언덕과 리드 최적화 목적을 위한 험준한 풍경과 같은 분석 대상 문제에 대한 최적의 구조-활동 시나리오를 초래할 수 있다.
마지막으로, 기본 분자 구조와의 모호하지 않은 연결 때문에, 분자 설명자를 활용하여 기본 생물 논리 과정에 대한 기계적 통찰력을 얻을 수 있다. 이를 위해 대부분의 모델링 및 설명자 기반 프로토콜에 쉽게 해석할 수 있는 분자 설명자를 선택하는 것이 좋다.
또한, 모델 해석성은 "파시모닉" 모델, 즉 가능한 한 적은 수의 (그리고 가장 단순한) 설명자로 구성된 모델을 선택하여 육성할 수 있다.
마지막으로, 구조 해석과의 연계가 즉각적이지 않더라도, 인코딩된 구조 특성을 이해하는 것이 새로운 화학 및 생물학적 개념의 도입의 기초를 마련할 수 있다.
댓글 없음:
댓글 쓰기