제목 | Scoring power, ranking power, docking power, screening power 계산을 통한 scoring function 비교 평가 |
추천 연구 논문 | Comparative assessment of scoring functions: The CASF-2016 update |
선정 이유 | CASF-2016(Comparative Assessment of Scoring Functions)은 docking process의 scoring function의 성능을 평가하기 위해 만들어진 sample인 scoring benchmark이다. 해당 논문은 CASF-2016을 통해, 수많은 docking simulation tool들의 scoring function 평가 및 비교하였다. 생체 시계를 연구하는 것에 있어서, 단백질-단백질 간의 상호작용을 분석 및 이해하기 위해, 가장 근본적인 분석은 molecular docking simulation을 통해, 그들 간의 결합력이 어떠한 지, 어떤 아미노산이 어떤 상호작용을 하는 지 등을 계산하는 것이다. 하지만 docking simulation을 제공하는 tool은 무수히 많고, 그들 각각은 자신만의 알고리즘 및 계산식을 가지고 있어, 같은 샘플을 계산하더라도 그 결과는 모두 다르다. 물론 각각의 tool마다 가지고 있는 장단점 또한 다르기 때문에, 자신이 하는 연구에 더 잘 맞는, 잘 어울리는 docking tool을 선정하는 것도 연구를 하는 것에 중요한 부분이라고 생각된다. 따라서, 많은 docking software 간의 docking 성능을 테스트하여 비교 평가를 해 준 해당 논문이, 생체 시계를 연구하기 위해 선정한 타겟에 어떠한 docking program이 적합할 지 많은 도움을 줄 것이라 생각되어 이 논문을 선정하였다. |
주요 내용 | 해당 연구팀은 이전에도 docking program들의 performance를 비교 평가하기 위해 CASF-2013 dataset을 만들어 분석하였다. 그리고 이번에 CASF-2013보다 개선된 CASF-2016 data set은 CASF-2013보다 감소된 cross-binders(같은 ligand가 multiple target protein에 binding하는 것) 를 가진다. 또한, CASF-2016이 CASF-2013과는 다른 특징 중 하나는 바로 모든 strain energy가 OPLS3 force field로 계산되었다는 것이다. 그리고 CASF-2013에서는 decoy ligand binding poses의 최대 개수가 각 protein-ligand pair 당 50개였지만 CASF-2016은 100개이다. 또, CASF-2013은 각 target protein당 3개의 known ligands를 지닌 test set이었지만, CASF-2016은 5개씩은 가지고 있는 test set으로 구성되어 있다. 이러한 CASF-2016 test set으로 GlideScore-SP, △vinaRF20, X-score, Affinity-dG@MOE 등의 많은 docking software들의 scoring power, ranking power, docking power, screening power를 비교 평가하였다. 예를 들어, docking power 부분에 있어서는, 각 software를 이용하여 CASF-2016 test set을 가지고 docking simulation을 하였을 때, RMSD 값이 2.0Å 미만인 결과를 얼마나 산출하는 지를 토대로 performance를 평가하였다. Screening power 부분에 있어서는, 각 software를 이용하여 CASF-2016 test set을 가지고 docking simulation을 하였을 때, 상위 docking 결과들 중에서 true binder를 가진 pose가 얼마나 있는 지를 지표해주는 Enhancement factor를 계산하여 비교 및 평가한다. 이렇듯 해당 연구팀은 CASF-2016이라는 test set을 만들어, 많은 docking software들 간의 docking 성능을 비교 평가하였고, docking 성능을 비교 평가하기에 최적화된 data set인 CASF-2016이라는 test set을 만들었다. |
시사점 | 해당 연구팀은 CASF-2016 data set을 open-access benchmark로 PDBbind에 공개하였다. In-silico 분야에서 신약 개발을 하는 것에 있어, docking simulation 기술이 많이 사용된다. 하지만 docking simulation을 제공하는 software가 워낙 다양하고, 그들만의 performance도 다 다르기 때문에, 자신의 연구에 적합한 docking software를 찾는 것은 중요한 과정이다. 생체 시계에 관한 단백질들 간의 상호작용, 혹은 단백질과 화합물 간의 상호작용을 연구하는 것뿐만 아니라 다양한 상호작용을 연구하는 것에 있어, 해당 논문에서 보여주는 결과들이 연구에 많은 도움을 줄 것이라 기대된다. 또한, 해당 논문에서 제공하는 CASF-2016 data set을 활용하여, 자신이 사용하고자 하는 기술의 또 다른 docking software에 대해 그 성능을 평가해보는 것에 있어 많은 도움이 될 것이라 생각된다. |
RLRC 생체시계-항노화 융합
Commentaires