제목 | 클라우드 인프라를 활용한 대규모 가상 스크리닝: warpDOCK 파이프라인의 효율성과 접근성 |
추천 연구 논문 | warpDOCK: Large-Scale Virtual Drug Discovery Using Cloud Infrastructure |
선정 이유 | 신약 개발을 함에 있어서 후보 약물 스크리닝은 많은 수의 라이브러리를 이용할수록 후보 약물 식별 가능성이 높아진다. 따라서 스크리닝하는 라이브러리의 수는 후보 약물 발굴에 있어 중요하다. 하지만 수백만개에서 수십억개에 이르기까지도 하는 초대형 화학 라이브러리를 모두 스크리닝하는 것은 컴퓨터 시뮬레이션을 통해 하더라도 계산량이 매우 많아, 시간 소모가 크다. 이러한 면에 있어, 스크리닝의 시간 소모를 줄이기 위해서는, 계산을 최대한 효율적으로 하는 메커니즘을 개발하거나 컴퓨터의 성능이 좋아져야 한다. 해당 연구팀은 초대형 라이브러리 스크리닝을 병렬 처리를 통해 기존보다 다양한 화합물을 빠르게 평가하고 최적의 후보를 식별할 수 있도록 하는 docking tool을 개발하였다. 생체 시계 후보 약물 스크리닝을 할 때, 이 warpDOCK이라는 tool을 이용해서, 대량의 화합물 라이브러리를 활용하여 스크리닝을 진행해보면 좋을 것이라 생각되어 해당 논문을 선정하게 되었다. |
주요 내용 | warpDOCK은 Oracle Cloud Infrastructure(OCI)를 사용한 가상 small molecule 약물 발견을 위한 오픈 소스 파이프라인이다. 이는 대규모 화학 라이브러리를 비용 효율적으로 샘플링하고, 리드 약물 후보를 신속하게 식별할 수 있다. 기존 가상 스크리닝은 onsite high-performance computing(HPC) cluster를 사용하여 수백만 개의 화합물을 처리하는 데 며칠에서 몇 주가 소요된다. 최근에는 1억 개 이상의 화합물을 대상으로 하는 대규모 가상 스크리닝이 증가하고 있다. warpDOCK은 클라우드 인프라를 활용하여 이러한 문제를 해결하고, 사용자들이 쉽게 접근할 수 있도록 설계되었다. warpDOCK은 python으로 개발된 Queue 엔진을 사용하여 core 사용률을 최적화하고, 다양한 docking 알고리즘(Qvina2, AutoDock Vina 등)과 호환된다. 이를 통해 대규모 가상 스크리닝의 효율성을 극대화한다. OCI에서 다양한 라이브러리 크기와 코어 수, search grid volume을 조합하여 가상 스크리닝을 수행한 결과, warpDOCK은 좋은 성능과 확장성을 보여주었다. 계산 시간이 리간드 수와 코어 수에 따라 기하급수적으로 증가 및 감소한 모습을 보였다. warpDOCK은 선형적으로 확장되는 계산 시간을 통해 비용을 예측할 수 있다. 예를 들어, 1024개의 CPU를 사용하여 128만 개의 리간드를 스크리닝하는 데 약 32.68 USD가 소요된다. 또한, AmpC β-lactamase와 SaDdl을 대상으로 2가지 가상 스크리닝 실험을 수행하여 warpDOCK의 효율성과 경제성을 입증했다. 최종적으로, warpDOCK은 클라우드 인프라를 활용한 대규모 가상 스크리닝을 위한 강력하고 사용하기 쉬운 framework를 제공한다. 다양한 docking 알고리즘과 호환되며, 오픈 소스로 제공되어 과학 커뮤니티의 협력과 발전 또한 촉진할 수 있음을 보여준다. |
시사점 | 해당 논문은 첫 번째로, 클라우드 인프라를 통한 대규모 가상 스크리닝의 가능성을 보여주었다. warpDOCK은 클라우드 컴퓨팅의 장점을 최대한 활용하여 대규모 화학 라이브러리와 단백질 구조를 효율적으로 스크리닝할 수 있는 가능성을 보여주었다. 이는 대규모 화학 라이브러리를 대상으로 한 가상 스크리닝의 시간과 비용을 획기적으로 줄일 수 있다. 두 번째로, warpDOCK은 다양한 사용자가 쉽게 접근할 수 있도록 설계되었다는 것이다. 클라우드 인프라를 활용함으로써, 사용자들은 고성능 컴퓨팅 클러스터 관리 경험이나 스크립팅 지식이 없어도 대규모 가상 스크리닝을 수행할 수 있을 것이다. 또한 python으로 작성된 warpDOCK의 코드는 GitHub에서 오픈 소스로 제공되어, 과학 커뮤니티가 지속적으로 기여하고 발전시킬 수 있는 환경을 제공한다. 세 번째로, warpDOCK은 Qvina2, AutoDock Vina, Smina vinardo 등 다양한 docking 알고리즘과 호환되어, 사용자가 자신의 연구 목적에 맞는 docking software를 선택하여 사용할 수 있도록 한다. 마지막으로, 이 파이프라인은 필요한 만큼의 컴퓨팅 자원을 유연하게 확장할 수 있어, 리소스를 최최적화하고 비용을 절감할 수 있게 한다. 예를 들어, 전통적으로는 onsite high-performance computing(HPC) cluster를 사용하여 최대 300만 ~ 500만개의 화합물을 대상으로 하는 가상 스크리닝 실험을 수행했으며, 최근에는 1억 개 이상의 화합물 라이브러리, 심지어 10억 개의 화합물을 사용하는 대규모 가상 스크리닝을 수행한 연구들이 점점 많이 발표되고 있다. 이렇게 많은 리간드를 스크리닝하는데에 소요되는 작업을 훨씬 빠르게 수행할 수 있도록 해준다는 것이다. |
RLRC 생체시계-항노화 융합
Comments