近日,中南大學(xué)湘雅藥學(xué)院曹東升副教授團(tuán)隊(duì)在國際生物信息學(xué)權(quán)威期刊《Briefings in Bioinformatics》(IF=9.101, JCR1區(qū)Top期刊)以論著形式在線發(fā)表了題為“Improving Structure-Based Virtual Screening Performance via Learning From Scoring Function Components”(DOI:10.1093/bib/bbaa094)的最新研究成果。該研究提出了一種借助機(jī)器學(xué)習(xí)算法改善對接軟件篩選能力的方法。
分子對接模擬是基于結(jié)構(gòu)藥物設(shè)計(jì)的重要手段。蛋白配體對接的一般過程是把配體小分子放在受體的活性口袋中,通過不斷優(yōu)化小分子的位置以及分子內(nèi)部柔性鍵的二面角,尋找小分子化合物和靶標(biāo)大分子相互作用的最佳構(gòu)象,然后使用打分函數(shù)計(jì)算其相互作用和結(jié)合能。傳統(tǒng)的打分函數(shù)通常選取專家挑選的少量特征與實(shí)驗(yàn)測定親和力值進(jìn)行線性回歸,但是這種線性關(guān)系并不總是存在的,因而無法滿足實(shí)際使用需求。提升對接打分函數(shù)的虛擬篩選能力,能夠極大地節(jié)約時(shí)間和資源成本,加速先導(dǎo)化合物的發(fā)現(xiàn)過程。
本研究提取了MOE, GOLD,Schrödinger三個(gè)對接軟件共計(jì)61種能量輔助項(xiàng)作為蛋白-配體相互作用的表征,使用XGBoost算法進(jìn)行分類模型訓(xùn)練,預(yù)測小分子化合物與目標(biāo)靶點(diǎn)結(jié)合的可能性,從而提升對接軟件的虛擬篩選性能。該方法在8個(gè)多樣性靶點(diǎn)數(shù)據(jù)集上進(jìn)行驗(yàn)證,使用多種虛擬篩選指標(biāo)(ROC, BEDROC, logAUC, EF)進(jìn)行評估,證實(shí)其能夠顯著提升基于對接的虛擬篩選的效率并且優(yōu)于其他同類型的篩選輔助模型。該方法操作簡便,將經(jīng)驗(yàn)知識與機(jī)器學(xué)習(xí)相結(jié)合,可以推廣到其他能夠提供能量輔助項(xiàng)的對接軟件中。
湘雅藥學(xué)院2019級碩士研究生熊國麗為本文第一作者,曹東升副教授與浙江大學(xué)侯廷軍教授為通訊作者。另外,系列分子對接算法研究近期發(fā)表于《Briefings in Bioinformatics》(IF = 9.101,2篇),《Journal of Chemical Information and Modeling》(IF = 3.966,1篇),《Journal of Chemical Theory and Computation》(IF = 5.313,1篇),《Physical Chemistry Chemical Physics》(IF = 3.520,1篇),通訊作者為曹東升副教授和浙江大學(xué)侯廷軍教授。上述工作得到了國家重點(diǎn)基礎(chǔ)研究計(jì)劃青年科學(xué)家項(xiàng)目,國家自然科學(xué)基金的支持。
版權(quán)與免責(zé)聲明:本網(wǎng)頁的內(nèi)容由收集互聯(lián)網(wǎng)上公開發(fā)布的信息整理獲得。目的在于傳遞信息及分享,并不意味著贊同其觀點(diǎn)或證實(shí)其真實(shí)性,也不構(gòu)成其他建議。僅提供交流平臺,不為其版權(quán)負(fù)責(zé)。如涉及侵權(quán),請聯(lián)系我們及時(shí)修改或刪除。郵箱:sales@allpeptide.com