6月12日,我院戚繼課題組在《Methods in Ecology and Evolution》雜志在線發(fā)表題為“PhyloMCL: accurate clustering of hierarchical orthogroups guided by phylogenetic relationship and inference of polyploidy events”的研究論文,該算法為基因組尺度上研究真核生物間的同源基因提供了準(zhǔn)確高效的新工具。
圖. PhyloMCL與同類方法在動(dòng)物和植物基因組中的分析結(jié)果比較
準(zhǔn)確判斷物種間同源基因的相互關(guān)系對(duì)于推斷基因的分子生物學(xué)功能、大尺度重建基因家族的系統(tǒng)發(fā)育關(guān)系、重建真核生物各類群的進(jìn)化歷史至關(guān)重要。同源基因識(shí)別與聚類往往是分子遺傳學(xué)和基因組學(xué)研究的必要步驟。動(dòng)植物基因組中存在大量的重復(fù)基因,極大增加了基因組的復(fù)雜性。一方面重復(fù)基因通過累積隨機(jī)突變發(fā)生新功能化和亞功能化,為新基因和新功能的產(chǎn)生提供了源泉,有利于促進(jìn)增加物種的環(huán)境適應(yīng)性;另一方面,重復(fù)的存在也對(duì)如何準(zhǔn)確識(shí)別同源基因的生物信息學(xué)方法開發(fā)提出了挑戰(zhàn),難點(diǎn)包括同源基因突變速率異質(zhì)性、基因融合和基因分裂等復(fù)雜進(jìn)化事件。特別是脊椎動(dòng)物祖先、被子植物祖先和內(nèi)部類群發(fā)生的染色體多倍化事件進(jìn)一步增加了正確判斷同源基因親緣關(guān)系的困難程度。
該研究提出了一種基于馬爾可夫基因聚類的生物信息學(xué)新方法PhyloMCL(https://phylomcl.sourceforge.io/),納入了生物類群的系統(tǒng)發(fā)育關(guān)系作為物種框架參考,并充分考慮了不同分類層次的染色體多倍化對(duì)重復(fù)基因保留程度的影響,可以在多物種的全基因組規(guī)模上準(zhǔn)確識(shí)別基因的直系和旁系同源關(guān)系,并以層次同源聚類的方式展現(xiàn)具體結(jié)果。為驗(yàn)證方法的有效性,該文章分別采用動(dòng)物和植物的多組基因組進(jìn)行準(zhǔn)確性評(píng)估:(1)將該方法應(yīng)用到12個(gè)后生動(dòng)物的基因組聚類分析時(shí),召回率和準(zhǔn)確率分別達(dá)到87.8%和83.2%,大幅超過已發(fā)表的同類研究方法;(2)該方法在分析25個(gè)種子植物基因組時(shí),可以準(zhǔn)確識(shí)別初被子植物進(jìn)化過程中的多次多倍體事件。該方法進(jìn)一步將個(gè)體植物基因組中數(shù)以萬計(jì)的旁系同源基因劃分為不同的演化起源,成功識(shí)別出各分類層次發(fā)生的內(nèi)/外旁系同源基因,準(zhǔn)確性超過90%。PhyloMCL得益于Markov聚類策略和物種樹指導(dǎo),可以在可承受的時(shí)間內(nèi)準(zhǔn)確地對(duì)數(shù)百萬個(gè)同源基因進(jìn)行分類,從而滿足了測(cè)序基因組快速增長(zhǎng)帶來的植物學(xué)研究挑戰(zhàn)。
綜上所述,PhyloMCL方法采用馬爾可夫聚類策略并充分納入物種親緣框架和多倍化因素的考量,可以在同時(shí)對(duì)上百個(gè)基因組中數(shù)以百萬級(jí)別的同源基因進(jìn)行準(zhǔn)確高效的分類,解決了基因組高速增長(zhǎng)為分子遺傳學(xué)和基因組學(xué)帶來的挑戰(zhàn)。
我院16級(jí)博士生周盛予為本研究的第一作者,遺傳工程國(guó)家重點(diǎn)實(shí)驗(yàn)室的戚繼研究員和江西農(nóng)業(yè)大學(xué)的國(guó)春策教授為文章的共同通訊作者。該研究獲得國(guó)家自然科學(xué)基金和復(fù)旦大學(xué)遺傳工程國(guó)家重點(diǎn)實(shí)驗(yàn)室的共同資助。
全文鏈接:https://besjournals.onlinelibrary.wiley.com/doi/full/10.1111/2041-210X.13401
版權(quán)與免責(zé)聲明:本網(wǎng)頁(yè)的內(nèi)容由收集互聯(lián)網(wǎng)上公開發(fā)布的信息整理獲得。目的在于傳遞信息及分享,并不意味著贊同其觀點(diǎn)或證實(shí)其真實(shí)性,也不構(gòu)成其他建議。僅提供交流平臺(tái),不為其版權(quán)負(fù)責(zé)。如涉及侵權(quán),請(qǐng)聯(lián)系我們及時(shí)修改或刪除。郵箱:sales@allpeptide.com