2021年11月18日,國際權威期刊Nucleic Acids Research(中科院JCR期刊1區(qū),五年影響因子為15.542,)在線發(fā)表了農學院李飛教授團隊題為“InsectBase 2.0: a comprehensive gene resource for insects”的研究論文。該研究通過廣泛收集與分析昆蟲基因數(shù)據,構建起目前昆蟲學領域最為廣泛、全面、標準化的數(shù)據平臺,為昆蟲學各領域研究提供了寶貴資源。
?
昆蟲作為世界上多樣性最為豐富的物種,約占物種總數(shù)的85%以上。隨著高通量測序技術的迅速發(fā)展,產生了大量的昆蟲基因組數(shù)據。這些數(shù)據散亂分布在不同數(shù)據庫中,缺乏統(tǒng)一格式標準以及深度信息挖掘,極大阻礙了昆蟲學基因數(shù)據的充分利用與標準化分析。
本研究共搜集了昆蟲綱20個目中815種昆蟲的基因組、25805個轉錄組以及1674個小RNA文庫數(shù)據?;谶@些數(shù)據,通過標準化流程注釋了482個昆蟲基因組,最終獲得了超過1500萬條蛋白編碼基因、11萬條miRNA以及129萬條lncRNA。除此之外,本研究通過進一步分析,預測了miRNA靶標基因、lncRNA partner基因,注釋了164個常見昆蟲基因家族、419個KEGG通路以及預測了21萬個潛在的水平轉移(HGT)基因,提供了更多數(shù)量、更高質量以及更多層次的昆蟲基因數(shù)據。
通過匯總和整理以上數(shù)據,構建起InsectBase 2.0昆蟲綜合基因數(shù)據庫,共包含Organism,Chromosome,Genome,Transcriptome,Gene,Gene family,HGT gene,KEGG pathway,Insect virus,Tools,Links和Service共11個模塊。網站提供了物種信息查詢、不同類型基因、病毒數(shù)據的搜索與下載功能。除此之外,InsectBase 2.0集成了BLAST,JBrowse2工具,提供了七百余種物種的基因BLAST與基因組瀏覽器功能。同時基于MCScanX共線性分析,提供了155個染色體級別基因組之間的共線性可視化分析,為昆蟲染色體進化提供了有力的工具。
本論文第一作者為浙江大學昆蟲所博士生梅洋,通訊作者為浙江大學李飛教授。浙江大學昆蟲所研究生荊冬、湯沈楊與陳曦等參與了本項目的研究。本研究得到了國家自然科學基因、國家高技術研究發(fā)展計劃、浙江省國家自然科學基金等項目資助。
數(shù)據庫網址:http://v2.insect-genome.com/??
文章鏈接:https://academic.oup.com/nar/advance-article-abstract/doi/10.1093/nar/gkab1090/6430839
版權與免責聲明:本網頁的內容由收集互聯(lián)網上公開發(fā)布的信息整理獲得。目的在于傳遞信息及分享,并不意味著贊同其觀點或證實其真實性,也不構成其他建議。僅提供交流平臺,不為其版權負責。如涉及侵權,請聯(lián)系我們及時修改或刪除。郵箱:sales@allpeptide.com