轉(zhuǎn)錄組的復雜性是高等生物的標志性特征,是蛋白質(zhì)組多樣性的主要來源,同時也極大擴充了非編碼RNA的種類與功能。除經(jīng)典的RNA可變剪接之外,不同基因間的分子融合產(chǎn)生嵌合RNA(chimeric RNA),也是轉(zhuǎn)錄組復雜性的重要來源。DNA水平的基因重組與RNA水平的非經(jīng)典剪接事件,包括順、反式剪接(cis-, trans-splicing)以及相鄰基因的轉(zhuǎn)錄 “順讀”(transcription read-through),均導致嵌合RNA的產(chǎn)生。嵌合RNA及其融合蛋白產(chǎn)物是多種癌癥的關鍵標志物及治療靶點,在正常細胞或組織中也發(fā)現(xiàn)了多個由順、反式剪接或轉(zhuǎn)錄順讀導致的嵌合RNA,表明轉(zhuǎn)錄組多維度的復雜性具有重要的生物學與病理學意義。
近期,清華大學生命學院楊雪瑞課題組通過對大規(guī)模RNA測序數(shù)據(jù)的深度挖掘與分析,發(fā)現(xiàn)一類新的RNA嵌合體,即由基因組DNA的雙向轉(zhuǎn)錄產(chǎn)物融合形成的異鏈嵌合RNA,因此將其命名為cross-strand chimeric RNA (cscRNA)。該研究成果于2021年7月30日發(fā)表于《自然通訊》(Nature Communications),論文題目為“雙向轉(zhuǎn)錄產(chǎn)物的融合產(chǎn)生異鏈嵌合RNA”(Identification of the cross-strand chimeric RNAs generated by fusions of bi-directional transcripts),論文鏈接:https://www.nature.com/articles/s41467-021-24910-2
該研究的創(chuàng)意來源于對已知RNA融合機制的總結(jié):RNA順、反式剪接以及相鄰基因的轉(zhuǎn)錄順讀均依賴于兩個RNA接合位點在空間上的靠近。事實上,產(chǎn)生環(huán)狀RNA的back-splicing事件也依賴于RNA 5’端與3’端在空間上的靠近。課題組由此推論:在一段基因組區(qū)域內(nèi),分別以DNA雙鏈為模版的雙向轉(zhuǎn)錄產(chǎn)物RNA有很大的窗口在空間上彼此靠近,因此,至少在理論上,兩個分子間具備了發(fā)生RNA融合,產(chǎn)生異鏈嵌合RNA(cscRNA)的可能性。
cscMap使用RNA雙端測序數(shù)據(jù)鑒定cscRNA的技術原理
基于以上假說,楊雪瑞課題組開發(fā)了針對性的生物信息分析流程cscMap,使用被常規(guī)RNA測序數(shù)據(jù)比對流程排除的“垃圾”數(shù)據(jù),系統(tǒng)鑒定異鏈RNA融合事件,準確發(fā)現(xiàn)cscRNA并排除技術噪音與潛在的假陽性。課題組從ENCODE、GEO等大型數(shù)據(jù)庫收集了364套高質(zhì)量RNA深度測序數(shù)據(jù),涉及人、鼠、斑馬魚、線蟲、果蠅、酵母、大腸桿菌等多個物種,其中人源數(shù)據(jù)近300套,覆蓋正常組織、原代正常細胞、癌癥細胞系等各類樣本。cscMap對以上一系列人類樣本數(shù)據(jù)的掃描發(fā)現(xiàn)了大量cscRNA,其中可靠性高、在多個樣本中重復出現(xiàn)的cscRNA約3000個。在其它物種中,cscMap也發(fā)現(xiàn)大量cscRNA,其在物種間的保守性較差,并且隨著物種生物復雜度的升高,cscRNA出現(xiàn)頻率呈上升趨勢。
在人源組織、細胞及其它物種中發(fā)現(xiàn)的cscRNA數(shù)量
在構建了cscRNA的物種與組織特異性數(shù)據(jù)庫資源后,課題組通過實驗方法驗證了多個cscRNA在細胞中真實存在,且具有潛在的重要生物學功能,并進一步展開對其表達、來源等特征的深入分析。正如課題所預期的,cscRNA主要來源于RNA水平的分子融合,而不是DNA水平的基因重組。與lncRNA、miRNA等非編碼RNA類似,cscRNA在細胞中的表達水平差異較大,具有明顯的組織特異性。
cscRNA在各類人源樣本中呈現(xiàn)組織特異性
從其來源看,cscRNA多來源于已注釋基因及其反義鏈DNA的對向轉(zhuǎn)錄產(chǎn)物,產(chǎn)生cscRNA的兩個異鏈接合位點在基因組上通常非常靠近(10kb之內(nèi))。值得注意的是,cscRNA 3’片段的接合位點高度富集于外顯子5’端上下游非常窄的區(qū)間,但卻往往并不恰好位于5’端。這暗示形成cscRNA的異鏈接合極有可能與pre-mRNA的剪接有關,但并非經(jīng)典的剪接事件,而是可能與剪接過程的某種異常有關。
形成cscRNA的異鏈接合位點輕微富集經(jīng)典的剪接受體位點(AG)及供體位點(GT)(左圖),并大量出現(xiàn)于外顯子5’端周邊(右圖)。
總之,該研究對cscRNA的序列、表達、來源、分布等基本特征獲得了比較全面系統(tǒng)的認識,通過對異鏈嵌合RNA的發(fā)現(xiàn)與解析,為轉(zhuǎn)錄組的高度復雜性展開了新的維度。與此同時,研究成果也引出一系列關于cscRNA的生成、調(diào)控、功能的待解決問題,特別是RNA剪接的復雜調(diào)控與cscRNA之間的關系、cscRNA共性或特異性的生物學功能等。而通過對cscRNA一系列特征的深入挖掘,本研究為cscRNA的起源和功能提供了有價值的信息,獲得了豐富的數(shù)據(jù)資源,奠定了下一步研究的基礎。
清華大學生命學院王雨亭博士、鄒沁博士為論文共同第一作者,楊雪瑞為論文通訊作者。課題組其他成員李發(fā)金、趙文溦、徐暉等為本研究做出了重要貢獻,鄧海騰課題組為課題提供了質(zhì)譜數(shù)據(jù)分析方面的大力協(xié)助。研究工作得國家重點研發(fā)計劃重點專項、國家自然科學基金委、清華大學自主科研項目的資助。國家蛋白質(zhì)科學研究(北京)設施(清華大學蛋白質(zhì)研究技術中心)及清華大學生物醫(yī)學測試中心下屬基因測序與分析平臺、生物計算平臺及細胞影像平臺對本課題各項的分析與實驗提供了大力支持。
論文鏈接:https://www.nature.com/articles/s41467-021-24910-2
版權與免責聲明:本網(wǎng)頁的內(nèi)容由收集互聯(lián)網(wǎng)上公開發(fā)布的信息整理獲得。目的在于傳遞信息及分享,并不意味著贊同其觀點或證實其真實性,也不構成其他建議。僅提供交流平臺,不為其版權負責。如涉及侵權,請聯(lián)系我們及時修改或刪除。郵箱:sales@allpeptide.com