Direct RNA 測序丨我們可以做什么?

隨著高通量測序技術的發展,轉錄組測序已經成為研究基因表達調控的主要手段。二代測序技術通量高,更多的關注基因表達量,然其局限性在于測序讀長短,轉錄本產生拼接錯誤,導致轉錄本結構不完整。生物體內復雜多變的轉錄本是調節基因表達和蛋白質多樣性的重要機制,準確鑒定轉錄本結構,是深入研究基因表達調控模式的基礎。

全長轉錄組研究可全面快速的獲取有參或無參物種特定組織或器官在某一狀態下的全長轉錄本信息,構建轉錄本基因集。相較于RNA-seq,基于Nanopore三代測序平臺的轉錄組研究,無需打斷,直接讀取5’ 端到3’-PolyA的高質量完整轉錄本,準確鑒定可變剪接、新基因/新異構體、可變多聚腺苷酸化、融合基因等,完善基因組注釋。此外,Nanopore平臺更擁有獨一無二的Direct RNA測序方式。

那么,使用Direct RNA測序技術,我們能做些什么呢?下面小編帶大家解析一篇新出爐的direc RNA 測序文章

中文題目:使用direct RNA測序技術對秀麗桿線蟲進行轉錄組測序

英文題目:The full-length transcriptome of?C. elegans?using direct RNA sequencing

發表時間:2019.04.09

發表期刊:BioRxiv

研究背景

目前絕大多數的轉錄組注釋都是依賴于cDNA高通量測序固有的短讀長測序技術。線蟲的基因組緊湊,注釋良好,細胞譜系穩定,是一種理想的實驗模型生物。然而,在秀麗桿線蟲的轉錄組中,大約有超過一半的轉錄本缺少全長信息的支撐,且依賴于無法跨越轉錄本全長序列的短reads的預測。同時,利用短讀長對polyA和3’UTR進行預測,并不能直接鑒定到剪接轉錄本的起始位點,且在3’UTR鑒定中,依賴于將推測的剪接位點分配給最近的重疊或上游基因。相比之下,納米孔測序沒有理論上的讀取長度上限,能夠在單個分子水平上對轉錄本進行一端到另一端的測序。

材料方法

材料:L1、L2、L3、L4、幼年成蟲(YA)、成蟲,雄性線蟲;每個時期兩次技術重復

方法:20 μg Total RNA,調取約600ng PolyA RNA;GridION平臺,direct RNA sequencing

結果

1、線蟲測序數據統計及全長轉錄本鑒定

選取線蟲發育的L1、L2、L3、L4、幼年成蟲(YA)和成蟲時期,以及雄性成蟲,其中幼年成蟲和成蟲雌雄同體,對其進行direct RNA測序,每個時期兩個技術重復。共計獲得5.54M reads,其平均長度為739到934 bp,基因組比對率為87.8%。

通過一系列的篩選標準,最終共計獲得2.9M 全長reads。綜合所有階段,最終鑒定到25,944 個全長轉錄本,其中20,987個轉錄本有唯一的可變剪接形式,16,325個轉錄本有唯一的3’UTRs ,平均每個階段鑒定到超過12,000條全長序列。在和線蟲數據庫進行注釋比對后,有12,613 轉錄本和10,711 個基因有全長數據支持,此外還鑒定到4,234個新基因和7,404 個新轉錄本。其中,發現9,900個已知可變剪接轉錄本和2,188個新的可變剪接轉錄本,對應1,349個基因。在這些新的剪接轉錄本中,有1,283個轉錄本在注釋的供體和受體剪接位點之間存在新的剪接位點,同時173個轉錄本還存在新的外顯子。

圖一 全長轉錄本測序概述

2、3UTR鑒定

本文共鑒定到16,325個唯一的3’UTR轉錄本,在每個階段均鑒定到超過10,000 個3’UTRs。將鑒定到的3’?UTR與已知數據庫進行比對,發現共有82.9% UTRs的重疊。此外,還鑒定到2,304個新的發現的3’?UTR。3’?UTR的長度會隨著階段的延續,從L1到L4,逐漸變短,在成年線蟲中,雄性線蟲的3’?UTR要短于雌雄同體的成蟲,而成蟲的 3’?UTR要稍長于L4階段的成蟲,這與前人的報道相反。通過不同階段多聚腺苷酸化位點統計,發現在不同階段,其位點不存在顯著差異,該結果表明,不同階段3’?UTR的長度分布與多聚腺苷化位點無關。

?圖二?3’?UTR特征統計

3、PolyA尾預測

研究表明,在黑腹果蠅中,polyA尾的長度會隨著發育階段而呈現出動態變化。而在本文中,通過對線蟲不同時期polyA長度的統計,發現其變化比較穩定,在幼蟲發育階段,其變化范圍為49nt(L1)到54nt(L2);在成蟲發育階段(幼年成蟲、雌雄同體成蟲和雄性成蟲),其polyA長度中位數為58nt,要長于幼蟲的polyA長度(52nt)。該結果表明,在成蟲和幼蟲之間,polyA的長度變化最為顯著。將L4階段的polyA長度分布與前人研究報道進行比較,發現其長度分布非常相似,均在30~40 nt出現峰值,并向較長的尾部延伸。

PolyA的長度,有可能和3’?UTR區域的polyA剪接位點(AAUAAA)有關。為了證明該推測,本文對不同polyA剪接位點類型(經典的、可變的及無剪接位點)的polyA尾進行了長度統計,發現不同類型間存在顯著差異,且3’UTR區域不存在polyA剪接位點的,具有更長的polyA尾巴。在3’UTR區域,無polyA剪接位點的,其polyA長度中位數為58 nt,具有可變polyA剪接位點的,長度為46 nt;具有經典的polyA剪接位點(AAUAAA),其長度中位數為48 nt。研究表明,polyA尾的長度與基因表達呈現負相關,即高表達的基因具有更短的polyA尾。對本研究數據進行統計發現,在幼蟲發育階段發現有相似的負相關關系。例如,Y37E3.8基因的a轉錄本的表達要顯著高于b.1轉錄本,其polyA尾相較于b.1更短。polyA長度和基因表達水平的相關性R2?最高為0.1297。在成蟲發育階段,polyA長度和基因表達水平的相關性并不是很高。該結果表明,基因表達水平和polyA尾長度的負相關性具有階段性。最后,本文研究了polyA長度與內含子保留可變剪接事件的相關性。研究表明,在人類細胞系中,polyA尾的長度與內含子保留有關。在本文中,也發現polyA尾和內含子保留事件呈現正相關。該結果表明,polyA尾在轉錄后調控存在一種保守機制,即在核轉錄本中,其擁有更長的polyA尾,而隨著轉移到內質網的過程中,polyA尾會進行脫腺苷化而進行轉錄后進程。

圖三 PolyA 特征統計
小結
在本研究中,作者更側重于關注全長轉錄本的結構分布,并對其進行了詳細描述。從本研究可以看出,使用Nanopore測序平臺進行direct RNA測序,借助其長讀長優勢,可準確鑒定轉錄本的結構信息。此外,Nanopore平臺還擁有cDNA測序方式(橄欖果蠅胚胎發育的動態變化解析),多種建庫方式,可滿足不同的研究需求。

?為了感謝廣大科研工作者的長期支持與信任,百邁客開啟550萬科研經費大回饋活動!

提交申請??意向獲取?科研贊助?項目開展

掃描二維碼申請科研贊助,最高可達項目金額的50%

申請時間:2019年5月5日-6月5日

(6月30日前需完成簽單,經費有效)

 

 

 

 

 

 

最近文章
女皇之心试玩