轉錄組測序是利用第二代高通量測序技術快速獲取某一物種特定器官或組織在某一狀態下幾乎所有轉錄本的序列信息,進行疾病與正常樣本間的基因表達差異分析、可變剪切和融合基因分析,尋找與癌癥、遺傳病相關的致病基因,已廣泛應用于基礎研究、臨床診斷和藥物研發等領域。相對于傳統芯片而言,無需預先設計特異性探針,具有分辨率高、檢測范圍廣和準確率高的優點。
實驗方案
測序策略:Illumina 平臺 PE150
數據量:6G/樣
技術優勢
(1)任意物種檢測:相對于傳統芯片而言,無需預先設計特異性探針,因此無需了解物種基因或基因組信息,能夠直接對任何物種進行最全面的轉錄組分析;
(2)分辨率高:可以檢測基因家族中相似基因及可變剪接造成的單堿基差異;
(3)檢測范圍廣:從幾個到數十萬個拷貝精確計數,可同時鑒定正常和稀有的轉錄本;
(4)信息分析全面:可以做基因差異表達分析、可變剪切、融合基因分析、新轉錄本預測及注釋。
信息分析
標準信息分析
(1)按標準流程進行數據整理及數據質量評估;
(2)與參考序列比對,計算不同基因的RPKM值;
(3)基因的差異表達分析;
(4)樣本間基因表達水平的相關性分析(僅限于有生物重復的樣本);
(5)樣本間差異基因韋恩圖及PCA分析;
(6)差異基因的表達模式聚類分析;
(7)差異表達基因GO功能富集分析;
(8)差異表達基因Pathway顯著富集分析;
(9)差異表達基因的蛋白質互作網絡分析;
(10)條件特異表達;
(11)鑒定基因的可變剪切;
(12)SNP/InDel分析;
(13)新轉錄本預測及注釋;
(14)融合基因分析(僅限于人);
高級信息分析
(1)基因結構優化(只針對真核生物)
(2)RNA編輯
(3)差異基因的轉錄因子分析(適用于植物)
技術流程
轉錄組測序案例分析
案例(1)科學家繪制細胞周期的高分辨率轉錄組圖譜
細胞周期的推進很大程度上依賴于周期性基因表達。本研究繪制了細胞周期的高分辨率轉錄組圖譜,揭示了周期性基因與癌癥之間的新關聯。研究人員在兩個連續的細胞周期中對人類細胞進行RNA測序,鑒定了一千多個周期性表達的mRNA、非編碼RNA和假基因。研究顯示,這些周期性轉錄本主要集中在與DNA代謝、有絲分裂和DNA損傷應答有關的功能上。他們分析了癌癥基因組圖譜TCGA和其他數據庫的四千多個腫瘤樣本,證實“有絲分裂特征”與遺傳改變、腫瘤類型和患者生存狀況有顯著的關聯。研究人員還定義了67個核心基因,這些基因在多種細胞中均有很強的周期性表達。
圖1 細胞周期核心基因的表達特征
案例(2)人類組織和個體的轉錄組差異
轉錄調控和轉錄后加工影響許多細胞和器官的表型。基因型組織表達(GTEx)項目通過RNA測序得到的數據探索個體和組織間的轉錄組類型的變化差異。本研究從175個個體的43個身體部位采集得到1641份樣本,包括29份器官組織、11份腦亞區、全血和兩份細胞系。轉錄組測序數據表明,平均每個樣本得到8千萬比對到的片段數。尸體的組織樣本表現出帶有特點的并且穩定性強的轉錄組信號。個體之間表現出高度基因表達差異,包括不同性別、種族和年齡的患病人群。原始轉錄是細胞特異性的主要驅動因子,后期剪切行使補充性角色。差異剪切可能在鑒定個體表型中行使更加重要的作用。
圖1 樣本和組織的表達譜相似性分析
案例(3)錫蘭鉤蟲基因組和轉錄組的解析為藥物靶向奠定基礎
該研究針對致病性寄生蟲錫蘭鉤蟲基因組進行了深度測序,該寄生蟲基因組大小約313Mb。測序獲得了其每個生長周期的轉錄組數據并進行深度分析,感染期共有30,738條基因表達。大約有900條基因在感染早期下調。基于這些測序數據,研究者成功挖掘獲得錫蘭鉤蟲生命周期中各節點處許多重要的功能基因信息,這些功能基因信息中存在能夠治療或阻斷錫蘭鉤蟲引起致病性的重要靶向位點信息等。
圖1 不同感染期的錫蘭鉤蟲的基因表達差異情況
參考文獻
[1] Dominguez et al. A high-resolution transcriptome map of cell cycle reveals novel connections between periodic genes and cancer. Cell Research, 2016.
[2] Melé et al. The human transcriptome across tissues and individuals. Science, 2015.
[3] Schwarz et al. The genome and transcriptome of the zoonotic