轉錄組測序
轉錄組測序分析可以分為referring sequencing有參轉錄組分析和de novo無參轉錄組分析。有參無參的意思是,有/無參考基因組。
1.獲得測序資料,fastq格式,稱之為raw data。
fastq檔案說明;每四行為乙個單元。
第一行:序列名稱
第二行:序列的鹼基
第三行:序列名稱,可以使用+代替
第四行:鹼基的質量。
質量值是用下列的ascii碼表示的,目前使用的,都是illumina1.8+對應的換算方式。
也就是l表示的那行:!是最低的質量,為0,而j是最高的質量,為41。以@為例,計算:查表可以知道 @ 對應的數值為64,但對於測序質量值來說,多了33(因為測序質量是從!開始用的),所以@ 對應的測序質量值應該為64-33=31。
2.質量檢測(可以用fastqc、trimmomatic等)質控後的資料稱為clean data
hisat2,tophat2,star等軟體
4.統計每個基因或者轉錄本的表達量(軟體:htseq,rsem等)
5.進行差異表達分析(edger, deseq2, ebseq等)在正常條件和某種試劑處理的時候,出現了某些我們關心的特性,但是我們可能不知道這些特性的發生是什麼機制。那我們可以通過尋找這些有變化的基因,分析它們大致是參與了什麼過程的基因起了變化,就可以為進一步深入研究提供線索。
轉錄組測序
資料分析與解讀 1.data cleaning 從原始資料 raw data 到乾淨資料 clean data 的過程,有人翻譯成 資料清洗 實在叫不習慣 illumina測序儀下機的資料通常為bcl格式,是將同乙個測序通道 lane 所有樣品的資料混雜在一起的,所以公司一般不會提供bcl檔案。測序...
轉錄組測序流程
轉錄組測序 轉錄組測序分析可以分為referring sequencing有參轉錄組分析和de novo無參轉錄組分析。有參無參的意思是,有 無參考基因組。1.獲得測序資料,fastq格式,稱之為raw data。fastq檔案說明 每四行為乙個單元。第一行 序列名稱 第二行 序列的鹼基 第三行 序...
使用RSEM進行轉錄組測序的差異表達分析
仍然是兩年前的筆記 1.prepare reference 如果用rsem對比對後的bam進行轉錄本定量,則在比對過程中要確保比對用到的索引是由rsem prepare reference產生的。software rsem rsem prepare reference transcript to g...