紙上得來終覺淺,絕知此事要躬行。
——陸游《冬夜讀書示子聿》
比對的英文是alignment,其對應的中文翻譯可以是比對,聯配,對齊,排列等,目前並沒有乙個統一的用詞。中文文章中多見比對,聯配。
序列比對就是運用特定的演算法找出兩個或多個序列之間產生最大相似度得分的空格插入和序列排列方案。
全基因組比對,顧名思義,就是在全基因組水平進行的序列比對。
基因組水平上序列比對可以分為同一物種基因組重測序資料的比對和不同物種間基因組的比對,當然也可以把乙個物種的重測序資料比對到另外乙個物種的參考基因組上,算是第一類的延伸。
這兩類由於資料性質不同,採用的比對軟體也不一樣。
一般來說,重測序資料比對多採用bwa和bowtie2;
不同物種間基因組(不同物種的參考基因組)的比對常用共線性比對,如lastz,此外還有last。
#bwa-index構建索引
bwa index genome.fa -p genome
#雙端測序比對(設定執行緒數為8)
bwa mem -t 8 genome seq1.fq seq2.fq > output.sam
#bowtie2-build構建索引(設定執行緒數為8)
bowtie2-build --threads 8 genome.fa genome
#雙端測序比對(設定執行緒數為8)
bowtie2 -p 8 -x genome -1 seq1.fq -2 seq2.fq -s output.sam
last軟體還未進行實踐,相關**實現參考example 9: compare the human and chimp genomes#不同物種參考基因組比對,輸出結果格式為maf
#不同物種參考基因組比對,輸出結果格式為axt
mVISTA 多序列比對葉綠體基因組
mvista可對2個或者多個dna序列進行比較,可以對比對結果進行視覺化。詳情請大力戳這裡 mvista 需要輸入的檔案有如下幾類 必須檔案 可選檔案 106481 116661 gene1 106481 106497 utr 107983 108069 exon 109884 110033 exo...
線粒體和葉綠體的基因組特點 基因和基因組
基因 gene 是能夠編碼蛋白質或者rna等具有特定功能產物的 負載遺傳資訊的基本單位,即有遺傳效應的dn 段 可以理解為 gene protein rna mrna trna rrna 基因組 genome 是指乙個生物體內所有遺傳物質的總和,對於含有線粒體或者葉綠體等結構的生物來說,還包括其中的...
人基因組(一)
人類基因組包含22條染色體和1條x或者y染色體,這些染色體長度為45 279mb,加起來共為3286mb。基於染色體的結構,全部基因可被分為常染色質 euchromatin 區域 通常包含活性基因 和異質染色質 heterochromatin 區域,後者攜帶低密度的活性基因。常染色質組成了基因組的主...