本文主要參照qiime2中文手冊,並加入自己的一些理解
先來補充一下基礎知識(原諒一下我是學計算機的,很多微生物背景知識需要補充)
1. 說下為什麼要學習qiime2
qiime2是用來做 巨集基因組的16s擴增子分析的。這款軟體發布於2023年7月,發布才乙個月,算是比較新的技術。主要應用在以下幾個方面:通過巨集基因組測序的方法,將腸道微生物與疾病進行關聯分析以揭示疾病與健康個體間的微生物差異;鑑定特定環境中的特定微生物發現耐受菌種及相關基因。可以研究物種的分類,研究與特定環境相關的代謝通路,以及通過不同樣品的比較研究微生物群落內部、微生物與環境、微生物與宿主之間的關係。
2. 巨集基因組名詞解釋
巨集基因組:巨集基因組測序是指對微生物群體進行高通量測序(我的理解是因為很多情況下,微生物群落很難分離,所以只能一堆微生物一起拿來測序分析了),分析特定環境中微生物群體基因組成及功能、微生物群體的多樣性與豐度,進而分析微生物與環境、微生物與宿主之間的關係,發現具有特定功能的基因。巨集基因組測序無需分離純培養微生物,較大擴充套件了微生物資源的利用,為環境微生物群落的研究提供了有效工具。巨集基因組深度測序可以揭示或估計環境中真實的物種多樣性和遺傳多樣性,挖掘具有應用價值的基因資源,應用於開發新的微生物活性物質。巨集基因組研究分兩個方向:擴增子測序和全基因組測序。
擴增子:擴增子(amplicon)為dna或rna擴增後的一段核苷酸序列。比如通過pcr擴增得到的某個基因的擴增片段。更簡單的說,經過人工擴增的dn**段或rn**段、擴增產物。
擴增子測序,涉及特定序列位點的pcr擴增,通常是16s/18s rdna。巨集基因組的物種分類,一般用out(operational taxonomic unit),即可操作單元來表示。通常原生生物使用16s rdna來衡量,真核生物的out使用18s rdna來衡量。我的理解是,選取一段特別的dn**段來測序,這段dna還可以區分不同的菌落
為什麼用16s,而不是其他15s或者17s呢
16srrna為核醣體的rna的乙個亞基,16srdna就是編碼該亞基的基因。細菌rrna(核醣體rna)按沉降係數分為3種,分別為5s、16s和23s rrna。16s rdna是細菌染色體上編碼 rrna相對應的dna序列,存在於所有細菌染色體基因中。
16srdna是細菌的系統分類研究中最有用的和最常用的分子鐘,其種類少,含量大(約佔細菌rna含量的80%),分子大小適中,存在於所有的生物中,其進化具有良好的時鐘性質,在結構與功能上具有高度的保守性,素有「細菌化石」之稱。在大多數原核生物中rdna都具有多個拷貝,5s、16s、23s rdna的拷貝數相同。16s rdna由於大小適中,約1.5kb左右,既能體現不同菌屬之間的差異,又能利用測序技術較容易地得到其序列,故被細菌學家和分類學家接受。
沉降係數:沉降係數(sedimentation coefficient)用離心法時,大分子沉降速度的量度,等於每單位離心場的速度。或s=v/(ω^2*r)。s是沉降係數,ω是離心轉子的角速度(弧度/秒),r是到旋轉中心的距離,v是沉降速度。沉降係數以每單位重力的沉降時間表示,並且通常為1~200×10的-13次方秒範圍,10的-13次方這個因子叫做沉降單位s,即1s=10^-13秒,沉降係數對於生物大分子來說,多數在(1~500)×10^-13秒之間,如血紅蛋白的沉降係數約為4×10的-13次方秒或4s。
安裝過程略過,詳細過程可以見
Docker方式安裝QIIME 2
docker pull qiime2 core 2017.7 測試是否安裝成功 docker run t i v pwd mnt hgfs 2017 qiime2 core 2017.7 qiime 啟動docker命令列,掛載目錄至 mnt hgfs 2017目錄,退出自動移除 docker ru...
qiime2 2019 1更新學習筆記
qiime2 2019.1發布啦,繼續緊跟步伐,看看更新了哪些內容,一併備忘。這個發布生版本主要針對更新依賴環境,公升級到了python 3.6,乙個新的 r vegan adonis visualizer,修復了一些小bugs,虛擬機器映象和新的預訓練分類器立馬可得。後面qiime2的發布節奏會是...
ggplot2學習筆記(一)
該部分筆記整理於這裡 對比如下量 與繪圖結果 其區別在於前者在指定geom smooth中的aes加入了語句color cut。即在未指定分組要素時,預設按整體資料做平滑。question 想要改變圖表標題及x y軸標題如下 ggplot diamonds,aes x carat,y price,c...