一、微生物深度分析方法核心思想
複雜微生物群落解構的核心思想:
不預設任何假定,客觀地觀測整個微生物組所發生的一系列結構性變化特徵,最終識別出與疾病或所關注的表型相關的關鍵微生物物種、基因和代謝產物。
二、微生物深度分析方法—關聯分析
進行微生物群體關聯分析,需要結合兩大類傳統的統計分析方法:
1)無監督學習(unsupervised learning)
2)有監督學習(supervised learning)
無監督學習:基於對資料結構的自然分解和觀察。
主要包括以下三類方法:
1)主成分分析(principal component analysis,pca);
2)多維尺度分析(multidimensional scaling, mds);
3)聚類分析(clustering analysis)
傳統的有監督學習方法包括:冗餘分析(redundancyanalysis,rda)
典型相關分析(canonicalanalysis)
偏最小二乘判別分析(partialleast squares discriminant analysis,pls-da)
……等約束排序方法(constrainedordination)。
三、微生物深度分析方法—多維度結合分析
※ 考慮微生物群落成員之間的系統發育關係,可以將這些有監督的學習方法與無監督的多維尺度分析相結合。
即:把通過給定樣品間距離進行線性變換分解得到的新變數用於有監督的學習。
由此衍生出基於距離的冗餘分析(distance-basedredundancy analysis,db-rda)和主座標典型相關分析(canonical analysis of principal coordinates,cap)
▲ 通過約束排序,可以對群落樣品間的相互關係是否遵循已知樣品分布規律做出判斷。
四、隨機森林演算法隨機森林(randomforests)方法找尋關鍵變數。
隨機森林:是一種基於決策樹(decision tree)的高效的機器學習演算法,可以用於對樣品進行分類(classification),也可以用於回歸分析(regression)。
隨機森林屬於非線性分類器,因此可以挖掘變數之間複雜的非線性的相互依賴關係。
五、roc曲線接收者操作特徵曲線(receiveroperating characteristic curve,roc曲線)也是一種有效的有監督學習方法。
roc 分析屬於二元分類演算法,用來處理只有兩種分類的問題,可以用於選擇最佳的判別模型。
六、lefse分析lefse分析:基於線性判別分析(lineardiscriminant analysis,lda)效應量(effectsize)的分析方法。
本質是將線性判別分析與非引數的kruskal-wallis以及wilcoxon秩和檢驗相結合,從而篩選關鍵的生物標記物(也就是關鍵群落成員)。
七、基於微生物成員之間的網路推斷分析
這類分析的根本目的:考察不同群落成員之間的相互作用,通過關聯分析的方法,找尋群落成員在不同生境下共同出現(co-occurrence)或彼此排斥(co-exclusion)的相互作用模式,從而推斷不同微生物類群之間可能的「協作」或「競爭」關係。
八、基於微生物成員之間網路推斷分析的延伸和發展
發展延伸的領域:腸道元基因組學領域的一系列研究又在此概念的基礎上更進一步,發展出了「豐度共變化的基因類群」(co-abundance genegroups,cags)
「元基因組學物種」(metagenomic species,mgs)
……等新名詞,對於闡釋元基因組學的複雜資料提供了全新的思路和辦法。
微生物增殖
假設有兩種微生物 x 和 y x出生後每隔 3分鐘 一次 數目加倍 y出生後每隔 2分鐘 一次 數目加倍 乙個新出生的 x,半分鐘之後吃掉1個 y,並且,從此開始,每隔 1分鐘吃1個 y。現在已知有新出生的 x 10,y 89 求60 分鐘後y 的數目。如果x 10 y 90 呢?本題的要求就是寫出...
微生物增殖
假設有兩種微生物 x 和 y x出生後每隔3分鐘 一次 數目加倍 y出生後每隔2分鐘 一次 數目加倍 乙個新出生的x,半分鐘之後吃掉1個y,並且,從此開始,每隔1分鐘吃1個y。現在已知有新出生的 x 10,y 89,求60分鐘後y的數目。如果x 10,y 90 呢?本題的要求就是寫出這兩種初始條件下...
微生物增殖
假設有兩種微生物 x 和 y x出生後每隔3分鐘 一次 數目加倍 y出生後每隔2分鐘 一次 數目加倍 乙個新出生的x,半分鐘之後吃掉1個y,並且,從此開始,每隔1分鐘吃1個y。現在已知有新出生的 x 10,y 89,求60分鐘後y的數目。如果x 10,y 90 呢?本題的要求就是寫出這兩種初始條件下...