蛋白質組學實驗設計 質控與分析

2022-06-17 10:00:37 字數 2306 閱讀 9123

(1) 常用流程

流程說明

1.材料收集

細胞、細胞上清、組織、血漿、血清、腦脊液、外泌體、尿液......

2.定量技術

蛋白組:itraq/tmt、labelfree、silac、修飾;代謝組:靶向、非靶

3.資料驗證

蛋白組:prm、wb、elisa;代謝組:mrm

4.深入研究

臨床標誌物、生理病理機制、藥效機制、中醫理論、藥物靶點......

(2) 樣品

樣品型別

pool(混樣)

individual(單樣)

降低個體差異

不要求大樣本

要求大樣本

資料分析

低維,難以整合其他資訊

多維多角度

可追溯性

不能重新定義組別

可根據所需重新定義組別

樣本量少多成本

低高(3) itraq/tmt專案設計

體外等重同位素標記定量技術,可同時比較多個樣本之間的蛋白表達量差異(通常10個樣本以下)。

基本原則

(4) labelfree專案設計(5)dia專案設計

dia是資料非依賴性採集定量技術,它將質譜整個全掃瞄範圍分為若干個視窗,高速迴圈地對每個視窗中的所有離子進行選擇、碎裂及檢測,從而無遺漏、無差異地獲取樣本中所有離子的全部碎片資訊。dia無需指定目標肽段,掃瞄點數均勻,利用譜相簿即可實現定性確證和定量離子篩選,並可實現資料回溯。

基本原則

(6)各定量技術比較

從資料採集模式來說,itraq/tmt和labelfree都是傳統的dda掃瞄,即在每個掃瞄週期內,只採集豐度最高的10-20個母離子訊號的子離子碎片,其他訊號的子離子資訊丟失,因此覆蓋率低、隨機性高、重複性相對低;dia掃瞄則在每個掃瞄週期內,將質量區間設定為多個區段window,每次採集window內所有母離子資訊及其碎片(掃瞄速度足夠快),因此具有高覆蓋度、高重複性的特點。

定量技術

itraq/tmt

labelfree

labelfree分級

dia樣本數

少少/多少多

樣品一般pool

pool/individual

一般pool

一般individual

樣品平行性

平行平行/不平行

平行/不平行

平行/不平行

資料量深度高低

高高prm驗證對接性低低

低高建庫否

否否是成本

較高低較高高

拓展性否否否

是(可根據library重新分析)

採集模式

ddadda

ddadia

(7)搜庫軟體

流程回顧:

蛋白質酶切為肽段,經過色譜分離進入質譜儀,得到質譜實際譜圖,利用搜庫軟體與理論譜圖進行匹配打分,對肽段和蛋白進行鑑定、定量和下游資料分析。

(1)色譜質控

進行蛋白質組學的研究,可從以下角度來分析:

設計實驗設計

重複設計

統計學方法

兩組間比較

實驗 vs 對照

>=3

t-test

❤️significance a/b

多組比較

梯度1 vs 梯度2 vs 梯度3...

>=3

one-way anova

case*2 vs control*2

>=3

two-way anova

(2)功能層面

通路分析

kegg pathway共7大類。介紹略

多通路整合——>發現分子調控機制。

蛋白互作網路

在生物體中,蛋白質並非孤立存在的,其功能的行使必須借助於其他蛋白質的調節和介導。這種調節或介導作用的實現首先要求蛋白質之間有結合作用或相互作用。

蛋白質互作網路對於揭示蛋白功能具有重要意義。例如,高度聚集的蛋白質可能具有相同或相似的功能;連線度高的蛋白質可能是影響整個系統代謝或訊號轉導途徑的關鍵點。

分析工具:intact、mint、string、cytoscape......

術語:edge、node、cluster、degree、module.......

代謝組學實驗 質控與分析

目錄2.資料分析挖掘 1 專案流程 代謝組學分析的特點 專案流程 樣本製備 質譜儀分析 資料預處理 定量及統計分析 定性分析 生信及後續分析 2 非靶代謝質控 質譜儀訊號波動使非靶代謝訊號隨時間漂移。原因 訊號隨時間漂移或中途裝置維護會嚴重影響多元統計分析效果,如pca中樣品分布不均勻,存在異常值。...

巨集蛋白質組 搜庫工具簡介與評估

巨集蛋白質組資料分析相對較難,不同於常規蛋白質組分析,因為資料庫太大,無法直接進行搜庫匹配,需要對資料庫進行優化。整理了幾個發表的巨集蛋白搜庫分析工具。具體效果如何,還需要測試。發表 proteostorm an ultrafast metaproteomics database search fr...

蛋白質組學資料的歸一化 標準化處理

目錄 資料縮放scaling 標準化 歸一化 的那些事 表達矩陣的歸一化和標準化,去除極端值,異常值 基因晶元資料分析 一 晶元資料預處理 乙個表達矩陣,通常行為蛋白,列為不同樣本,我們可以標準化行,也可標準化列,具體問題具體分析,關鍵在於要解釋什麼問題。比如我們要盡可能減弱系統偏差對樣本蛋白定量值...