1、對許多基因而言,在乙個功能家族中,基因的序列相似性是很弱的,人們不能僅僅依靠序列來可靠判斷這個新測序的基因的功能。
2、表達矩陣的元素ii,j表示基因i在實驗條件j時的表達水平。整個表達矩陣的第i行稱為基因i的表達模式。可在表達矩陣中尋找具有相似表達模式的成對基因,將這些基因標記為2個相似行。如果2個基因的表達模式是相似的,那麼這2個基因有可能具有某種聯絡,這2個基因可能執行相似的功能。
3、聚類演算法是將表示式相似的基因分組到乙個類中,希望這些類對應於功能相關的基因的組合。對表達資料進行聚類,乙個n*m的表達矩陣通常要轉換成乙個n*n距離矩陣d=(di,j),其中di,j反映基因i和j的表達模式具有怎樣的相似性。分組到不同的類中,且滿足下面2個條件:
1)同質性:di,j應很小。
2)差異性:di,j應很大。
GEO資料探勘構建基因表達矩陣
1 geo資料庫介紹 geo全稱gene expression omnibus,由美國國立生物技術資訊中心ncbi建立並維護的基因表達資料庫。建立於2000年,收錄世界各國研究機構提交的高通量基因表達資料。geo上有四類資料gsm,gse,gds,gpl 1.gsm是單個樣本的實驗資料 2.gds是...
差異表達基因變化倍數 差異表達基因
1.什麼是差異表達基因 在不同組織中表達發生明顯變化的基因 是導致細胞狀態發生變化的關鍵基因 是表達譜分析的主要物件 2.尋找差異表達基因的兩種方法 倍數變化閥值 一般設定為2倍 具體方法 找出所有基因的表達變化率 按照表達變化率排序 上調兩倍或者下調兩倍算作差異表達基因 適合條件 實驗重複數極少 ...
基因表達譜
基因表達 指細胞在生命過程中,把儲存在dna順序中遺傳資訊經過轉錄和翻譯,轉變成具有生物活性的蛋白質分子。生物體內的各種功能蛋白質和酶都是同相應的結構基因編碼的。差別基因表達 指細胞分化過程中,奢侈基因按一定順序表達,表達的基因數約佔基因總數的5 10 也就是說,某些特定奢侈基因表達的結果生成一種型...