對於蛋白質序列,計分矩陣主要用於記錄在做序列比對時兩個相對應的殘基的相似度,一旦這個矩陣定義好了以後,比對程式就可以利用這個矩陣,盡量將相似的殘基排在一起,以達到最好的比對。
得分矩陣主要有兩種,第一種就是pam(point accepted multation),另一種就是blosum。
1、pam矩陣(point accepted mutation)
基於進化的點突變模型,如果兩種氨基酸替換頻繁,說明自然界接受這種替換,那麼這對氨基酸替換得分就高。乙個pam就是乙個進化的變異單位, 即1%的氨基酸改變,但這並不意味100次pam後,每個氨基酸都發生變化,因為其中一些位置可能會經過多次突變,甚至可能會變回到原來的氨基酸。
pam矩陣的製作步驟:
構建序列相似(大於85%)的比對
計算氨基酸 j 的相對突變率mj(j被其它氨基酸替換的次數)
針對每個氨基酸對 i 和 j , 計算 j 被 i 替換次數
替換次數除以相對突變率(mj)
利用每個氨基酸出現的頻度對j 進行標準化
取常用對數,得到pam-1(i, j)
將pam-1自乘n次,可以得到pam-n。
這種矩陣的缺點是一旦pam1的矩陣有效地誤 差,那麼自乘250後得到的pam250矩陣的誤差就會變得很大。如,pam120矩陣用於比較相距120個pam單位的序列。
乙個pam-n矩陣元素(i,j)的值:
反應兩個相距n個pam單位的序列中第i種氨基酸替換第j種氨基酸的頻率。
針對不同的進化距離採用pam 矩陣
序列相似度 = 40% 50% 60%
| | |
打分矩陣 = pam120 pam80 pam60
pam250 → 14% – 27%
2、blosum 矩陣
此矩陣與pam矩陣的不同之處在於:
(1)用於產生矩陣的蛋白質家族及多肽鏈數目,blosum比pam大約多20倍。
(2)pam:家族內成員相比,然後把所有家族中對某種氨基酸的比較結果加和在一起,產生「取代」資料(pam-1 );pam-1自乘n次,得pam-n。
blosum:首先尋找氨基酸模式,即有意義的一段氨基酸片斷(如乙個結構域及其相鄰的兩小段氨基酸序列)
,分別比較相同的氨基酸模式之間氨基酸的保守性(某種氨基酸對另一種氨基酸的取代資料),然後,以所有 60%保守性的氨基酸模式之間的比較資料為根據,產生blosum60;以所有80%保守性的氨基酸模式之間的比 較資料為根據,產生blosum80。
(3)pam-n中,n 越小,表示氨基酸變異的可能性越小;相似的序列之間比較應該選用n值小的矩陣,不太相似 的序列之間比較應該選用n值大的矩陣。pam-250用於約20%相同序列之間的比較。blosum-n中,n越小,表示氨基酸相似的可能性越小;相似的序列之間比較應該選用 n 值大的矩陣,不太相似的序列之間比較應該選 用n值小的矩陣。blosum-62用來比較62%相似度的序列,blosum-80用來比較80%左右的序列。
**
20種氨基酸縮寫
20種氨基酸縮寫 體內20種氨基酸按理化性質可分為4組 非極性 疏水性氨基酸 甘氨酸 丙氨酸 纈氨酸 亮氨酸 異亮氨酸 苯丙氨酸和脯氨酸。極性 中性氨基酸 色氨酸 絲氨酸 酪氨酸 半胱氨酸 蛋氨酸 天冬醯胺 谷氨醯胺和蘇氨酸。酸性的氨基酸 天冬氨酸和谷氨酸。鹼性氨基酸 賴氨酸 精氨酸和組氨酸。中文名...
20種氨基酸縮寫
體內20種氨基酸按理化性質可分為4組 非極性 疏水性氨基酸 甘氨酸 丙氨酸 纈氨酸 亮氨酸 異亮氨酸 苯丙氨酸和脯氨酸。極性 中性氨基酸 色氨酸 絲氨酸 酪氨酸 半胱氨酸 蛋氨酸 天冬醯胺 谷氨醯胺和蘇氨酸。酸性的氨基酸 天冬氨酸和谷氨酸。鹼性氨基酸 賴氨酸 精氨酸和組氨酸。中文名稱 英文名稱 三字...
20中氨基酸名稱 簡寫及化學式
20種氨基酸的名稱 英文簡寫和化學式,普通生物學老師就讓記住但是普通生物學結課了,生物化學又要記卻還沒記住。發出來以便自己檢視。分類 脂肪族 gly ala val leu ile pro 芳香族 phe tyr trp 含硫 met cys 醇類 ser thr 鹼性 his lys arg 酸性...