氨基酸替換矩陣

對於蛋白質序列，計分矩陣主要用於記錄在做序列比對時兩個相對應的殘基的相似度，一旦這個矩陣定義好了以後，比對程式就可以利用這個矩陣，盡量將相似的殘基排在一起，以達到最好的比對。

得分矩陣主要有兩種，第一種就是pam（point accepted multation)，另一種就是blosum。

1、pam矩陣（point accepted mutation）

基於進化的點突變模型，如果兩種氨基酸替換頻繁，說明自然界接受這種替換，那麼這對氨基酸替換得分就高。乙個pam就是乙個進化的變異單位, 即1%的氨基酸改變，但這並不意味100次pam後，每個氨基酸都發生變化，因為其中一些位置可能會經過多次突變，甚至可能會變回到原來的氨基酸。

pam矩陣的製作步驟：

構建序列相似（大於85％）的比對

計算氨基酸 j 的相對突變率mj（j被其它氨基酸替換的次數）

針對每個氨基酸對 i 和 j , 計算 j 被 i 替換次數

替換次數除以相對突變率（mj）

利用每個氨基酸出現的頻度對j 進行標準化

取常用對數，得到pam-1(i, j)

將pam-1自乘n次，可以得到pam-n。

這種矩陣的缺點是一旦pam1的矩陣有效地誤差，那麼自乘250後得到的pam250矩陣的誤差就會變得很大。如，pam120矩陣用於比較相距120個pam單位的序列。

乙個pam-n矩陣元素（i，j）的值：

反應兩個相距n個pam單位的序列中第i種氨基酸替換第j種氨基酸的頻率。

針對不同的進化距離採用pam 矩陣

序列相似度 = 40% 50% 60%

| | |

打分矩陣 = pam120 pam80 pam60

pam250 → 14% – 27%

2、blosum 矩陣

此矩陣與pam矩陣的不同之處在於：

（1）用於產生矩陣的蛋白質家族及多肽鏈數目，blosum比pam大約多20倍。　

（2）pam：家族內成員相比，然後把所有家族中對某種氨基酸的比較結果加和在一起，產生「取代」資料（pam-1 ）；pam-1自乘n次，得pam-n。

blosum：首先尋找氨基酸模式，即有意義的一段氨基酸片斷（如乙個結構域及其相鄰的兩小段氨基酸序列）

，分別比較相同的氨基酸模式之間氨基酸的保守性（某種氨基酸對另一種氨基酸的取代資料），然後，以所有 60％保守性的氨基酸模式之間的比較資料為根據，產生blosum60；以所有80％保守性的氨基酸模式之間的比較資料為根據，產生blosum80。

（3）pam-n中，n 越小，表示氨基酸變異的可能性越小；相似的序列之間比較應該選用n值小的矩陣，不太相似的序列之間比較應該選用n值大的矩陣。pam-250用於約20%相同序列之間的比較。blosum-n中，n越小，表示氨基酸相似的可能性越小；相似的序列之間比較應該選用 n 值大的矩陣，不太相似的序列之間比較應該選用n值小的矩陣。blosum-62用來比較62％相似度的序列，blosum-80用來比較80％左右的序列。

氨基酸替換矩陣

20種氨基酸縮寫

20種氨基酸縮寫

20中氨基酸名稱簡寫及化學式

氨基酸替換矩陣

20種氨基酸縮寫

20種氨基酸縮寫

20中氨基酸名稱 簡寫及化學式

相關推薦

20中氨基酸名稱簡寫及化學式