mint, 全稱molecular interaction database, 是乙個蛋白質相互作用的資料庫,該資料庫中的蛋白相互作用都是由專家審核過的有實驗證據支援的,目前該資料庫涵蓋了607個物種,共117001個蛋白相互作用關係。**如下
對於蛋白a和蛋白b, 如果二者存在相互作用,就說存在乙個
interaction
, 而蛋白a和b稱之為interactors
, 在mitab
格式的檔案中,除了記錄interaction 之外,還記錄了interactors
的諸多屬性。該檔案列數很多,下面對前15列資訊進行說明
1. column1
第一列記錄的資訊為unique identifier for interactor a, 代表蛋白a的唯一識別符號,在mint資料庫中,採用的是uniprot資料庫中的蛋白編號,比如uniprotkb:q4zga4
2. column2
第二列記錄的資訊為unique identifier for interactor b, 和第一列的內容類似,用來記錄蛋白b的唯一識別符號
3. column3
第三列記錄的資訊為alternative identifier for interactor a, 代表蛋白a的其他識別符號,比如在intact資料庫中的蛋白編號intact:ebi-9675545
, 在mint資料庫中的蛋白編號intact:mint-1525738
, 或者是在uniprot資料庫中的別名,比如uniprotkb:a0sdz7
, 多個識別符號用|
連線
4. column4
第四列記錄的資訊為alternative identifier for interactor b,和第三列類似,用來記錄蛋白b的其他識別符號
5. column5
第五列記錄的資訊為aliases for a, 代表其他資料庫中的名字,格式為databasename:name(alias type), 比如對應的基因名稱uniprotkb:hbz(gene name)
, 多個別名用|
連線
6. column6
第六列記錄的資訊為aliases for b, 和第五列類似,用來記錄蛋白b的別名
7. column7
第七列記錄的資訊為interaction detection methods,代表蛋白相互作用檢測的方法,格式為databasename:identifier(methodname),比如psi-mi:「mi:0096」(pull down)
8. column8
第八列記錄的資訊為first author,代表記錄該蛋白相互作用的文獻的第一作者
9. column9
第九列記錄的資訊為identifier of the publication,代表對應文獻的識別符號,比如pubmed:22458338
10. column10
第十列記錄的資訊為ncbi taxonomy identifier for interactor a, 代表蛋白a對應物種的tax id,比如human為taxid:9606(human)|taxid:9606(homo sapiens)
11. column11
第十一列記錄的資訊為ncbi taxonomy identifier for interactor b,和第十列類似,用來記錄蛋白b對應的物種
12. column12
第十二列記錄的資訊為interaction types,代表相互作用的型別,格式為databasename:identifier(interactiontype),比如psi-mi:"mi:0915"(physical association)
13. column13
第十三列記錄的資訊為source databases,代表該相互作用**的資料庫,比如psi-mi:"mi:0471"(mint)
14. column14
第十四列記錄的資訊為interaction identifiers,代表相互作用的識別符號,比如在intac資料庫中的識別符號intact:ebi-7355797
, 在mint資料庫中的識別符號mint:mint-68665
, 多個資料庫中的識別符號用|
連線。
15. column15
第十五列記錄的資訊為confidence score,代表相互作用結果的打分值,比如intact-miscore:0.52
, 不同的實驗證據其強度不同,通過打分值來衡量相互作用的可靠程度
蛋白質相互作用的研究是非常重要的,所以關於蛋白質相互作用的資訊如何表示和儲存,專門有團隊研究和制訂了特定的檔案格式,並且規定了各種鑑定方法和相互作用型別對應的專有名詞,詳細資訊見如下鏈結
蛋白質相互作用系列 GN快速演算法
通過前兩篇部落格,我們知道gn演算法的時間複雜度並不理想,當網路中包含上千個頂點時,這個演算法會耗費大量時間。鑑於此,newman 2004 1 描述了乙個快速演算法。經測試,該演算法能很好的分析生成的網路和真實世界的網路,並比原先演算法快了近千倍!快速演算法的時間複雜度為o m n n 當時稀疏網...
蛋白質相互作用位點標籤的獲取方法
目前對蛋白質相互作用位點的 即是判定表面氨基酸中哪些事介面殘基。目前,對介面殘基的定義有兩種 第一種定義,基於氨基酸殘基的可及表面積的變化程度。蛋白質相互作用形成複合物是通過蛋白質與蛋白質之間相互接觸發生相互作用,因此溶劑可及表面積會相應發生變化,我們定義該殘基為介面殘基,是該殘基在形成複合物之後可...
蛋白相互作用資料庫,STRING使用指南
對於基因組資料分析而言的話,我們能用到網路分析的就是蛋白相互作用分析 protein protein ineraction,ppi 分析了。蛋白相互作用分析的資料庫有很多,至於為什麼選擇string,還是在於其強大的視覺化,以及自定義功能。這樣我們可以得到資料結果的同時,還可以得到相對好看的圖。下面...