基於Pubmed資料庫的蛋白質修飾後的資訊挖掘

摘要

如今pubmed文獻檢索系統上發表的醫學文獻的數量十分龐大，且數量逐年增加，研究人員如果想人工地去檢視找出pubmed文獻裡面的知識是絕對不可能，因此，人們轉而利用計算機去獲取文獻裡面的知識。

本篇**介紹了如何借用文字挖掘技術去挖掘出pubmed文獻裡面的知識，並且結合了目前文字挖掘技術，講述了如何實現了一套蛋白質磷酸化修飾的文字資訊挖掘系統。

本系統主要應用於挖掘出pubmed文獻裡面蛋白質磷酸化的修飾的一些資訊，包括被修飾的蛋白質，激酶，修飾位點，以及它們之間的關係。

本文詳細敘述了整套系統瀑布流模型的軟體過程，首先是需求，然後是設計，再是實現，依次展開。在實現的階段裡面又包含了文字預處理階段，命名實體識別階段，實體關係提取階段，資料視覺化階段，其中著重介紹了文字挖掘技術中兩個的關鍵也是核心階段的原理：命名實體識別和關係提取。同時也介紹了abner工具和rlims-p工具的原理和應用。此外文獻資料庫的數量龐大，為了提高程式效能和使用者體驗，於是介紹了幾種提高效率，提高使用者體驗的解決方案，其中有多執行緒處理，快取機制，預處理機制。

基於Pubmed資料庫的蛋白質修飾後的資訊挖掘

蛋白質濃度與鹽脅迫的關係蛋白質的分離純化（二）

MINT 蛋白質相互作用資料庫簡介

用EDA處理蛋白質資料小記

基於Pubmed資料庫的蛋白質修飾後的資訊挖掘

蛋白質濃度與鹽脅迫的關係 蛋白質的分離純化（二）

MINT 蛋白質相互作用資料庫簡介

用EDA處理蛋白質資料小記

相關推薦

蛋白質濃度與鹽脅迫的關係蛋白質的分離純化（二）