36 EST SSR標記開發

2022-08-09 15:03:27 字數 917 閱讀 1155

misa工具提供批量識別和定位簡單重複序列(ssr),est序列或是基因組序列都可以。另外,還提供乙個與批量設計引物primer3的介面工具,通過這個工具,可以把misa識別出來的ssr,轉為primer3需要的格式,從而方便批量設計引物。

**:下面分別介紹一下幾個工具(.pl是perl檔案的字尾名):

1.cd_hit_est 對est序列進行冗餘查詢,利用cd_hit軟體聚類,快速批量去除冗餘序列

2.est_trimmer.pl

這是對est序列而言的,可以去除est序列中短的序列和兩端不明確的鹼基。

用法(例子):perl est_trimmer.pl ests -amb=2,50 -tr5=t,5,50 -tr3=a,5,50 -cut=100,10000

3.misa.pl

用法:perl misa.pl

(注:<>要去掉。下同)

fastafile是放序列的乙個檔名,全路徑,注意不要有中文名或空格。fasta格式。

另外配套一起的還有乙個檔案misa.ini,這是乙個配置檔案,設定識別ssr標記的標準。

4.primer3 的介面工具

p3_in.pl - 建立 primer3的輸入檔案。

用法:perl p3_in.pl

p3_out.pl - 解析primer3設計引物後的輸出檔案。

用法:p3_out.pl

注:fastafile.misa檔案是misa的輸出檔案

fastafile.p3out是primer3的輸出檔案

多標記KNN演算法實現(Python3 6)

對於乙個新例項,取其最近的k個例項,然後得到由k個例項組成的標籤集合,最後通過先驗概率與最大後驗概率來確定新例項的標籤集合。詳細的內容參看周志華老師與張敏靈老師的 多標記學習 演算法實現 資料預處理 mlknndemo.py load file data sio.loadmat scene.mat ...

MySQL開發36軍規

趕集網mysql開發36軍規 寫在前面的話 總是在災難發生後,才想起容災的重要性 總是在吃過虧後,才記得曾經有人提醒過。一 核心軍規 1 不在資料庫做運算 cpu計算務必移至業務層 2 控制單錶資料量 單錶記錄控制在1000w 3 控制列數量 字段數控制在20以內 4 平衡正規化與冗餘 為提高效率犧...

UWP開發入門(三) x Bind 擴充套件標記

原文 uwp開發入門 三 擴充套件標記 上週打爐石打得太晚 忘記更新了,本週補上。本篇我們講一下擴充套件標記。擴充套件標記也是windows 10 uinversal 新增的內容,按官方的說法是 的備用選項。雖然 缺少 中的一些功能,但它執行時所花費的時間和使用的記憶體量均比 要少,且支援更好的除錯...