bioperl讀入寫出fasta
要求根據序列id,從fasta檔案中提取目標序列並輸出
資料序列id
fasta檔案
思路以序列id為鍵,構建雜湊
用bioperl讀入fasta,獲得序列id
如果id存在於雜湊中,輸出序列
**
die "perl $0 " unless(@ar**==3);
#$0程式名
use bio::seqio;
use bio::seq;
$in = bio::seqio->new(-file=>"$ar**[1]", -format =>'fasta');
$out = bio::seqio->new(-file=>"$ar**[2]", -format=>'fasta');
my %keep=();
open (in, "$ar**[0]") or die "$!";
while()=1;
}close in;
while(my$seqobj = $in->next_seq()))
}$in->close();
$out->close();
SeqKit根據ID提取序列
我們需要使用seqkit的grep功能來實現。首先官方的語句是這樣的 zcat hairpin.fa.gz seqkit grep f list new.fa 這是針對linux系統環境下。如果實在windows環境下,則要使用語句 type non snare.fasta seqkit grep ...
統計fasta序列條數
通過搜尋 的數量 grep c myfasta.fasta 1397492 seqkit統計提取,速度也是很快的 seqkit stats t.fa t grep v file cut f 4 1397492 統計 1 100bp 範圍長的序列數 cat t.fa seqkit seq m 1 m ...
perl程式執行查詢指定id的fasta序列
本程式用於查詢指定序列id的fasta序列,基本思路就是將需要查詢的fasta檔案序列id存入乙個雜湊,然後遍歷目標fasta檔案,進行查詢。usr bin perl use strict use warnings my target ids my id my num open in1,ar 0 d...