#!/usr/bin/perl
use strict;
use warnings;
my$seq;my
%hash;my
$id;
my$length
;##讀取控制代碼,input為標準fasta資料格式,即一行id,一行序列
open in,
"$ar**[0]"
ordie$!;
##輸出檔名已經固定
open out,
">read_stats.txt"
ordie$!;
while()
else++;
#序列->次數 存入雜湊}}
##列印輸出表頭
print out "seq\tlength\tseq_num\n"
;##遍歷雜湊,並對序列出現次數排序
foreach
(sort
<=>
$hash
} keys %hash
)\n";}
close in;
統計fasta序列條數
通過搜尋 的數量 grep c myfasta.fasta 1397492 seqkit統計提取,速度也是很快的 seqkit stats t.fa t grep v file cut f 4 1397492 統計 1 100bp 範圍長的序列數 cat t.fa seqkit seq m 1 m ...
根據id提取fasta序列
bioperl讀入寫出fasta 要求根據序列id,從fasta檔案中提取目標序列並輸出 資料序列id fasta檔案 思路以序列id為鍵,構建雜湊 用bioperl讀入fasta,獲得序列id 如果id存在於雜湊中,輸出序列 die perl 0 unless ar 3 0程式名 use bio ...
perl程式執行查詢指定id的fasta序列
本程式用於查詢指定序列id的fasta序列,基本思路就是將需要查詢的fasta檔案序列id存入乙個雜湊,然後遍歷目標fasta檔案,進行查詢。usr bin perl use strict use warnings my target ids my id my num open in1,ar 0 d...