#!/usr/bin/perl -w
usewarnings;
usestrict;
my$usage = qq;
die"
$usage\n"if
scalar
@argv != 2
;my ($fastq, $trim_length) = @argv
;open(fastq, $fastq) or die
"can't open $fastq\n";
while (my
$readid = ) ;
}close fastq;
fastq 檔案每4行代表一條序列, 利用乙個迴圈,每次讀取4行,然後處理;
當讀到檔案結尾時,$readid 為空,迴圈終止,
基本思路是看defuse (檢測融合基因的工具)的源**看到的, 裡面有乙個trim_fastq.pl 指令碼,自己稍微修改了下;
以前都是用python的, 新的公司都是用perl的, 還好都是指令碼語言, 理解起來也比較輕鬆。
fastq質量值 fastq格式檔案處理大全(三)
從計算機的角度來說,生物的序列屬於一種字串,也是一種文字,因此生物資訊分析屬於文字處理範疇。文字儲存為固定格式檔案,生物資訊的工作就是各種文字檔案之間格式的轉換,例如通過序列拼接將fastq轉換為fasta,通過短序列比對將fastq與fasta合併為bam,通過變異檢測將bam中突變位點提取出來轉...
python 隨機抽取Fastq檔案
參考 最近要做乙個二代測序的模擬,所以網上找了個小指令碼,做了些注釋,希望能夠幫助大家。from future import division import random number to sample 3000000 number of replicates 10 計算行數 with open ...
如何用Perl擷取報文
在實際生產環境中,常常需要從後台日誌中擷取報文,報文的形式類似於 乙個後台日誌有多個報文,每個報文可由操作流水唯一確定。以前用awk寫過乙個,程式如下 beginline awk begin logname endline awk nr beginline logname awk nr beginl...