example1:extract the regions 30 to 45
extractseq sequence -regions "30-45"
example2: extract the regions 1787-1912, 782-856;
extractseq sequence -reg "1787..1912,782..856"
example3: extract the regions 782-856, 1787-1912 all to separate output sequences:
extractseq tembl:x65921 -reg "782..856,951..1095,1557..1612,1787..1912" stdout
-separate
其他高階檢索:
-snucleotideq :如果序列是核苷酸
-sprotein1 :如果序列是蛋白質
-slwer1 :make lower case
-sid1
-squery1
-osformat1 《輸出序列格式》
-ossingle2 :seperate file
for each entry
-ufo1
-datafile 《矩陣》:選擇blosum做蛋白比對,或者ednafull做核酸序列比對(事實上可自動識別,不需再手動設定)
-sbegin1 《數字》:作為序列起始
-send1 : 作為序列最後
-sprotein: 序列是否是蛋白,不是則可繼續讀取
-snucleotide: 序列是否是核苷酸,同上
-sreverse:預設「-」前為mrna,將其反轉成dna後再比對(「-sreverse1」,即使在最後也將翻轉1)
-option:選單模式
example:找到十個最佳alignment;
matcher
-alt 10;
額外的引數:
-alternatives (-alt): 給出區域性高分匹配序列,預設1只給出得分最高的序列;但是在cdna多域蛋白與基因組dna比較中,需要修改可能會得到其他有趣且重要的片段(若序列過短則會給出全域性比對);(得分越高說明序列的相似度越高)
-gapextend(-gape): 【所有序列預設都是4】一般認為取幾個長的空位比去很多短空位要合理,所以gape的值一般較小(除去某些特殊情況,比如單端測序使得序列有誤時傾向於選擇多個短空位,可以通過調低gapo實現(罰分針對的是第一條的空位插入情況));
example:
supermatcher @eclac.list tembl:j016136 -word 50
可選引數:
-minscore : 輸出的匹配最小得分
-width : alignment的寬度
-wordlen : 讀取步長
esim4
:seq1 = , 577 bp
seq2 =
((no header))
, 846 bp
1-132 (4-135) 100% ->
133-337 (253-457) 100% ->
338-577 (607-846) 100%
esim4
可選引數:
-word : blast的word size引數設定
-extend : 設定 在3~10之間
-format : 0:only exon endpoints;
5:cds(只顯示基因組上與mrna相同的開始 和結束位置)
; 1:顯示序列對應情況
-cutoff : integer 3~10
example1:給出seq1的反義互補序列的sev檔案
revseq seq1 seq1.sev
example2: 只輸出seq1的互補序列sev檔案
revseq seq1 seq1.sev -norev
example3: 輸出seq1自身的反義序列
reseq seq1 seq1.sev -nocomp
-其他命令:
-notag: 輸出文去除標題
互動式,主要命令都會顯示並解釋
高階引數:
-othersequence : 輸出的突變序列不會和othersequece的序列相同
e.g.給出輸入序列的兩個隨機拷貝:
shuffleseq -shuffle 2
互動式命令
互動式命令:
-window : cg百分數和觀察到的cg頻率以此引數設定的視窗大小來計算,並且視窗在序列上移動,並將數值累加。
-minlen : cpg島的最小長度
-minoe : 設定了一組10個視窗中,(c+g)觀察值與cpg的期望值最小比率的平均值
-minpc : 設定g和c在一組十個視窗中的最小平均百分數(期望值)
-graph 《格式》:ps,hpgl,meta,cps(彩色),x11,tek,none,data,xterm,png,gif,pdf,svg
手動新增:
-(no)plot: 作為開關,可以繪出得分
e.g.報告seq1中cpg富集區域,輸出閾值為28
cpgreport seq1 -score 28 -outflie <
> -outfeat <
>
(-outfeat 是特徵值輸出格式;或者可直接使用互動命令)
相較於cpgplot的特殊之處:
-shift : 改變每次位移長度,當integer=1時,與cpgplot選擇的cpg島的片段是相同的(可見二者得分演算法應該是相同的)
-score : cpg被確認的得分閾值
-find :0,終止密碼子之間的翻譯;1,起始密碼子和終止密碼子之間的翻譯;2,終止子之間的核苷酸序列;3,啟動子和終止子之間的核苷酸序列;4,啟動子旁側序列;5,最初終止子的旁側序列;6,最後終止子的旁側序列;
LINUX部分命令
針對debian lenny設定如下 dpkg reconfigure locales 選擇 en us.utf 8 zh cn.gb2312 zh cn.utf 8 zh cn.gbk zh tw.big5 zh tw.utf 8 預設 default en us.utf 8 中文就選zh cn....
RMAN部分命令
1 切換伺服器歸檔模式,如果已經是歸檔模式可跳過此步 sqlplus nolog 啟動sqlplus sql conn as sysdba 以dba身份連線資料庫 sql shutdown immediate 立即關閉資料庫 sql startup mount 啟動例項並載入資料庫,但不開啟 sql...
Linux 命令(部分)
1 pwd 顯示當前目錄的絕對路徑名 pwd help version 2 clear 清除終端螢幕 clear注意 linux清屏並不會像windows一樣徹底全部清除,而只是新建一行新的置頂,以前輸的命令仍舊還在上方 3 cd 用於開啟路徑,接收絕對路徑和相對路徑 cd dirname dirn...