trinity
1
cat
1m_reads_sample/*.left.fq > reads.all.left.fq
2
cat
1m_reads_sample/*.right.fq > reads.all.right.fq
1
$trinity_home/trinity.pl --seqtype fq --jm 10g --left reads.all.left.fq --right reads.all.right.fq --ss_lib_type rf --cpu 6 --seqtype fq —-output ./trinity_out_dir
輸出檔案:trinity
.fasta
1
$trinity_home/util/trinitystats.pl trinity_out_dir/trinity.fasta>./assembly_report.txt
輸出檔案:assembly_report.txt
1
$trinity_home/util/align_and_estimate_abundance.pl --transcripts trinity.fasta --seqtype fq --left reads_1.fq --right reads_2.fq --est_method rsem --aln_method bowtie --trinity_mode —prep_reference
比對輸出:bowtie.csorted.bam
rsem輸出:
rsem.isoforms.results : em read counts per trinity
transcript
rsem.genes.results : em read counts on a per-trinity
-component (aka... gene) basis, gene used loosely here.
過濾比對:
1
$trinity_home/util/filter_fasta_by_rsem_values.pl
--rsem_output=/path/to/rsem.isoforms.results[,...] --fasta=/path/to/trinity.fasta --output=/path/to/output.fasta
--fpkm_cutoff=1200
過濾值需要根據需求自己設定。
假定有四個樣本,轉錄本定量輸出為:
log.isoforms.results
ds.isoforms.results
hs.isoforms.results
plat.isoforms.results
注意:--samples_file為樣本分組資訊檔案 group.txt ,例如:
throat sample2.sam
saliva sample3.sam
throat sample4.sam
vaginal sample5.sam
--contrasts 為樣本不同條件下比較compare.txt:
throat
saliva
vaginal saliva
throat vaginal
1
$trinity_home/trinity-plugins/transdecoder/transdecoder -t transcripts.fasta -m 100 —search_pfam /path/to/pfam_db.hmm to search —cpu 6
輸出檔案:
、sqlite、ncbi blast、hmmer、signalp v4、tmhmm v2、rnammer比對資料庫:swissprot、uniref90、pfam domains
標準化資料:
檢視源**
列印幫助
1
makeblastdb -
in
uniprot_sprot.fasta -dbtype prot
2
makeblastdb -
in
uniref90.fasta -dbtype prot
3
hmmpress pfam-a.hmm
blast比對(比對的資料庫可以換成nr/
uniref90)
# search trinity
transcripts
1
blastx -query trinity.fasta -db uniprot_sprot.fasta -num_threads 8 -max_target_seqs 1 -outfmt 6 -evalue 1e-5 > blastx.outfmt6
# search transdecoder-predicted proteins
1
blastp -query transdecoder.pep -db uniprot_sprot.fasta -num_threads 8 -max_target_seqs 1 -outfmt 6 -evalue 1e-5 > blastp.outfmt6
功能域
1
hmmscan --cpu 8 --domtblout trinotatepfam.out pfam-a.hmm transdecoder.pep > pfam.log
訊號肽1
signalp -f short -n signalp.out transdecoder.pep
跨膜結構
1
tmhmm --short < transdecoder.pep > tmhmm.out
識別rrna
1
$trinotate_home/util/rnammer_support/rnammertranscriptome.pl --transcriptome trinity.fasta --path_to_rnammer /usr/bin/software/rnammer_v1.2/rnammer
輸出:trinity
.fasta.rnammer.gff
檢視源**
列印幫助
1
$trinity_home/util/support_scripts/get_trinity_gene_to_trans_map.pl trinity.fasta >trinity.fasta.gene_trans_map
2
3
trinotate trinotate.sqlite init --gene_trans_map trinity.fasta.gene_trans_map --transcript_fasta trinity.fasta --transdecoder_pep transdecoder.pep
1
trinotate trinotate.sqlite load_swissprot_blastp blastp.outfmt6
2
trinotate trinotate.sqlite load_swissprot_blastx blastx.outfmt6
3
trinotate trinotate.sqlite load_pfam trinotatepfam.out
4
trinotate trinotate.sqlite load_tmhmm tmhmm.out
5
trinotate trinotate.sqlite load_signalp signalp.out
6
trinotate trinotate.sqlite report >trinotate_annotation_report.xls
輸出檔案:trinotate_annotation_report.xls
AtomicBoolean介紹與使用
介紹 在這個boolean值的變化的時候不允許在之間插入,保持操作的原子性 方法 compareandset boolean expect,boolean update 這個方法主要兩個作用 1.比較atomicboolean和expect的值,如果一致,執行方法內的語句。其實就是乙個if語句 2....
pkg config介紹與使用
linux c c 編譯鏈結摘 要 一般來說,如果庫的標頭檔案不在 usr include 目錄中,那麼在編譯的時候需要用 i 引數指定其路徑。由於同乙個庫在不同系統上可能位於不同的目錄下,使用者安裝庫的時候也可以將庫安裝在不同的目錄下,所以即使使用同乙個庫,由於庫的路徑的不同,造成了用 i 引數指...
MinGW介紹與使用
3.1 mingw 是什麼?mingw 提供了一套簡單方便的windows下的基於gcc 程式開發環境。mingw 收集了一系列免費的windows 使用的標頭檔案和庫檔案 同時整合了gnu 的工具集,特別是gnu 程式開發工具,如經典gcc,g make等。mingw是完全免費的自由軟體,它在wi...