rose(rank ordering of super-enhancers)是麻省理工學院richard a. young實驗室開發的一種通過bam檔案及gff檔案尋找enhancer及其相關基因的工具,此工具由python編寫。專案主頁:
rose依賴軟體有:python 2.7.3, r 2.15.3, 和 samtools 0.1.18,因此在安裝rose前,首先確保伺服器上安裝了這三個工具。關於這三個工具的安裝,可以檢視這篇博文: rna-seq分析伺服器安裝生信工具過程。
rose安裝方式見以下**:
wget
unzip 1a9bb86b5464.zip
# 解壓後檔案見下圖,可以直接通過python *.py呼叫工具
# 引數解釋
-g refseq參考基因組
-i 輸入gff檔案,一般為使用macs鑑定得到的med1富集區域(gff具體格式下文介紹)
-r 排序後的bam檔案,同時需為bam新增index
-o 輸出檔案目錄
#可選引數
-s stitching_distance,合併兩個region的最大距離,預設值為12.5kb
-t tss_exclusion_zone_size,排除tss區域大小,排除與tss前後某距離內的區域,以排除啟動子偏差(預設值:0;推薦值:2500)。如果設定該值為0,將不會查詢基因。
-c control_bam,control樣本的bam檔案
輸入檔案格式要求:bam檔案格式要求:需要排序和構建index(samtools可以操作),bam檔案的染色體id需要以chr開頭。
gff檔案格式要求:gff檔案必須有以下列
1.染色體位置(chr#)
2.每個增強子區域的特定id
4.區域起始位置
5.區域終止位置
7.正負鏈資訊(+, -, .)
gff格式參考:
rose也有轉換bam為gff的工具,在執行rose_mian.py
時,會呼叫rose_bamtogff.py
。
rose_main.py
執行例項:
python $soft_path/rose_main.py -g hg38 -i $work_path/gtf/kyse510_peaks.bed \
-r $work_path/samtools_sort/sort_treat1.bam -c $work_path/samtools_sort/sort_control1.bam \
-o $work_path/rose/kyse510 -s
12500 -t 2000
2>$log_path/kyse510_enhancer.log
其中,更多基因組可以從獲取儲存到rose的annotation資料夾,但是需要注意修改相應rose_mian.py的相應**。
輸出檔案如下:
1.**output_directory/gff/*.gtf
該檔案為輸入gtf檔案的副本;
2.**output_directory/gff/*stitched*.gtf
該檔案為通過在stitching_distance將input_constituent_gff拼接在一起建立的gff檔案;檔案列數如下:
chrom, name, [blank], start, end, [blank], [blank], strand, [blank], [blank], name
其中name
欄位的命名方式為:拼接起來的區域數+最左端區域id。
5.**output_directory/stitched_enhancer_region_map.txt
bamtogff計算後得到的拼接增強子密度檔案,包含以下列:
(拼接增強子id,染色體,拼接增強子起始位置,拼接增強子末端位置,拼接數,bam訊號等級,bam訊號)
6..**output_directory/*_allenhancers.table.txt
增強子列表,包含每個增強子的排名和是否為超級增強子,包含以下列:
(增強子id,染色體,拼接增強子起始位點,拼接增強子末端,拼接數,拼接成分大小,bam的訊號,bam的等級,是否為超增強子:是(1)否(0))
7.**output_directory/* _superenhancers.table.txt
超級增強子的排名,為*_allenhancers.table.txt
檔案的子集。包含以下列:
(拼接增強劑id,染色體,拼接增強子起始位點,拼接增強子末端,拼接數,縫合在一起的成分的大小,ranking_bam的訊號,ranking_bam的等級,超增強子的二進位制(1)與典型(0))
8.**output_directory/*_enhancers_withsuper.bed
可以載入到ucsc瀏覽器中視覺化的增強子bed檔案
9.**output_directory/*_plot_points.png
所有增強子散點圖,如下圖:
# 引數解釋
-i input 輸入rose_mian.py生成的enhancer table檔案
-g genome 輸入genome資訊(mm9,mm8,hg18,hg19等)
-o out 輸出路徑
# 可選引數
-l genelist 要過濾的基因列表
-w window 搜尋基因距離,預設值為50,000bp
-f format 如果使用此引數,將保持原輸入檔案格式輸出
-g hg38 -o $work_path/rose/te7 2>$log_path/te7_enhancer_anno.log
輸出檔案如下:
1.**output_directory/*enhancer_to_gene.txt
enhancer重疊基因、附近基因以及最近的基因列表
2.**output_directory/*gene_to_enhancer.txt
以每個基因為列名的和其相關的增強子位置資訊列表
得到這兩個**即可對基因進行篩選然後進行go及kegg分析等。
下圖是執行兩工具的結果截圖:
超級右鍵 滑鼠增強神器iRightMouse
如果你是多年的windows使用者轉到macos平台,你必定會發現windows上很多非常方便的滑鼠右鍵選單在macos上都是沒有的,例如新建txt文件 一鍵隱藏檔案等。而這些快捷功能的缺失也確實會帶來一些不便,最近發現一款非常實用的右鍵增強工具,可以解決你的煩惱。首次開啟超級右鍵,需要在 設定 拓...
對rose框架的簡單使用
剛到一家新公司,要求使用rose框架,就了解學習了一下。首先,rose是一款人人網開源的遵循約定優於配置的原則的j2ee框架。在使用時,它的控制器必須以controller結尾,放在 controolers的包下,dao則是以dao接的介面。如圖 以denocontroller為例 path dem...
超級右鍵 Mac電腦的滑鼠增強工具
超級右鍵 滑鼠增強神器irightmouse 詳細介紹了超級右鍵的新建檔案 終端裡進入路徑功能 超級右鍵 mac右鍵擴充套件工具 介紹了下面看看超級右鍵的個性化檔案圖示 翻譯等功能 功能1 複製 發動檔案到指定路徑 參考windows 傳送到 右鍵選單,超級右鍵提供了自定義傳送檔案到特定路徑的功能。...