原文:
bed檔案格式
bed檔案格式提供了一種靈活的方式來定義的資料行,以用來描述注釋資訊,用於展示序列注釋資訊。
bed行有
3個必須的列
和9個額外可選的列
。 以tab隔開。每行的資料格式要求一致。
必須包含的3列:
1. chrom -
染色體名字(e.g. chr3,chry, chr2_random)或scafflold
的名字(e.g.
scaffold0671 ).
2. chromstart
- 染色體或
scaffold
的起始位置,染色體第乙個鹼基的位置是0
3. chromen
d -
染色體或
scaffold
的結束位置,染色體的末端位置沒有包含到顯示資訊裡面。至少為
1。例如,首先得
100個鹼基的染色體定義為
chromstart =0 .chromend=100,
鹼基的數目是0-99
9 個額外的可選列:
4. name
- 指定
bed行的名字,這個名字標籤會展示在基因組瀏覽器中的bed行的左側。【
官方名字或自定義
】5. score - 0
到1000
的分值,如果在注釋資料的設定中將原始基線設定為
1,那麼這個分值會決定顯示
灰度水平
(數字越大,灰度越高),下面的這個**顯示
genomebrowser
shade
score in range
≤ 166
167-277
278-388
389-499
500-611
612-722
723-833
834-944
≥ 945 .
6. strand
- 定義鏈的方向,''+」
或者」-」
7. thickstart
- 起始位置(the starting position atwhich the feature is drawn thickly)
(例如,基因起始編碼位置)
8. thickend
- 終止位置(the ending position at whichthe feature is drawn thickly)(例如:基因終止編碼位置)
9. itemrgb - 是乙個rgb
值的形式, r, g, b (eg. 255, 0,0),
如果itemrgb設定為'on」,
這個rbg
值將決定
資料的顯示顏色
。10.
blockcount - bed
行中的block
數目,也就是
外顯子數目
11.
blocksize
- 用逗號分割的
外顯子的大小
,這個item的數目對應於blockcount的數目
12. blockstarts -
用逗號分割的列表,
所有外顯子的起始位置
,數目也與blockcount數目對應
.例子:
track name=pairedreads description="clone paired reads" usescore=1
chr22 1000 5000 clonea 960 + 1000 5000 0 2 567,488, 0,3512
chr22 2000 6000 cloneb 900 - 2000 6000 0 2 433,399, 0,3601
bed檔案中起始座標為 0,結束座標至少是 1 。
bed格式可以用在類似gbrowse這樣的基因組資料視覺化工具中。常用軟體有bedtools。
注意:用於在gbrowse上展示相關注釋的bed格式通常第一行有乙個關於track的描述資訊。
參考:http://
BED檔案格式
bed 檔案格式 bed檔案格式提供了一種靈活的方式來定義的資料行,以用來描述注釋資訊。bed行有3個必須的列和9個額外可選的列。每行的資料格式要求一致。必須包含的3列 1.chrom 染色體名字 e.g.chr3,chry,chr2 random 或scafflold 的名字 e.g.scaffo...
Oracle 控制檔案格式ctl檔案格式
options skip 1,errors 10 load data characterset zhs16gbk infile into table table name truncate fields terminated by optionally enclosed by trailing nu...
檔案格式 gff格式
gff檔案格式 gff格式是 sanger 研究所定義,是一種簡單的 方便的對於 dna rna以及蛋白質序列的特徵進行描述的一種資料格式,已經成為序列注釋的通用格式,比如基因組的基因 許多軟體都支援輸入或者輸出gff格式。前格式定義的最新版本是版本3。原始定義見 song websitegff是存...