bed
檔案格式
bed檔案格式提供了一種靈活的方式來定義的資料行,以用來描述注釋資訊。bed行有3個必須的列和9個額外可選的列。每行的資料格式要求一致。
必須包含的3列:
1. chrom -
染色體名字(e.g. chr3,chry, chr2_random)或scafflold
的名字(e.g.
scaffold0671 ).
2. chromstart
- 染色體或scaffold的起始位置,染色體第乙個鹼基的位置是0
3. chromen
d -
染色體或scaffold的結束位置,染色體的末端位置沒有包含到顯示資訊裡面。例如,首先得100個鹼基的染色體定義為chromstart =0 .chromend=100,
鹼基的數目是0-99
9
個額外的可選列:
4. name
- 指定bed行的名字,這個名字標籤會展示在基因組瀏覽器中的bed行的左側。
5. score - 0
到1000的分值,如果在注釋資料的設定中將原始基線設定為1,那麼這個分值會決定現示灰度水平(數字越大,灰度越高),下面的這個**顯示genomebrowser
shade
score in range
≤ 166
167-277
278-388
389-499
500-611
612-722
723-833
834-944
≥ 945
6. strand
- 定義鏈的方向,''+」
或者」-」
7. thickstart
- 起始位置(the starting position atwhich the feature is drawn thickly)
(例如,基因起始編碼位置)
8. thickend
- 終止位置(the ending position at whichthe feature is drawn thickly)(例如:基因終止編碼位置)
9. itemrgb - 是乙個rgb
值的形式, r, g, b (eg. 255, 0,0),
如果itemrgb設定為'on」,
這個rbg值將決定資料的顯示的顏色。
10.
blockcount - bed
行中的block數目,也就是外顯子數目
11.
blocksize
- 用逗號分割的外顯子的大小,
這個item的數目對應於blockcount的數目
12. blockstarts -
用逗號分割的列表,
所有外顯子的起始位置,數目也與blockcount數目對應.
參考:http://
BED 檔案格式
原文 bed檔案格式 bed檔案格式提供了一種靈活的方式來定義的資料行,以用來描述注釋資訊,用於展示序列注釋資訊。bed行有 3個必須的列 和9個額外可選的列 以tab隔開。每行的資料格式要求一致。必須包含的3列 1.chrom 染色體名字 e.g.chr3,chry,chr2 random 或sc...
Oracle 控制檔案格式ctl檔案格式
options skip 1,errors 10 load data characterset zhs16gbk infile into table table name truncate fields terminated by optionally enclosed by trailing nu...
檔案格式 gff格式
gff檔案格式 gff格式是 sanger 研究所定義,是一種簡單的 方便的對於 dna rna以及蛋白質序列的特徵進行描述的一種資料格式,已經成為序列注釋的通用格式,比如基因組的基因 許多軟體都支援輸入或者輸出gff格式。前格式定義的最新版本是版本3。原始定義見 song websitegff是存...