gtf檔案學習 讀取

2022-05-09 03:06:09 字數 1715 閱讀 4194

**:

gff和gtf是兩種最常用的資料庫注釋格式,基因注釋檔案。

gff全稱為general feature format,這種格式主要是用來注釋基因組。

gtf全稱為gene transfer format,主要是用來對基因進行注釋,對染色體上的基因進行標註。

//我這裡關注的主要是gtf檔案。

以tab鍵分割為9列:

按照這個方法讀取時遇到了問題:

嘗試用read.csv開啟也失敗:

這個鏈結中提出來的問題和我的類似,也是需要讀取到gtf檔案,它的r版本是4.0.3,我的也是4.0版本的r,所以是否有可能是r版本的問題導致對應包中的函式不可用了?

這個鏈結中提到可以使用refgenome,但是

發現已經被移除。

使用

install.packages("

refgenome")

biocmanager::install(

"refgenome

")

安裝,均不可。

並且嘗試匯入

library(rtracklayer)
報出以下錯誤:

搜尋相似問題,其中乙個回覆:

之後就嘗試在命令列而不是rstudio上操作,先解除安裝了這個包,然後安裝,雖然出現了這個問題:

installation path not writeable, unable to update packages: codetools,但是嘗試不更新n所有包,之後library居然可以了,而且可以正常讀取。

之後我重啟rstudio

.rs.restartr()
就可以讀取gtf檔案了。

看來以後安裝包的操作都應該在命令列進行,而不是rstudio。

基序按照這個來讀取

最新版的相較於之前有了很多新的描述資訊,比如基因id,基因名稱等等。共有26個特徵。

附加的鍵值對資訊:

**:

Python學習 讀取檔案

1 open 函式用於開啟乙個檔案 with open pi digits.txt as file object contents file object.read print contents 2 還可以按行來讀取檔案裡的內容 file name pi digits.txt with open f...

JAVA學習記錄 檔案讀取

1 按位元組讀取檔案內容,可以一次讀取乙個位元組的內容,也可以一次讀取多個位元組的內容,需要定義乙個陣列用來儲存。1 一次讀取乙個位元組並列印到螢幕,每行列印10位元組,轉換為16進製制 public static void readfilebybyte throws exception 2 一次讀...

Python學習 檔案讀取

coding utf 8 created on sat jul 27 16 00 57 2019 author cc 檔案操作 開啟當前目錄下檔案 with會在不需要訪問檔案後將其關閉,避免使用close 關閉 rstrip 函式用於刪除多餘的換行符 with open digits.txt as ...