**:
gff和gtf是兩種最常用的資料庫注釋格式,基因注釋檔案。
gff全稱為general feature format,這種格式主要是用來注釋基因組。
gtf全稱為gene transfer format,主要是用來對基因進行注釋,對染色體上的基因進行標註。
//我這裡關注的主要是gtf檔案。
以tab鍵分割為9列:
按照這個方法讀取時遇到了問題:
嘗試用read.csv開啟也失敗:
這個鏈結中提出來的問題和我的類似,也是需要讀取到gtf檔案,它的r版本是4.0.3,我的也是4.0版本的r,所以是否有可能是r版本的問題導致對應包中的函式不可用了?
這個鏈結中提到可以使用refgenome,但是
發現已經被移除。
使用
install.packages("安裝,均不可。refgenome")
biocmanager::install(
"refgenome
")
並且嘗試匯入
library(rtracklayer)報出以下錯誤:
搜尋相似問題,其中乙個回覆:
之後就嘗試在命令列而不是rstudio上操作,先解除安裝了這個包,然後安裝,雖然出現了這個問題:
installation path not writeable, unable to update packages: codetools,但是嘗試不更新n所有包,之後library居然可以了,而且可以正常讀取。
之後我重啟rstudio
.rs.restartr()就可以讀取gtf檔案了。
看來以後安裝包的操作都應該在命令列進行,而不是rstudio。
基序按照這個來讀取
最新版的相較於之前有了很多新的描述資訊,比如基因id,基因名稱等等。共有26個特徵。
附加的鍵值對資訊:
**:
Python學習 讀取檔案
1 open 函式用於開啟乙個檔案 with open pi digits.txt as file object contents file object.read print contents 2 還可以按行來讀取檔案裡的內容 file name pi digits.txt with open f...
JAVA學習記錄 檔案讀取
1 按位元組讀取檔案內容,可以一次讀取乙個位元組的內容,也可以一次讀取多個位元組的內容,需要定義乙個陣列用來儲存。1 一次讀取乙個位元組並列印到螢幕,每行列印10位元組,轉換為16進製制 public static void readfilebybyte throws exception 2 一次讀...
Python學習 檔案讀取
coding utf 8 created on sat jul 27 16 00 57 2019 author cc 檔案操作 開啟當前目錄下檔案 with會在不需要訪問檔案後將其關閉,避免使用close 關閉 rstrip 函式用於刪除多餘的換行符 with open digits.txt as ...