affymetrix表達譜晶元資料讀取的方法分3種:
1、使用affy包讀取。(hgu95/hgu133晶元)
2、使用oligo包讀取。(whole transcriptome 晶元/ nimblegen 晶元/ snp晶元等)
3、使用******affy包讀取。(hgu95/hgu133晶元)
1 justrma
有just.rma
和justrma
兩種函式可供使用。justrma
整合了讀取資料和rma演算法處理兩個步驟,可以直接讀取資料生成expressionset
,不產生affybatch
。**如下:
just.rma(filenames)
justrma(filenames, widget = f)
just.rma
必須給出要讀取的cel檔案的檔名(可以為list
),justrma
在不輸入任何引數的時候表示讀取工作目錄下所有的cel檔案。若輸入justrma(widget=t)
,則表示手動選擇要讀取的cel檔案。推薦輸入包含路徑的檔名(list.celfiles(full.name = t)
的返回值)。
2 read.affybatch
有read.affybatch
和readaffy
兩種函式可供選擇,均讀取cel檔案轉換成affybatch物件,cel檔案無論是否壓縮均可讀取。**如下:
read.affybatch(filenames)
readaffy(filenames, widget=f,celfile.path)
read.affybatch
必須給出要讀取的cel檔案的檔名(可以為list
)且不能更改讀取路徑,讀取路徑固定為工作路徑。readaffy
在不輸入任何引數的時候表示讀取工作路徑下所有的cel檔案。若輸入readaffy(widget=t)
,則表示手動選擇要讀取的cel檔案。
read.celfiles
read.celfiles(filename)
讀取cel檔案的時候推薦輸入包含路徑的檔名。即使用上一步**list.celfiles(celpath, full.name = t)
的返回值。無論cel檔案是否被壓縮均可讀取。
read.affy
使用******affy包讀取cel檔案需要額外提供乙個描述實驗分組資訊(即phenodata)的covdec檔案。該檔案與cel檔案放在同一目錄下。要求covdec檔案第一列無列名,含有要讀取cel檔名,剩下的列表示實驗因子。**如下:
read.affy(covdesc = "covdesc",path=".", ...)
資料讀取與資料分析
本章主要內容為資料讀取和資料分析,具體使用pandas庫完成資料讀取操作,並對賽題資料進行分析構成。賽題資料雖然是文字資料,每個新聞是不定長的,但任然使用csv格式進行儲存。因此可以直接用pandas完成資料讀取的操作。在賽題資料中每行句子的字元使用空格進行隔開,所以可以直接統計單詞的個數來得到每個...
資料分析讀取資料pandas
首先安裝完numpy之後就可以安裝pandas了 pip insert pandas 下面是簡單的用法可讀取任何檔案資料報括資料庫 import pandas as pd 通常用pd作為pandas的別名 s pd.series 1,2,3 index a b c 建立乙個序列s d pd.data...
Task2 資料讀取與資料分析
先用pandas讀取資料 train df pd.read csv data train set.csv sep t train df.head label為新聞類別,text為之後的文章內容。讀取資料後計算每條新聞的文字長度。用plt庫繪製直方圖。1 假設字元3750,字元900和字元648是句子...