功能:只留下檢驗統計量最大的探針,捨棄其他重複探針。
返回值:包含探針名稱的list。
findlargest(gn, teststat, data = "hgu133plus2")
引數
注釋gn
包含所有探針名稱的list。
teststat
包含檢驗檢測統計量的list,長度和gn一致。
data
晶元標識。
功能:使用自定義的統計檢驗方法檢驗探針是否通過測試。
返回值:乙個包含邏輯值的list,長度和探針數目一致。通過測試的返回true,不通過的返回false。
genefilter(expr, flist)
引數
注釋expr
表達矩陣。
flist
包含統計檢驗方法的list。
功能:判斷探針是否至少在k個樣本中超過a。
返回值:邏輯值。通過檢驗為true,不通過為false。
kovera(k, a=100, na.rm=true)
引數注釋a
要超過的值。
k至少幾個樣本。
na.rm
是否移除na值。預設為true。
功能:除去低變異或低訊號的探針。
返回值:乙個包含篩選後的eset和filter.log的list。
|————–|
|eset|過濾後的expressiongset|
|filter.log|每一步過濾掉多少探針的記錄|
nsfilter(eset, require.entrez=true,
require.gobp=false, require.gocc=false,
require.gomf=false, require.cytoband=false,
remove.dupentrez=true, var.func=iqr,
var.cutoff=0.5, var.filter=true,
filterbyquantile=true, feature.exclude="^affx", ...)
引數
注釋require.entrez
若為true,過濾掉沒有entrez id的探針。預設為true。
remove.dupentrez
若為true,當幾個探針對應統同一entrez id的時候,留下 var.func 值最大的探針,其餘過濾。預設為true。
var.func
用於過濾的統計引數。預設為iqr。
var.cutoff
截斷值。預設為0.5,即過濾掉50%的基因。
GEOquery包常用函式
返回值 gds gse gsm gpl。取決於geo引數。getgeo geo null,filename null,destdir tempdir gselimits null,gsematrix true,annotgpl false,getgpl true,parsecharacteristi...
oligo包常用函式
功能 提供顏色。返回值 表示顏色的字元。darkcolors n seqcolors n seqcolors2 n divcolors n 注意 darkcolors是基於rcolorbrewer包設計的。功能 對featureset擬合robust probe level linear model...
Python強大的pandas包常用函式
import pandas as pd filepath01 r f data temp gd net loss data demo01.csv data01 pd.read csv filepath01 print data01.head 5 print data01.columns 返回全部列名...