genefilter包常用函式

2021-08-19 21:59:49 字數 1361 閱讀 8241

功能:只留下檢驗統計量最大的探針,捨棄其他重複探針。

返回值:包含探針名稱的list。

findlargest(gn, teststat, data = "hgu133plus2")
引數

注釋gn

包含所有探針名稱的list。

teststat

包含檢驗檢測統計量的list,長度和gn一致。

data

晶元標識。

功能:使用自定義的統計檢驗方法檢驗探針是否通過測試。

返回值:乙個包含邏輯值的list,長度和探針數目一致。通過測試的返回true,不通過的返回false。

genefilter(expr, flist)
引數

注釋expr

表達矩陣。

flist

包含統計檢驗方法的list。

功能:判斷探針是否至少在k個樣本中超過a。

返回值:邏輯值。通過檢驗為true,不通過為false。

kovera(k, a=100, na.rm=true)
引數注釋a

要超過的值。

k至少幾個樣本。

na.rm

是否移除na值。預設為true。

功能:除去低變異或低訊號的探針。

返回值:乙個包含篩選後的eset和filter.log的list。

|————–|

|eset|過濾後的expressiongset|

|filter.log|每一步過濾掉多少探針的記錄|

nsfilter(eset, require.entrez=true,

require.gobp=false, require.gocc=false,

require.gomf=false, require.cytoband=false,

remove.dupentrez=true, var.func=iqr,

var.cutoff=0.5, var.filter=true,

filterbyquantile=true, feature.exclude="^affx", ...)

引數

注釋require.entrez

若為true,過濾掉沒有entrez id的探針。預設為true。

remove.dupentrez

若為true,當幾個探針對應統同一entrez id的時候,留下 var.func 值最大的探針,其餘過濾。預設為true。

var.func

用於過濾的統計引數。預設為iqr。

var.cutoff

截斷值。預設為0.5,即過濾掉50%的基因。

GEOquery包常用函式

返回值 gds gse gsm gpl。取決於geo引數。getgeo geo null,filename null,destdir tempdir gselimits null,gsematrix true,annotgpl false,getgpl true,parsecharacteristi...

oligo包常用函式

功能 提供顏色。返回值 表示顏色的字元。darkcolors n seqcolors n seqcolors2 n divcolors n 注意 darkcolors是基於rcolorbrewer包設計的。功能 對featureset擬合robust probe level linear model...

Python強大的pandas包常用函式

import pandas as pd filepath01 r f data temp gd net loss data demo01.csv data01 pd.read csv filepath01 print data01.head 5 print data01.columns 返回全部列名...