下面用例項來說明這兩個函式的作用:
這是乙個資料框
final:
gene hsap mmul mmus rnor cfam
1ensg00000208234
0na na na na
2ensg00000199674 02
222
3ensg00000221622
0na na na na
4ensg00000207604
0na na 12
5ensg00000207431
0na na na na
6ensg00000221312 01
232
如果要去除有na的行,則可用:
final
[complete
.cases
(final
),]
也可用 na.omit(final)
那麼,返回值是
gene hsap mmul mmus rnor cfam
2ensg00000199674 02
222
6ensg00000221312 01
232
現在,我只想過濾部分列:我們就只能用final
[complete
.cases
(final[,5
:6]),]
結果是:
gene hsap mmul mmus rnor cfam
2ensg00000199674 02
222
4ensg00000207604
0na na 12
6ensg00000221312 01
232
這樣第四行含有空值,但是,我們的命令是只過濾第5列,第6列中含有na的行
DataFrame中去除指定列為空的行
一次,筆者在處理資料時想去除dataframe中指定列的值為空的這一行,採用了如下做法,但是怎麼都沒有成功 encoding utf 8 import pandas as pd import math import numpy as np data pd.read csv mydata.csv pr...
r語言賦值為na 如何將R資料中的NA值替換為0?
dplyr雜交選項現在比baser子集重新分配快30 左右。在乙個100公尺的資料池上mutate all replace is.na 0 比基數r快半秒d is.na d 如果你在為大量的資料而掙扎,data.table是最快的選擇 比標準快40 基r接近。它還可以修改現有的資料,有效地允許您一次...
R語言資料按行去除重複
在臨床上,偶爾會出現需要分析病例資料的情況。通常為了保護隱私,患者的個人識別相關的關鍵資訊會被剔除只保留病歷號,但是患者的就診行為可能不止一次,這也就導致了我們的資料出現了重複,把這些資料直接放到一起進行分析顯然是不科學的。首先觀察自己的資料,如果是用行來代表觀測的話,可以使用dplyr包disti...