DataFrame中將資料中的某乙個值用其他值代替

2021-09-05 12:56:00 字數 1142 閱讀 4385

1.在對資料進行分析時我們會遇到缺失值,其中有一部分缺失值是用"?"來表示的,我們對其進行填補時可能會出現"badinputerror: data is not float."的錯誤,因此我們可以用replace將其轉換為nan

import numpy as np

import pandas as pd

data = pd.dataframe(np.random.random(9).reshape((3,3)))

print(data)

0 1 2

0 0.277842 0.933150 0.686117

1 0.245226 0.040764 0.198539

2 0.042279 0.013079 0.245121

data.iloc[np.random.randint(2),np.random.randint(2)] = "?"

print(data)

0 1 2

0 0.277842 0.933150 0.686117

1 ? 0.040764 0.198539

2 0.0422795 0.013079 0.245121

data = data00.replace("?",np.nan)

0 1 2

0 0.277842 0.933150 0.686117

1 nan 0.040764 0.198539

2 0.042279 0.013079 0.245121

2.如果想要對data中的nan資料填充0或者其他值也可以用replace

data = data.replace("nan", 0)

data.iloc[1,0] +9

9#如果是下面的**

data = data.fillna(0)

data.iloc[1,0] + 9

......

......(出現錯誤)

typeerror: must be str, not int

3.可以用data.fillna(0)用0來填充。

python中DataFrame資料幀的統計方法

我們把每乙個column作為乙個樣本資料集,就可以對其進行一些統計學方法的計算,比如求和sum 求平均mean 求方差var 求標準差std 求個數count 求最大值max 求最小值min,等操作。我們用以下 來進行演示 import pandas as pd dict data df data ...

DataFrame中關於object資料型別的說明

1 構造乙個dataframe 圖中,我們構造了乙個dataframe,這個dataframe有2列,第一列全部都是數值型別,第二列中既有數值型別又有布林型別。對於col1列,由於都是同一種資料型別,系統能夠辨認出來,這是一種int數值型別 int64是一種預設的資料型別 對於col2列,由於這一列...

DataFrame中的資料選取與過濾

在資料分析前,篩選出我們所需要的資料是非常必要的手段,下面簡單介紹幾種方法 匯入資料 1 匯入pandas和numpy庫 2import pandas as pd 3import numpy as np 4from pandas import series,dataframe 5 test pd.r...