資料處理常用方法

2021-09-27 03:05:18 字數 823 閱讀 2322

列值替換:

data.trade_type[data.trade_type==21] = 1

data.trade_type[data.trade_type==22] = 0

取消索引:

wo.to_csv('szy.csv',index = false)
檢視所有列的空缺值

data.isnull().sum()
檢視每列的值的數量

data['trade_value'].value_counts()
去除重複值

data = data.drop_duplicates()
字串替換

str.replace("is", "was")
篩選指定日期的行

fw = result[(result.date>='2015-8-1')&(result.date<='2015-8-7')]
將object轉化為日期型別

result.date = pd.to_datetime(result.date)
df=pd.dataframe()

df.nunique()

a 3

b 3

dtype: int64

nuinque()是檢視該序列(axis=0/1對應著列或行)的不同值的數量。用這個函式可以檢視資料有多少個不同值。

python pandas常用資料處理方法

pandas 1 header 0 不同於 header none header 0 表示 第0行為列 header none 表示讀取的時候 認為沒有標題,全是資料 可以用 skiprows 1 跳過列名 2 pandas 獲取指定的行列資料 df.iloc 0 2,0,3 讀取 第 0,2 行的...

資料處理類常用方法

biginteger類 平時使用的數值型別都有一定的長度限制,當我們要運算的數超過了長度限制之後就無法使用了,這時我們就可以使用biginteger,他可以裝載其他型別表示的任意長度的數值。構造方法 biginteger biginteger newbiginteger 10809705710945...

資料處理常用

1,dataframe獲取列名稱 dataframe.columns.values.tolist 2,dataframe轉化為numpy dataframe.values 轉化為陣列後可以進行數值計算 3,numpy轉化為列表 list numpy.tolist 4,進行陣列運算時如果有字串 nul...