4 pandas處理丟失的資料

2021-10-24 02:22:32 字數 1403 閱讀 5501

有些時候我們採集到的資料可能會是不全的,那麼這個時候我們就需要進行一定的處理,以便來滿足我們的要求。

那麼開始吧

#1 生成資料

import numpy as np

import pandas as pd

# 生成資料

dates = np.arange(

20200101

,20200105

)df1 = pd.dataframe(np.arange(12)

.reshape(4,

3),index=dates,columns=

['a'

,'b'

,'c'])

# 沒有的資料為空

=s1 # 將s1給df2的d列,index是所有的,沒有的為nan

)# axis=0表示行 1表示列,how=any 表示只要含有乙個,all表示所有

# 將空的值 賦值

)# 返回邏輯值,若位置為空則為true

res1=np.

any(df2.isnull())

#如果df2的所有值裡面有乙個值為空則為 true 否則為f

res2=np.

all(df2.isnull())

# df2的所有值都有空,才會返回 true

pandas處理丟失資料

有兩種丟失資料的方式 none np.nan nan 1,none none是python當中自帶的,型別為python object,所以,none是不能參與到任何的計算當中的 2,np.nan np.nan是浮點型別,能參與到計算當中,但是計算的結果為nan pandas中none與np.nan...

Pandas處理丟失資料

pandas處理丟失資料 1 建立含nan的矩陣 dates pd.date range 20130101 periods 6 df pd.dataframe np.arange 24 reshape 6,4 index dates,columns a b c d df.iloc 0,1 np.na...

pandas處理丟失資料

pandas將none和nan視為可交換的,它們都可以用來指示丟失的資料。none可以代替丟失值 哨兵值 並不適合所有情況,只能用於陣列的型別為物件的情況。none會導致一些聚合操作,比如sum 和min 會報錯。nan 代替丟失值 另外一中哨兵值 一種特殊的浮點型資料,不管什麼操作,只要有nan,...