有些時候我們採集到的資料可能會是不全的,那麼這個時候我們就需要進行一定的處理,以便來滿足我們的要求。
那麼開始吧
#1 生成資料
import numpy as np
import pandas as pd
# 生成資料
dates = np.arange(
20200101
,20200105
)df1 = pd.dataframe(np.arange(12)
.reshape(4,
3),index=dates,columns=
['a'
,'b'
,'c'])
# 沒有的資料為空
=s1 # 將s1給df2的d列,index是所有的,沒有的為nan
)# axis=0表示行 1表示列,how=any 表示只要含有乙個,all表示所有
# 將空的值 賦值
)# 返回邏輯值,若位置為空則為true
res1=np.
any(df2.isnull())
#如果df2的所有值裡面有乙個值為空則為 true 否則為f
res2=np.
all(df2.isnull())
# df2的所有值都有空,才會返回 true
pandas處理丟失資料
有兩種丟失資料的方式 none np.nan nan 1,none none是python當中自帶的,型別為python object,所以,none是不能參與到任何的計算當中的 2,np.nan np.nan是浮點型別,能參與到計算當中,但是計算的結果為nan pandas中none與np.nan...
Pandas處理丟失資料
pandas處理丟失資料 1 建立含nan的矩陣 dates pd.date range 20130101 periods 6 df pd.dataframe np.arange 24 reshape 6,4 index dates,columns a b c d df.iloc 0,1 np.na...
pandas處理丟失資料
pandas將none和nan視為可交換的,它們都可以用來指示丟失的資料。none可以代替丟失值 哨兵值 並不適合所有情況,只能用於陣列的型別為物件的情況。none會導致一些聚合操作,比如sum 和min 會報錯。nan 代替丟失值 另外一中哨兵值 一種特殊的浮點型資料,不管什麼操作,只要有nan,...