pandas當中有很多對於資料整體狀況進行描述的資訊,這些資訊在我們進行了解資料的時候很有用。
我們假設df為我們已經匯入的dataframe資料,方法的運用均為 df.方法名 。
下面是一些描述整體資訊常用的方法:
df.info()方法: i 可以檢視(資料有多少行多少列;各個屬性的型別object 、int32 、int64等)
df.head(number)方法: 可以檢視(前number行的資料值)
df.sample(n)方法 : (隨機的檢視幾個樣本)
df.shape屬性: 可以檢視(資料有多少行多少列)
df.describe()方法:預設情況下只顯示出來數值型別的資料情況,可以檢視(資料的統計情況如均值、方差、最大最小值、分位數)
df.describe(include='all') 加入include引數以後,可以顯示所有資料的情況,顯示出來的資訊如下(count、unique、top、freq 還有上述預設情況下的資訊)
df.isnull().sum() 可以檢視(每個列中有多少個nan值)
已解決 Pandas按時間快速選取資料的方法
問題如下 安排 coding utf 8 import pandas as pd 路徑path a.xlsx sheet name 代表哪個sheet,0代表第乙個 因為是xlsx格式,用read excel讀取 data pd.read excel path,sheet name 0 思路 將日期...
對pandas資料判斷是否為NaN值的方法詳解
實際專案中有這樣的需求,將某一列的值,對映成類www.cppcns.com別型的資料,這個時候,需要我們將範圍等頻切分,或者等距切分。具體的做法可以先看某一些特徵的具體分布情況,然後我們選擇合適的閾值進行分割。def age map x if x 26 return 0程式設計客棧 elif x 2...
pandas連線MySQL資料庫的兩種方式
read sql sql,con,index col none coerce float true params none parse dates none columns none chunksize none 引數的意義 sql 為可執行的sql語句 con 資料庫的連線 index col 選...