pandas當中對於資料整體描述的方法

2021-08-17 18:25:26 字數 695 閱讀 1318

pandas當中有很多對於資料整體狀況進行描述的資訊,這些資訊在我們進行了解資料的時候很有用。

我們假設df為我們已經匯入的dataframe資料,方法的運用均為     df.方法名 。

下面是一些描述整體資訊常用的方法:

df.info()方法: i               可以檢視(資料有多少行多少列;各個屬性的型別object 、int32 、int64等)

df.head(number)方法:  可以檢視(前number行的資料值)

df.sample(n)方法      :   (隨機的檢視幾個樣本)

df.shape屬性:                可以檢視(資料有多少行多少列)

df.describe()方法:預設情況下只顯示出來數值型別的資料情況,可以檢視(資料的統計情況如均值、方差、最大最小值、分位數)

df.describe(include='all')   加入include引數以後,可以顯示所有資料的情況,顯示出來的資訊如下(count、unique、top、freq 還有上述預設情況下的資訊)

df.isnull().sum()                可以檢視(每個列中有多少個nan值)

已解決 Pandas按時間快速選取資料的方法

問題如下 安排 coding utf 8 import pandas as pd 路徑path a.xlsx sheet name 代表哪個sheet,0代表第乙個 因為是xlsx格式,用read excel讀取 data pd.read excel path,sheet name 0 思路 將日期...

對pandas資料判斷是否為NaN值的方法詳解

實際專案中有這樣的需求,將某一列的值,對映成類www.cppcns.com別型的資料,這個時候,需要我們將範圍等頻切分,或者等距切分。具體的做法可以先看某一些特徵的具體分布情況,然後我們選擇合適的閾值進行分割。def age map x if x 26 return 0程式設計客棧 elif x 2...

pandas連線MySQL資料庫的兩種方式

read sql sql,con,index col none coerce float true params none parse dates none columns none chunksize none 引數的意義 sql 為可執行的sql語句 con 資料庫的連線 index col 選...