Pandas資料分析常用方法

2021-10-07 13:03:32 字數 1834 閱讀 9173

指定索引列

names: 列名陣列,預設值 none,用於讀取資料的指定列名

eg1:

catering_sale =

"catering_sale.xls"

data = pd.read_excel(catering_sale, names=[『date』,『sale』])

[外鏈轉存失敗,源站可能有防盜煉機制,建議將儲存下來直接上傳(img-smtqdtnl-1593225260019)(d:\我\myblog\pandas資料分析常用方法.assets\image-20200624181257685.png)]

## 2、 按行索引iloc與loc

```python

data2=pd.dataframe(data1,columns=('a','b','c')) #columns定義字段

data2

a b c

0 0 2 4

1 6 8 10

2 12 14 16

3 18 20 22

4 24 26 28

1.loc通過行標籤索引行資料

例:loc[n]表示索引的是第n行(index 是整數)

loc[『d』]表示索引的是第』d』行(index 是字元)

有行索引可以沒有字段取值,但有字段取值前必須得有行索引,

而且行索引只能為標籤索引形式來取,不能按切片形式來取。

單取切片形式可以,只是索引為左閉右閉。

2.iloc

通過行索引獲取行資料,不能是字元,取索引必須按切片形式來取,不能按標籤,這是與loc的不同。索引為左閉右開。iloc也可以取指定行列,只不過得按切片形式索引,不能直接拿標籤索引來做。

3.建議

當用行索引的時候, 盡量用 iloc 來進行索引; 而用標籤索引的時候用 loc 。

)一種方法是直接呼叫dataframe的boxplot()方法;

資料分析的pandas常用方法

pandas模組為我們提供了非常多的描述性統計分析的指標函式,如總和 均值 最小值 最大值等,我們來具體看看這些函式 首先隨機生成三組資料 np.random.seed 1234 d1 pd.series 2 np.random.normal size 100 3 d2 np.random.f 2,...

pandas資料分析之常用方法

前言 pandas是python中進行資料處理的乙個非常有用的庫,利用好pandas,可以十分方便的對資料進行處理以及統計分析 直接上 一.pandas資料處理 1.1 pandas中刪除dataframe中行 列 dataframe中刪除滿足條件的行 df df.drop df df.col na...

資料分析 pandas

pandas是乙個強大的python資料分析的工具包,它是基於numpy構建的,正因pandas的出現,讓python語言也成為使用最廣泛而且強大的資料分析環境之一。pandas的主要功能 具備對其功能的資料結構dataframe,series 整合時間序列功能 提供豐富的數 算和操作 靈活處理缺失...