pandas找出某值的所有行 Pandas基礎1

2021-10-13 20:00:38 字數 1806 閱讀 5702

1.series

1.1 pandas系列可以使用以下建構函式建立

資料幀(dataframe)是二維資料結構,即資料以行和列的**方式排列。

• 功能:

– 潛在的列是不同的型別

– 大小可變

– 標記軸(行和列) – 可以對行和列執行算術運算

pandas中的dataframe可以使用以下建構函式建立

– pandas.dataframe( data, index, columns, dtype) – 引數如下:

• data資料採取各種形式,如:ndarray,series,map,lists,dict,constant和另乙個dataframe。 

• index對於行標籤,要用於結果幀的索引是可選預設值np.arrange(n),如果沒有傳遞索引值。

• columns對於列標籤,可選的預設語法是 - np.arange(n)。這只有在沒有索引傳遞的情況下才是這樣。

• dtype每列的資料型別。

3. series的基本操作

4.dataframe基本操作

pandas常用的描述性統計資訊的函式:

– 由於dataframe是異構資料結構。通用操作不適用於所有函式。

– 類似於:sum(),cumsum()函式能與數字和字元(或)字串資料元素一起工作,不會產生任何錯誤。

– 由於這樣的操作無法執行,因此,當dataframe包含字元或字串資料時,像abs(),cumprod()這樣的函式會丟擲異常。

要將自定義或其他庫的函式應用於pandas物件,有三種方式:

– pipe():**函式應用,通過將函式和適當數量的引數作為管道引數來執行自定義操作,對整個dataframe執行操作。

dataframe獲取行之和大於100的資料, 並返回最後的兩行

– 按標籤排序:sort_index()方法通過傳遞axis引數和排序順序,可以對dataframe進行排序。ascending=true為公升序,false為降序。axis=0排序行,1為排序列。

– 按實際值:sort_values()是按值排序的方法。它接受乙個by引數,指定排序列名

pandas 根據列的值選取所有行

選取等於某些值的行記錄 用 df.loc df column name some value 選取某列是否是某一型別的數值 用 isin df.loc df column name isin some values 多種條件的選取 用 df.loc df column some value df o...

pandas 滿足多條件的行的某列求和

import numpy as np import pandas as pd import csv import random train msg pd.read csv txctr train msg.csv train msg train msg.sort values by user id a...

3 6 2儲存某列最大值的行

任務 查詢最昂貴商品的數量,經銷商和 這可以通過子查詢輕鬆完成 from shop where price select max price from shop article dealer price 0004 d 19.95 其他解決方案是使用left join或排序按 降序的所有行,並使用特定...