DataFrame 行列資料的篩選

2022-05-06 12:48:08 字數 1756 閱讀 5865

一、對dataframe的認知

dataframe的本質是行(index)列(column)索引+多列資料。

dataframe預設索引是序號(0,1,2…),可以理解成位置索引。

一般我們用id標識不同記錄,不會改變index。但為了理解不同特徵(列)含義,我們往往會重新指定column

二、對dataframe進行行列資料篩選

import

pandas as pd

import numpy as np

from pandas import

dataframe

df = dataframe(np.arange(20).reshape((4,5)),column = list('

abcde

')) #生成乙個dataframe

1.df&df. 選取列資料

df.a 

df[[『a』,』b』]]

2.df.loc[[index],[colunm]] 通過標籤選擇資料不對行進行篩選時,[index]處填 : (不能為空),即df.loc[:,』a』]表示選取a列全部資料。

3.df.iloc[[index],[colunm]] 通過位置選擇資料

不對行進行篩選時,同df.loc,即[index]處不能為空。

4.df.ix[[index],[column]] 通過標籤or位置選擇資料

df.ix混合了標籤和位置選擇。需要注意的是,[index]和[column]的框內需要指定同一類的選擇。

df.ix[[0:1],[『a』,3]]
報錯5.多條件篩選原表資料:

(1)使用「與」條件進行篩選

df1 = df.loc[(df['

現價']>6)&(df['

開板'] ==0)]

print(df1)

結果只有2條資料符合要求:

(2) 使用「或」條件進行篩選

df2 = df.loc[(df['

現價']>10)|(df['

連板'] >2)]

print(df2)
則有4條資料符合要求:(分別有2和6符合條件1,而0、1和2符合條件2)

dataframe 取行 列 及其條件選擇

dataframe 取列有兩種方法 df.列名 或 df 列名 同時通過,df 列名1 列名2 可以選擇多列。dataframe取行 和列 通過loc類和iloc類 可以選擇dataframe資料的多行和多列。其中loc類通過 標籤 進行列的選擇,iloc類通過索引 位置 選擇物件。形象記憶,ilo...

Pandas對DataFrame行列值操作

分析文字資料時經常要對csv檔案做處理,用pandas在對 資料取值時經常會忘了怎麼操作,下面做乙個小的總結,只涉及經常用的一些操作。train.csv內容如下 list1 list2 list3aa 1bb2 cc3d d4ee 5import pandas as pd data pd.read ...

對dataframe進行列相加,行相加的例項

例項如下所示 程式設計客棧 import pandas as pd df pd.data df x y z 0 a aa aaa 1 b bb bbb 2 c cc ccc 3 d dd ddd 對列的字串進行相連 join df x a b c d join df x abcd 對行的字串進行相連...