pandas資料選擇(索引)

2021-08-14 13:49:16 字數 2924 閱讀 7682

import pandas as pd

import numpy as np

dates = pd.date_range('20180101',periods=6)

df = pd.dataframe(np.arange(24).reshape(6,4),index=dates,columns=['a','b','c','d'])

print(df)  #基本資料
a   b   c   d

2018-01-01 0 1 2 3

2018-01-02 4 5 6 7

2018-01-03 8 9 10 11

2018-01-04 12 13 14 15

2018-01-05 16 17 18 19

2018-01-06 20 21 22 23

一、索引的基本方法

print(df.a, df['a']) #引用a列的兩種方式
2018-01-01     0

2018-01-02 4

2018-01-03 8

2018-01-04 12

2018-01-05 16

2018-01-06 20

freq: d, name: a, dtype: int32 2018-01-01 0

2018-01-02 4

2018-01-03 8

2018-01-04 12

2018-01-05 16

2018-01-06 20

freq: d, name: a, dtype: int32

print(df[0:2])  #引用行的兩種方式
a  b  c  d

2018-01-01 0 1 2 3

2018-01-02 4 5 6 7

print( df['2018-01-02':'2018-01-04'])
a   b   c   d

2018-01-02 4 5 6 7

2018-01-03 8 9 10 11

2018-01-04 12 13 14 15

二、loc方法(loc——通過行標籤索引行資料 )

print(df.loc['2018-01-02'])  #loc——通過行標籤索引行資料
a    4

b 5

c 6

d 7

name: 2018-01-02 00:00:00, dtype: int32

print(df.loc['2018-01-02',['a','b']]) #應用在index的基礎上之後,可以選取所需的列
a    4

b 5

name: 2018-01-02 00:00:00, dtype: int32

三、iloc方法(iloc——通過行號索引行資料 )

print(df.iloc[3:5,2:4])
c   d

2018-01-04 14 15

2018-01-05 18 19

print(df.iloc[[1,3,5],2:4]) #跳行取數
c   d

2018-01-02 6 7

2018-01-04 14 15

2018-01-06 22 23

四、ix方法–通過行標籤或者行號索引行資料(基於loc和iloc 的混合)

print(df.ix[0:3,['a','b']])
a  b

2018-01-01 0 1

2018-01-02 4 5

2018-01-03 8 9

c:\users\administrator\anaconda3\lib\site-packages\ipykernel_launcher.py:1: deprecationwarning:

.ix is deprecated. please use

.loc for label based indexing or

.iloc for positional indexing

五、布林型索引

print(df[df.a>=8])
a   b   c   d

2018-01-03 8 9 10 11

2018-01-04 12 13 14 15

2018-01-05 16 17 18 19

2018-01-06 20 21 22 23

print(df.a>=8)
2018-01-01    false

2018-01-02 false

2018-01-03 true

2018-01-04 true

2018-01-05 true

2018-01-06 true

freq: d, name: a, dtype: bool

pandas 2索引和選擇資料

對於一種資料結構,最基本的操作就應該是增刪改查了。行選擇和列選擇有許多方法,很容易記混,常用的要記住。主要方法有三種 iloc,loc,df.loc index1 index2 price df.iloc a b price 123 4567 s.sample frac 0.5 引數 預設選擇行,n...

Pandas 選擇資料

pandas 具有非常豐富的資料篩選能力,可以支援多種個性化的篩選 dates pd.date range 20210125 periods 6 df pd.dataframe np.arange 24 reshape 6,4 index dates,columns a b c d print df...

pandas入門 資料選擇

關於pandas資料選擇的知識點總結。df pd.dataframe 建立的dataframe資訊如下 a b c 0 3 1.2 aa 1 4 2.4 bb 2 8 4.5 cc 3 9 7.3 dd df1 df a 根據列名選取一列,以series的形式返回列 df1 df.a 與上面寫法效果...