DataFrame的條件過濾

2021-10-09 02:25:17 字數 3024 閱讀 4338

series向量的操作

from pandas import read_csv

# 載入檔案

df = read_csv(

"scientists.csv"

)print

(df)

print

(type

(df)

)# 得到年齡這一列

age = df[

"age"

]print

(age)

print

("***************"

)print

(age +

100)

dataframe的條件過濾

from pandas import read_csv

# 載入檔案

df = read_csv(

"scientists.csv"

, sep=

",")

print

(df)

print

(type

(df)

)# 得到壽命大於平均值的資料

mean = df[

"age"

].mean(

)# 平均年齡

print

(mean)

new_df = df[df[

"age"

]> mean]

print

("---------------"

)print

(new_df)

#使用bool獲取資料

print

("---------"

)print

(df[

[true

,true

,true

,false

,false

,true

,false

,false]]

)#使用loc或者iloc根據下標獲取資料

dataframe新增修改列

from pandas import read_csv,to_datetime

df = read_csv(

"scientists.csv"

)print

(df)

old_born = df[

"born"

]print

(old_born)

print

(type

(old_born)

)#轉換型別

new_born = to_datetime(old_born)

print

("轉換型別"

)print

(new_born)

print

(type

(new_born)

)#新增新的列

df["new_born"

]= new_born

print

("新增新的列"

)print

(df)

#修改資料

df["new_born"]=

["n1"

,"n2"

,"n3"

,"n4"

,"n5"

,"n6"

,"n7"

,"n8"

]print

("修改資料"

)print

(df)

#刪除列

#axis=1是刪除列,需要寫上列名

result = df.drop(

["new_born"

,"age"

,"died"

],axis=1)

print

(result)

print

("#刪除列"

)print

(result)

#axis=0是刪除行,需要寫上上行的下標索引

result = df.drop([0

,2,6

],axis=0)

print

(result)

在這裡插入**片

csv資料

name,born,died,age,occupation

rosaline franklin,1920-07-25,1958-04-16,37,chemist

william gosset,1876-06-13,1937-10-16,61,statistician

florence nightingale,1820-05-12,1910-08-13,90,nurse

marie curie,1867-11-07,1934-07-04,66,chemist

rachel carson,1907-05-27,1964-04-14,56,biologist

john snow,1813-03-15,1858-06-16,45,physician

alan turing,1912-06-23,1954-06-07,41,computer scientist

johann gauss,1777-04-30,1855-02-23,77,mathematician

Dataframe 按條件選取行

我們說excel好用,在處理大型資料 的時候,excel可以非常方便地進行篩選。那麼pandas是否有類似的功能呢?答案是肯定的。下面介紹的幾個操作,返回的型別都是dataframe,因此可以進行巢狀操作,非常方便。一 選取幾列組成新的dataframe df df a列列明 s列列明 h列列明 二...

DataFrame中的資料選取與過濾

在資料分析前,篩選出我們所需要的資料是非常必要的手段,下面簡單介紹幾種方法 匯入資料 1 匯入pandas和numpy庫 2import pandas as pd 3import numpy as np 4from pandas import series,dataframe 5 test pd.r...

dataframe 取行 列 及其條件選擇

dataframe 取列有兩種方法 df.列名 或 df 列名 同時通過,df 列名1 列名2 可以選擇多列。dataframe取行 和列 通過loc類和iloc類 可以選擇dataframe資料的多行和多列。其中loc類通過 標籤 進行列的選擇,iloc類通過索引 位置 選擇物件。形象記憶,ilo...