series向量的操作
from pandas import read_csv
# 載入檔案
df = read_csv(
"scientists.csv"
)print
(df)
print
(type
(df)
)# 得到年齡這一列
age = df[
"age"
]print
(age)
print
("***************"
)print
(age +
100)
dataframe的條件過濾
from pandas import read_csv
# 載入檔案
df = read_csv(
"scientists.csv"
, sep=
",")
print
(df)
print
(type
(df)
)# 得到壽命大於平均值的資料
mean = df[
"age"
].mean(
)# 平均年齡
print
(mean)
new_df = df[df[
"age"
]> mean]
print
("---------------"
)print
(new_df)
#使用bool獲取資料
print
("---------"
)print
(df[
[true
,true
,true
,false
,false
,true
,false
,false]]
)#使用loc或者iloc根據下標獲取資料
dataframe新增修改列
from pandas import read_csv,to_datetime
df = read_csv(
"scientists.csv"
)print
(df)
old_born = df[
"born"
]print
(old_born)
print
(type
(old_born)
)#轉換型別
new_born = to_datetime(old_born)
print
("轉換型別"
)print
(new_born)
print
(type
(new_born)
)#新增新的列
df["new_born"
]= new_born
print
("新增新的列"
)print
(df)
#修改資料
df["new_born"]=
["n1"
,"n2"
,"n3"
,"n4"
,"n5"
,"n6"
,"n7"
,"n8"
]print
("修改資料"
)print
(df)
#刪除列
#axis=1是刪除列,需要寫上列名
result = df.drop(
["new_born"
,"age"
,"died"
],axis=1)
print
(result)
print
("#刪除列"
)print
(result)
#axis=0是刪除行,需要寫上上行的下標索引
result = df.drop([0
,2,6
],axis=0)
print
(result)
在這裡插入**片
csv資料
name,born,died,age,occupation
rosaline franklin,1920-07-25,1958-04-16,37,chemist
william gosset,1876-06-13,1937-10-16,61,statistician
florence nightingale,1820-05-12,1910-08-13,90,nurse
marie curie,1867-11-07,1934-07-04,66,chemist
rachel carson,1907-05-27,1964-04-14,56,biologist
john snow,1813-03-15,1858-06-16,45,physician
alan turing,1912-06-23,1954-06-07,41,computer scientist
johann gauss,1777-04-30,1855-02-23,77,mathematician
Dataframe 按條件選取行
我們說excel好用,在處理大型資料 的時候,excel可以非常方便地進行篩選。那麼pandas是否有類似的功能呢?答案是肯定的。下面介紹的幾個操作,返回的型別都是dataframe,因此可以進行巢狀操作,非常方便。一 選取幾列組成新的dataframe df df a列列明 s列列明 h列列明 二...
DataFrame中的資料選取與過濾
在資料分析前,篩選出我們所需要的資料是非常必要的手段,下面簡單介紹幾種方法 匯入資料 1 匯入pandas和numpy庫 2import pandas as pd 3import numpy as np 4from pandas import series,dataframe 5 test pd.r...
dataframe 取行 列 及其條件選擇
dataframe 取列有兩種方法 df.列名 或 df 列名 同時通過,df 列名1 列名2 可以選擇多列。dataframe取行 和列 通過loc類和iloc類 可以選擇dataframe資料的多行和多列。其中loc類通過 標籤 進行列的選擇,iloc類通過索引 位置 選擇物件。形象記憶,ilo...