首先匯入pandas庫
import pandas as pd
(1). 將資料框命名為crime;
#因為這個表中的資料有不同,所以需要將col=0的列設為index
crime = pd.read_csv(
'us_crime_rates_1960_2014.csv'
,index_col=
0)
(2). 每一列(column)的資料型別是什麼樣的?
crime.info(
)
(3). 將year的資料型別轉換為datetime64;
crime.year = pd.to_datetime(crime.year,
format
='%y'
)
(4). 將列year設定為資料框的索引;
crime = crime.set_index(
'year'
,drop=
true
)
(5). 刪除名為total的列;
del crime[
'total'
]#列印一下,檢視是否刪除成功
crime.head(
)
(6). 按照year(每十年)對資料框進行分組並求和;
crimes = crime.resample(
'10as').
sum(
)population = crime.resample(
'10as').
max(
)#人口是累計數,不能直接求和
crimes[
'population'
]= population
crimes
(7). 何時是美國歷史上生存最危險的年代?
crime.idxmax(
0)
Pandas資料分析初學 資料分組
首先匯入pandas庫 import pandas as pd 1 將資料框命名為drinks drinks pd.read csv drinks.csv 2 哪個大陸 continent 平均消耗的啤酒 beer 更多?drinks continent beer servings groupby ...
資料分析 pandas
pandas是乙個強大的python資料分析的工具包,它是基於numpy構建的,正因pandas的出現,讓python語言也成為使用最廣泛而且強大的資料分析環境之一。pandas的主要功能 具備對其功能的資料結構dataframe,series 整合時間序列功能 提供豐富的數 算和操作 靈活處理缺失...
App資料分析
為了幫助那些移動應用開發者認清這一點,我們通常用以下這個aarrr模型向他們解釋乙個移動應用背後的運營模式。什麼是aarrr模型 aarrr是acquisition activation retention revenue refer,這個五個單詞的所寫,分別對應這一款移動應用生命週期中的5個重要環...