Pandas資料分析初學 Apply函式

2021-10-23 06:37:34 字數 1060 閱讀 8556

首先匯入pandas庫

import pandas as pd
(1). 將資料框命名為crime;

#因為這個表中的資料有不同,所以需要將col=0的列設為index

crime = pd.read_csv(

'us_crime_rates_1960_2014.csv'

,index_col=

0)

(2). 每一列(column)的資料型別是什麼樣的?

crime.info(

)

(3). 將year的資料型別轉換為datetime64;

crime.year = pd.to_datetime(crime.year,

format

='%y'

)

(4). 將列year設定為資料框的索引;

crime = crime.set_index(

'year'

,drop=

true

)

(5). 刪除名為total的列;

del crime[

'total'

]#列印一下,檢視是否刪除成功

crime.head(

)

(6). 按照year(每十年)對資料框進行分組並求和;

crimes = crime.resample(

'10as').

sum(

)population = crime.resample(

'10as').

max(

)#人口是累計數,不能直接求和

crimes[

'population'

]= population

crimes

(7). 何時是美國歷史上生存最危險的年代?

crime.idxmax(

0)

Pandas資料分析初學 資料分組

首先匯入pandas庫 import pandas as pd 1 將資料框命名為drinks drinks pd.read csv drinks.csv 2 哪個大陸 continent 平均消耗的啤酒 beer 更多?drinks continent beer servings groupby ...

資料分析 pandas

pandas是乙個強大的python資料分析的工具包,它是基於numpy構建的,正因pandas的出現,讓python語言也成為使用最廣泛而且強大的資料分析環境之一。pandas的主要功能 具備對其功能的資料結構dataframe,series 整合時間序列功能 提供豐富的數 算和操作 靈活處理缺失...

App資料分析

為了幫助那些移動應用開發者認清這一點,我們通常用以下這個aarrr模型向他們解釋乙個移動應用背後的運營模式。什麼是aarrr模型 aarrr是acquisition activation retention revenue refer,這個五個單詞的所寫,分別對應這一款移動應用生命週期中的5個重要環...