pandas視覺化PM2 5的乙個小例子

2022-05-13 14:24:49 字數 2468 閱讀 4260

首先匯入資料,並且檢視資料的樣式

現在,要以pm_us post和pm_dongsi這兩列為y軸,時間x軸來畫折線圖。

這裡可以發現幾個問題,首先;時間中年月日小時是分開的,需要將其合併為2010-01-01 05:00這樣可讀的pandas型別。第二:pm_us post這一列有nan值,需要處理掉。

解決方法:針對第乙個問題,可以使用pd.periodindex()方法(效果如下圖)。針對第二個問題,可以選擇刪除nan的資料,因為空資料不多。

1

#把分開的時間字串通過periodindex方法轉換為pands的時間型別

全部**:

1

import

pandas as pd

2import

matplotlib.pyplot as plt

3 file_path = '

./pm2.5/beijingpm20100101_20151231.csv'4

5 df =pd.read_csv(file_path)6#

把分開的時間字串通過periodindex方法轉換為pands的時間型別

7 period = pd.periodindex(year=df['

year

'], month=df['

month

'],day=df['

day'],hour=df['

hour

'],freq='h'

)89#

將整合的時間新增到資料中去

10 df['

datetime

'] =period

1112

#將datetime設定為索引,原地修改

13 df.set_index('

datetime

', inplace=true)

1415

#由於資料量太多,畫圖時不美觀,所以以一周進行降取樣(取平均值)

16 df = df.resample('7d'

).mean()

1718

#處理q缺失資料 (pm_us post列),刪除

19 data = df['

pm_us post

'] #

刪除應該是data = df['pm_us post'].dropna() ,d但這裡不刪除,因為pm_dongsi 這列資料缺失有點多。

202122#

畫圖23 _x =data.index24#

重新格式化日期顯示格式

PM2 5與城市化的關係

研究資料 1998 2013年夜間燈光 nasa pm2.5柵格資料集 統計年鑑 研究方法 gwr 地理探測器 研究區 成渝城市群 研究內容 基於gwr模型,了pm2.5濃度與夜間燈光 一定程度上表示城市化水平 的關係 基於地理探測器,了2006 年 2010 年 2013 年成渝城市群各城市燈光指...

Pandas資料視覺化

pd.dataframeplot x none,y none,kind line figsize none,legend true,style none,color b alpha none,title none,subplots false,grid none figsize 表示影象大小的元組 ...

基於pandas的內建視覺化

資料分析能夠很好地幫我們了解資料,理解資料,能夠幫助我們進行有效的特徵工程,方便後續的機器學習建模。pandas作為強大的資料分析工具,提供的內建視覺化功能也是十分強大的。series和dataframe上的這個功能只是使用matplotlib庫的plot 方法的簡單包裝實現。繪圖方法允許除預設線圖...