Pandas資料分析實戰03

2021-10-19 09:45:53 字數 2306 閱讀 7665

讀取北上廣深瓜子二手車的資料

• 1.分別讀取4個csv檔案,然後合併多個csv檔案

• 2.去重複資料,重新設定連續索引

• 3.統計汽車自動擋和手動擋分別有多少輛

• 4.統計哪個城市二手車數量最多

• 5.統計深圳市最多的二手車品牌

瓜子網二手車交易資料

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

plt.rcparams[

'font.sans-serif']=

['simhei'

] plt.rcparams[

'axes.unicode_minus']=

false

# 設定檔名稱

file_names =

["bj"

,"gz"

,"sh"

,"sz"

]# 設定檔案路徑

file_path =

"d:\\coding\\python\\logiccoding\\data analyze\\瓜子\\guazi_"

# 用pandas讀取及合併csv檔案

# 資料去重

df_gz.drop_duplicates(

)df_gz.info(

)# 重新設定索引從1開始,並儲存檔案

# 統計汽車自動擋和手動擋的數量

# 統計哪個城市二手車數量最多

# 統計深圳市最多的二手車品牌

# 方法一,先用布林索引篩選出所有深圳的二手車

df_sz = df_gz[df_gz[

"city"]==

"深圳"

]# 再統計深圳各二手車品牌的數量

df_brand = df_sz.groupby(

"brand")[

"brand"

].count(

)df_brand

# 方法二,在groupby中指定分組優先順序

df_brand = df_gz.groupby(by=

["city"

,"brand"])

["city"

].count(

)df_brand[

"深圳"

Pandas資料分析實戰04

統計以下5個國家2010年人口的佔比情況 country list afghanistan albania arab world aruba bangladesh import numpy as np import pandas as pd import matplotlib.pyplot as p...

資料分析 pandas

pandas是乙個強大的python資料分析的工具包,它是基於numpy構建的,正因pandas的出現,讓python語言也成為使用最廣泛而且強大的資料分析環境之一。pandas的主要功能 具備對其功能的資料結構dataframe,series 整合時間序列功能 提供豐富的數 算和操作 靈活處理缺失...

python資料分析 Pandas

import pandas as pd series 可以看做乙個定長的有序字典。基本任意的一維資料都可以用來構造 series 物件 s pd.series 1,2,3.0,abc s1 pd.series data 1,3,5,7 index a b x y 通過下標獲取資料 s1 a seri...