讀取北上廣深瓜子二手車的資料
• 1.分別讀取4個csv檔案,然後合併多個csv檔案
• 2.去重複資料,重新設定連續索引
• 3.統計汽車自動擋和手動擋分別有多少輛
• 4.統計哪個城市二手車數量最多
• 5.統計深圳市最多的二手車品牌
瓜子網二手車交易資料
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.rcparams[
'font.sans-serif']=
['simhei'
] plt.rcparams[
'axes.unicode_minus']=
false
# 設定檔名稱
file_names =
["bj"
,"gz"
,"sh"
,"sz"
]# 設定檔案路徑
file_path =
"d:\\coding\\python\\logiccoding\\data analyze\\瓜子\\guazi_"
# 用pandas讀取及合併csv檔案
# 資料去重
df_gz.drop_duplicates(
)df_gz.info(
)# 重新設定索引從1開始,並儲存檔案
# 統計汽車自動擋和手動擋的數量
# 統計哪個城市二手車數量最多
# 統計深圳市最多的二手車品牌
# 方法一,先用布林索引篩選出所有深圳的二手車
df_sz = df_gz[df_gz[
"city"]==
"深圳"
]# 再統計深圳各二手車品牌的數量
df_brand = df_sz.groupby(
"brand")[
"brand"
].count(
)df_brand
# 方法二,在groupby中指定分組優先順序
df_brand = df_gz.groupby(by=
["city"
,"brand"])
["city"
].count(
)df_brand[
"深圳"
Pandas資料分析實戰04
統計以下5個國家2010年人口的佔比情況 country list afghanistan albania arab world aruba bangladesh import numpy as np import pandas as pd import matplotlib.pyplot as p...
資料分析 pandas
pandas是乙個強大的python資料分析的工具包,它是基於numpy構建的,正因pandas的出現,讓python語言也成為使用最廣泛而且強大的資料分析環境之一。pandas的主要功能 具備對其功能的資料結構dataframe,series 整合時間序列功能 提供豐富的數 算和操作 靈活處理缺失...
python資料分析 Pandas
import pandas as pd series 可以看做乙個定長的有序字典。基本任意的一維資料都可以用來構造 series 物件 s pd.series 1,2,3.0,abc s1 pd.series data 1,3,5,7 index a b x y 通過下標獲取資料 s1 a seri...