統計以下5個國家2023年人口的佔比情況:
country_list = [「afghanistan」,「albania」,「arab world」,「aruba」,「bangladesh」]
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.rcparams[
'font.sans-serif']=
['simhei'
] plt.rcparams[
'axes.unicode_minus']=
false
# 設定檔名稱
file_name =
"population_data.json"
# 設定檔案路徑
file_path =
"d:\\coding\\python\\logiccoding\\data analyze\\"
# 用pandas讀取及合併json檔案
df_population = pd.read_json(file_path + file_name)
df_population
df_population.info(
)
# 統計以下5個國家2023年人口的佔比情況
country_list =
["afghanistan"
,"albania"
,"arab world"
,"aruba"
,"bangladesh"
]# 依次統計各國2023年的人口佔比情況
# 方法一,使用布林索引篩選國家和篩選年份,最後將對應的值新增到列表中
country_population =
for country in country_list:
df_pop = df_population[
(df_population[
"country name"
]== country)
&(df_population[
"year"]==
2010)]
df_pop = df_pop.reset_index()0
,"value"
].astype(
float))
country_population
# 方法二,用loc()方法實現快速定位
country_population =
for country in country_list:
df_pop = df_population.loc[
(df_population[
"country name"
]== country)
&(df_population[
"year"]==
2010)]
df_pop = df_pop.reset_index()0
,4].astype(
float))
country_population
# 繪製餅圖
defdraw_pie()
: plt.pie(country_population
,labels = country_list # 各個部分的名字(標籤)
,labeldistance =
1.1# 標籤到中心點的距離
,autopct =
'%.1f%%'
# 控制比例的值的顯示
,pctdistance =
0.5# 控制百分比的值的顯示位置
,explode =[0
,0,0.1,0
,0]# 每乙份扇形 到中心點的距離
,colors =
['yellow'
,'blue'
,'red'
,'orange'
,'green'
],shadow =
true
,startangle =
90# 繪製圖形時候 開始的角度
) plt.title(
"各國2023年人口的佔比情況"
Pandas資料分析實戰03
讀取北上廣深瓜子二手車的資料 1.分別讀取4個csv檔案,然後合併多個csv檔案 2.去重複資料,重新設定連續索引 3.統計汽車自動擋和手動擋分別有多少輛 4.統計哪個城市二手車數量最多 5.統計深圳市最多的二手車品牌 瓜子網二手車交易資料 import numpy as np import pan...
資料分析 pandas
pandas是乙個強大的python資料分析的工具包,它是基於numpy構建的,正因pandas的出現,讓python語言也成為使用最廣泛而且強大的資料分析環境之一。pandas的主要功能 具備對其功能的資料結構dataframe,series 整合時間序列功能 提供豐富的數 算和操作 靈活處理缺失...
python資料分析 Pandas
import pandas as pd series 可以看做乙個定長的有序字典。基本任意的一維資料都可以用來構造 series 物件 s pd.series 1,2,3.0,abc s1 pd.series data 1,3,5,7 index a b x y 通過下標獲取資料 s1 a seri...