2020/6/14 unit6
題目:讀取外部csv格式的資料檔案gdp.csv, 去掉存在缺失資料的那些行,再把剩 餘的資料以csv格式儲存到相同的資料夾中的gdp_new.csv檔案中。
讀取外部csv格式的資料檔案gdp_new.csv,以year為自變數,cpi為因變數 畫圖,線設定為實線,點為實心點,顏色設定為綠色,在縱座標y=1處畫水平 線。新增座標軸標籤,橫座標標籤為「year」,縱座標標籤為「cpi」,圖形 標題為「figure 」,並利用legend新增圖例介紹。
讀取外部csv格式的資料檔案gdp_new.csv,提取前30行資料,以kapital為 自變數,gdp為因變數,畫散點圖,散點大小設定為15,形狀設定為「*」,顏 色設定為紅色。新增座標軸標籤,橫座標標籤為「kapital」,縱座標標籤為 「gdp」,圖形標題為「the scatter figure of gdp and kapital」,橫座標範圍設定 為02000,縱座標範圍設定為08000。
讀取外部csv格式的資料檔案gdp_new.csv,提取cpi,繪製帶有凹槽的箱形 圖,顯示均值並且用線表示,箱體垂直擺放,內部顏色設定為黃色邊框為綠 色,圖形大小設定為寬4高6,箱子下面標籤為「cpi」,整個圖形的標題設為 「the boxplot of cpi」。
讀取外部csv格式的資料檔案gdp_new.csv,提取kr,分別繪製kr的頻數分 布直方圖(bar的個數為6,顏色設定為綠色,x軸標籤為「kr」,圖形標籤為 「frequency」)、頻率分布直方圖(bar的個數為6,顏色設定為紅色,x軸標籤 為「kr」,圖形標籤為「pdf」)和累計分布直方圖(bar的個數為6,顏色設定為 粉色,x軸標籤為「kr」,圖形標籤為「cdf」).
已知某班同學的身高資料,分布在150-160,160-170,170-180和180學生人數 分別為5,28,35,4,繪製有陰影的餅圖,每一塊離開中心距離分別為0, 0.1, 0, 0.1, 顏色分別設定為黃色、綠色、藍色和粉色,每一塊餅圖外側顯示的標籤分別為 「150-160,160-170,170-180,180」,餅圖半徑設定為0.8,從y軸正方向順時針繪製, 餅圖內百分比設定為小數點之後兩位。
**:
import os
os.getcwd(
)os.chdir(
'/users/janine/documents'
)import pandas as pd
# pd.read_csv("gdp.csv")
data0 = pd.read_csv(
"gdp.csv"
)data = data0.dropna(
)# 剩餘的資料以csv格式儲存到相同的資料夾中的gdp_new.csv
data.to_csv(
'/users/janine/documents/gdp_new.csv'
)
data = pd.read_csv(
"gdp_new.csv"
)import matplotlib.pyplot as pl
pl.plot(data[
'year'
],data[
'cpi'
],linestyle=
'-',marker=
'o',c=
'green',label=
'figure'
)pl.axhline(y=1)
# 在縱座標y=1處畫水平線
pl.xlabel(
'year'
)pl.ylabel(
'cpi'
)# 設定橫、縱座標軸名稱
pl.legend(
)# 利用legend新增圖例介紹
pl.show(
)
data = pd.read_csv(
"gdp_new.csv"
)data3 = data[0:30]
import matplotlib.pyplot as pl
x = data3[
'kapital'
]y = data3[
'gdp'
]pl.scatter(x,y,s=15,c=
'r',marker=
'*')
pl.xlabel(
'kapital'
)pl.ylabel(
'gdp'
)# 設定橫、縱座標軸名稱
pl.title(
"the scatter figure of gdp and kapital"
)# 圖形標題
pl.xlim(range(0,2001))
#橫座標範圍設定
pl.ylim(range(0,8001))
pl.show(
)
data = pd.read_csv(
"gdp_new.csv"
)data4 = data[
'cpi'
]# 提取cpi
pl.figure(figsize=
(4,6))
# 圖形大小設定為寬4高6
pl.boxplot(data4, notch=true, labels=
['cpi'
], patch_artist=true, meanline=true, showmeans=true, boxprops =
)pl.title(
"the boxplot of cpi"
)
data = pd.read_csv(
"gdp_new.csv"
)data5 = data[
'kr'
]pl.hist(data5, bins=6, color=
'green'
)pl.xlabel(
'kr'
)pl.title(
'frequency'
)# pdf概率分布圖
pl.hist(data5, bins=6, density=true,color=
'r')
pl.xlabel(
'kr'
)pl.title(
'pdf'
)# cdf累計概率函式
pl.hist(data5, bins=6, density=true, color=
'pink', cumulative=true)
pl.xlabel(
'kr'
)pl.title(
'cdf'
)
x =
[5,28,35,4]
labels=
['150-160','160-170','170-180','180'
]colors=
['yellow','green','blue','pink'
]pl.pie(x, explode=
(0, 0.1, 0, 0.1), labels=labels, colors=colors, shadow=true, startangle=90, radius=0.8, counterclock=false, autopct=
'%1.2f%%'
)
boost常用庫的使用總結
一 多執行緒 1 thread庫相關的,c 多執行緒是乙個複雜的事情,windows mfc提供了cwinthread類,waitforsingleobject等待 執行緒 linux系統提供了createthread,thread join來 執行緒。boost thread就比較方便了 1 bo...
爬蟲常用的requests庫的學習使用
import requests response requests.get print type response print response.status code print type response.text print response.text print response.cooki...
python中json 庫的使用(常用方法)
python 資料結構轉換為 json import json data json str json.dumps data print json 物件 json str 輸出 json 物件 可以將乙個 json 編碼的字串轉換回乙個 python 資料結構,並取指定的值 b json.loads ...