資料來源:
小練習import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.rcparams[『font.sans-serif』]=[『simhei』] #用來正常顯示中文標籤,否則中文顯示方塊
plt.rcparams[『axes.unicode_minus』]=false #用來正常顯示負號
data_src = "titanic-data.csv"
df = pd.read_csv(data_src,header=0)
print(df)
# print(df.info())
# print(df.describe())
# print(df.head())
#對於少量缺失值的情況,常用的方法是去除和補齊
#對於存在大量缺失值的字段,應衡量此字段的重要程度與修復代價之間的權重
#計算存活率
survived_rate = float(df["survived"].sum()) / df["survived"].count()
print(survived_rate)
#船艙位和存活率的關係
x =
y =
# print(df[(df.pclass==1)]["pclass"])#取pclass=1列人數
x1 = df[(df.pclass==1)]["pclass"].size
x2 = df[(df.pclass==2)]["pclass"].size
x3 = df[(df.pclass==3)]["pclass"].size
# print(x)
#計算各船艙存活人數
#分類計算存活率
pclass_survived_rate = (df.groupby(["pclass"]).sum() / df.groupby(["pclass"]).count()) ["survived"]
# print(pclass_survived_rate)
pclass_survived_rate.plot(kind="bar")
# plt.bar(x=[1,2,3],height=pclass_survived_rate,color="lightgreen")
# plt.text(x+0.05,y+0.05,ha="center")#加標籤---失敗
plt.title("各船艙生存率")
plt.show()
print("################################")
#一等艙存活率高
#性別的影響
***_survived_rate = (df.groupby(["***"]).sum() / df.groupby(["***"]).count()) ["survived"]
***_survived_rate.plot(kind="bar")
plt.title("性別影響")
#哪個年齡段存活率高
age_survived_rate = (df.groupby(["age"]).sum() / df.groupby(["age"]).count()) ["survived"]
age_survived_rate.plot()
plt.title("年齡&存活率關係")
#年齡中有未知的,先進行資料清洗
# print((df['age']).count())
age_clean_date = df[~np.isnan(df["age"])]#去掉age為空的行
# print(age_clean_date["age"])
ages = np.arange(0,81,5)
age_cut = pd.cut(age_clean_date.age,ages)
age_cut_grouped = age_clean_date.groupby(age_cut)
age_survived_rate = (age_cut_grouped.sum()/age_cut_grouped .count()) ["survived"]
age_survived_rate.plot(kind="bar")
plt.title("各年齡段存活率")
plt.show()
#結果發現老人和小孩存活率較高,常識!
#多因素影響
pclass_***_survived_rate=(df.groupby(['***','pclass']).sum()/df.groupby(['***','pclass']).count())['survived']
pclass_***_survived_rate.plot(kind='bar')
plt.title('性別和船艙位與存活率關係')
plt.show()
#生死關頭也要保持紳士風度!!
python小專案一 NBA比賽資料分析
該專案 於實驗樓,我這裡只是記錄下自己做完專案的筆記和總結 實驗樓是py2的 我則是用的py3 專案目的 通過分析之前的比賽資料,得到每個隊伍的狀態的特徵表達,利用機器學習訓練回歸模型,從而對新的比賽進行 為了掌握並實現這個專案,需了解一下幾個問題 1.如何讀取資料夾中的資料?答 這個專案的資料儲存...
經典python基礎小專案練習
3.公升級題 實現乙個整數加法計算器 多個數相加 如 content input 請輸入內容 使用者輸入 5 9 6 12 13,然後進行分割再進行計算。content input 請輸入內容 print content listvar content.split print listvar res...
while 小專案練習
1 用雙層while 寫十行十列小星星 j 0 while j 10 列印一行十個小星星 i 0 while i 10 print end i 1 列印換行 print j 1 2 用雙層while 寫十行十列隔列換色小星星 變數i控制的是列 j 0 while j 10 列印一行十個小星星 變數i...