接上篇繼續,記得小時候讀書那會兒,還沒有雙減,每次考試完,大家最關心的就是全班的成績分布,假如有下面一張成績表:
老師們通常很快就會算出『平均分、總分』這些關鍵指標,然後各班之間,就開始攀比:
當然,這些在excel裡用sum/**erage函式,再結合自動填充很容易實現,pandas裡要如何類似統計呢?
import pandas as pd結果:score = pd.read_excel("./data/test.xlsx")
print(score)
# 把各科分數列先取出來
temp = score[['語文', '數學', '科學', '英語']]
print("\n--------各科分數--------")
print(temp)
# 原表上,新增總分、平均分列,並按行統計
score["總分"] = temp.sum(axis=1)
score["平均分"] = temp.mean(axis=1)
print("\n--------每行新增[總分,平均分]--------")
print(score)
# 按列計算平均分
col_**g = score[['語文', '數學', '科學', '英語', '總分', '平均分']].mean()
# 將得到的serial追加到score表
print("\n--------最終結果-------")
print(score)
學號 語文 數學 科學 英語0 張三 85 90 88 92
1 李四 78 86 90 82
2 王五 95 96 89 80
3 趙六 70 75 99 67
4 楊七 95 93 84 91
--------各科分數--------
語文 數學 科學 英語
0 85 90 88 92
1 78 86 90 82
2 95 96 89 80
3 70 75 99 67
4 95 93 84 91
--------每行新增[總分,平均分]--------
學號 語文 數學 科學 英語 總分 平均分
0 張三 85 90 88 92 355 88.75
1 李四 78 86 90 82 336 84.00
2 王五 95 96 89 80 360 90.00
3 趙六 70 75 99 67 311 77.75
4 楊七 95 93 84 91 363 90.75
--------最終結果-------
學號 語文 數學 科學 英語 總分 平均分
0 張三 85.0 90.0 88.0 92.0 355.0 88.75
1 李四 78.0 86.0 90.0 82.0 336.0 84.00
2 王五 95.0 96.0 89.0 80.0 360.0 90.00
3 趙六 70.0 75.0 99.0 67.0 311.0 77.75
4 楊七 95.0 93.0 84.0 91.0 363.0 90.75
5 nan 84.6 88.0 90.0 82.4 345.0 86.25
pandas快速入門筆記
pandas 基於numpy,更強大,可以處理有標籤的資料 serise 帶標籤的一維陣列 import pandas as pd a pd.series 1,2,3,4,5 pd.serise 資料,標籤,型別 print a b pd.series 1,2,3,4,5 a b c d e pri...
pandas資料分析筆記
對df一部分小於等於0的資料設定為nan df df.iloc 1 0 np.nan某列轉換成數值型 df vc1 871eh1 ga03 i1 meas1 prim pd.to numeric df vc1 871eh1 ga03 i1 meas1 prim errors coerce coerc...
如何快速成為APP製作 H5製作高手?
html5是html最新的修訂版本,2014年10月由全球資訊網聯盟 w3c 完成標準制定。html5的設計目的是為了在移動裝置上支援多 html5,簡稱h5.h5的製作,市場上主要有以下幾類公司。1 公關公司 這類公司離客戶最近,他們承接客戶的活動比較多,一般是受客戶要求或主動向客戶推薦h5的方式...