學習參考:
現有乙份關於美國非法藥物的資料集,其中substancename, drugreports分別指藥物名稱和報告數量:
將資料轉為如下的形式:
將第1問中的結果恢復為原表。
按state
分別統計每年的報告數量總和,其中state, yyyy
分別為列索引和行索引,要求分別使用pivot_table
函式與groupby+unstack
兩種不同的策略實現,並體會它們之間的聯絡。
#1、轉換資料框
#2、將第1問中的結果恢復為原表。
df2 = df1.melt(id_vars =
['state'
,'county'
,'substancename'],
value_vars = df1.columns[3:
],var_name =
'yyyy'
, value_name =
'drugreports'
).dropna(subset =
['drugreports'])
.astype(
)df2 = df2.sort_values(
['state'
,'county'
,'substancename'
],ignore_index=
true
).reindex_like(df)
df2.equals(df)
# true
#3.按state分別統計每年的報告數量總和,其中state, yyyy分別為列索引和行索引,要求分別使用pivot_table函式與groupby+unstack兩種不同的策略實現,並體會它們之間的聯絡。
#(1)使用pivot_table函式
#(2)使用groupby+unstack,這個方法沒有想出來,答案的做法是:
python第五章 Python學習(第五章)
記錄所有的名片字典 card list defshow menu 顯示資訊 print 50 print 歡迎使用 名片管理系統 v1.0 print print 1.新增名片 print 2.顯示全部 print 3.搜尋名片 print print 0.退出系統 print 50 defnew ...
第五章 雜湊
雜湊表adt,只支援二叉樹查詢所允許的一部分操作。比如插入,刪除,查詢等。那些需要元素間排序資訊的操作將不會得到支援。比如findmin,findmax和線性時間按排序順序列印整個表的操作時不支援的。雜湊函式在理想狀態是能將任何兩個不同的關鍵字對映到不同的單元,但是這是不可能,因為關鍵字是無窮的,但...
第五章 函式
第五章 函式 1 函式的定義 shell函式定義可以放在 bash profile 檔案中,也可以在使用該函式的指令碼中,還可以在命令列中 通過 source 或 執行bash profile檔案,使修改能夠立即生效 function 函式名 declare f 顯示定義的函式清單 export f...