分析時間序列資料時,按照日期的維度進行統計幾乎是必備的需求。
基於pandas,可以方便的進行各種日期維度(年份,季度,月,周等等)的統計,不用去遍歷每行資料去統計。
每行資料報括日期,國家,城市,地區,銷售額和利潤等字段,我們主要使用日期,銷售額和利潤3個字段。
下面的演示**,我是在 jupyter notebook 中執行的。
import pandas as pd
xlsx_path = "./通訊產品銷售資料.xlsx"
df_year_sales = df_sales[["日期", "地區","銷售額", "利潤"]].copy(deep=true)
df_year_sales.groupby(["日期", "地區"]).sum()
df_quarter_sales = df_sales[["日期", "地區", "銷售額", "利潤"]].copy(deep=true)
df_quarter_sales.groupby(["日期", "地區"]).sum()
df_month_sales = df_sales[["日期", "地區", "銷售額", "利潤"]].copy(deep=true)
df_month_sales.groupby(["日期", "地區"]).sum()
# 周的資料比較多,這裡只取2023年的資料
df_week_sales = df_sales[["日期", "地區", "銷售額", "利潤"]].copy(deep=true)
df_week_sales = df_week_sales[df_week_sales["日期"] > '2019-12-31']
df_week_sales.groupby(["日期", "地區"]).sum().sort_values(["日期"])
pandas 日期比較大小 Pandas日期功能
日期功能擴充套件了時間序列,在財務資料分析中起主要作用。在處理日期資料的同時,我們經常會遇到以下情況 生成日期序列 將日期序列轉換為不同的頻率 建立乙個日期範圍 通過指定週期和頻率,使用date.range 函式就可以建立日期序列。預設情況下,範圍的頻率是天。參考以下示例 import pandas...
Pandas 日期功能
日期功能擴充套件了時間序列,在財務資料分析中起主要作用。在處理日期資料的同時,我們經常會遇到以下情況 通過指定週期和頻率,使用date.range 函式就可以建立日期序列。預設情況下,範圍的頻率是天。參考以下示例 import pandas as pd datelist pd.date range ...
Pandas 統計功能
dataframe 描述性統計和匯 計count 非na值的個數 describe 計算series和dataframe各列的匯 計集合 min max 計算最小值 最大值 argmin argmax 計算最小值與最大值所在的索引位置 整數 idxmin idxmax 計算最小值與最大值所在的索引標...