我感覺能寫好規則的人都很厲害,有一次拍拍貸的比賽,我隊友乙個規則的成績跑平了lgb的好多模型,直接進入複賽。還是這個隊友在cikm2019大規模推薦比賽中,用自己寫的規則進入前50,差點弄過了我的協同過濾。據我所知拍拍貸的第一可以用規則,機器學習以及nn都達到第一的分數。
第一步: 除以周均值,得到乙個比例。
第二步: 按列取中位數。
**時,以100為base,得到下表
可以使用平均值和中位數,然後將均值和中位數融合。比例按照測試集的表現進行確定。也可以依據與週期的時間距離來賦予不同的權重。
結果=第三週/中位數;直接用最後一周的平均客流量作為base並不一定是最好的方法。也許最後三天或最後五天的均值能更好的反映最新的情況。但是,我們不能直接對最後三天客流量取均值(最後三天是週末,這樣取的base就偏大了)。需要去掉週期性因素後,再取平均。具體做法,就是用客流量除以週期因子。
這樣我們就可以取最後三天的平均,(108+91.4+120)/3=106.5,作為base。具體取多少天的,也要通過測試集的表現來確定。當然也可以按某些函式形式來給每天賦予不同的權重。
時間序列規則
時間序列規則 很多比賽都可基於對背景的理解和資料分析來獲取有用的規則因為可以被當作特徵,簡單高效,可解釋性高。在時間序列的相關比賽中,週期因子可能是更好的方案。對於中位數 臨近資料等簡單統計量可以作為特徵,因為中位數穩健,均值當分布較符合正態分佈時可以使用,臨近資料在 較近的資料可以使用 對於支付資...
八 時間序列
時間序列 datetime.datetime 2011 02 31 產生乙個datetimeindex物件 pd.datetimeindex 時間範圍 pd.date range start 4 1 2012 periods 20 時間戳 pd.timestamp 2011 03 12 04 20 ...
AI 08 時間序列分析
一 時間序列預處理 每個統計學問題都需要進行一定的假設,同樣時間序列 也是 一條時間序列裡長期穩定不變的規律,是基本模型 平穩的基本思想 時間序列的行為並不隨時間改變 不常見 嚴平穩 這是一種比較嚴格的定義,認為只有當序列所有的統計性質都不會隨著時間的推移而發生變化時,該序列才能平穩。而在實踐中要獲...