比賽位址
包括了比賽的各種細節、資料等等
我是參考了第一名的方法
特徵+xgboost
第一名的**和思路參考
第一名給出了思路和**但是不夠詳細,有些細節也難以理解,在論壇上找到了一位參考第一名的思路但是實現更加完善的方案
重點劃分:
演算法是通用的、主要難點就是在特徵工程,資料本身字段很少,能夠提取到的特徵很有限(我自己弄了半天的特徵+xgboost試了多次auc都是0.5。哭了 )
首先是簡單的資料清洗、異常值處理、型別單位轉換、資料分析等
第一名的思路利用了視窗,通過時間視窗將資料分為多個訓練和測試集,測試集時間》訓練集
訓練集特徵用到了提取label相關的字段(提取類似消費習慣、付費習慣之類的特徵),測試集不涉及label相關字段,最終的特徵是訓練集和測試集特徵的join,因為是通過之前的消費習慣**未來是否會使用優惠券付費
還有一點有影響的就是調參(這個比較費時)
調參思路:
1、先使用較高的學習率例如0.1並利用xgboost自帶的cv函式來獲得乙個預設引數下樹的個數num_round_best即n_estimators
2、接著獲得決策樹相關的最優引數
3、xgboost正則化(防止過擬合)引數調優
4、降低學習率,獲得理想引數
調參參考
天池直播 O2O大賽冠軍經驗分享
黃偉鵬 天池id和網名都是wepon,在螞蟻金服實習期間花名元逸,參加過多次資料探勘比賽,在天池舉辦的o2o 工業4.0大資料競賽中取得第一名。現就讀於北京大學,研三。1.o2o大賽經驗分享 2.參賽思路及方法 一 最佳分享 截止到11月10日18點,在天池技術圈分享你的 商場中精確定位使用者所在店...
信用卡消費挺進O2O市場
本文講的是信用卡消費挺進o2o市場,在鋪天蓋地的o2o大潮下,幾乎到了 是個網際網路企業都扎堆o2o 的地步,而在不少傳統企業的眼裡,如何利用好手中的 加入到o2o大軍當中則成為了轉型公升級的重要一步。作為所有銀行中與使用者最貼身的產品,信用卡也開始謀求和網際網路企業合作為使用者帶來更多o2o的新玩...
社交O2O的進化
人們對以興趣為目的的社交有著強烈的需求,而移動終端的lbs功能使得o2o式興趣社交愈加便捷。未來o2o式的興趣社交應會成為乙個新的發展方向。以基於lbs功能的興趣社交為代表的社交2.0時代之所以來臨,一方面是使用者對o2o興趣社交的強烈需求 興趣很難改變,並且人們對分享興趣有很強的意願,同時興趣社交...