1、特徵工程
在初賽時候我們發現one-hot的特徵和我們的統計特徵差異性很大, 所以我們在自己近百維的統計特徵上直接加入了one-hot的特徵,帶來了7個千左右的提高,而我們的統計特徵為了防止資訊洩露都是採用5-fold的方式提取的。而在複賽的時候因為資料量的大量增加,one-hot特徵已經無法使用,這導致我們的lgb模型在複賽的時候降了8個千。
2、模型選擇
初賽時我們一共訓練了三種模型,分別是lgb,deepfm,deepffm,其中lgb分數最高,並通過簡單的加權平均得到了不錯的分數,而在複賽時,我們發現deepffm的視訊記憶體消耗有點大,直接導致oom,我們嘗試減小deepffm中向量的維度,但是太小之後效果又很差,最後只能放棄,在損失了one-hot特徵的lgb模型和deepfm模型融合之後大概能在複賽到757的成績,比初賽大概少了8個千左右。
3、後期工作
在複賽中我們遇到了記憶體與視訊記憶體的困境,機器是一方面原因,另一方面還是設計的模型在大資料環境下的不適用,我們覺得在複賽的資料量中,nn模型將有很大的優勢,一方面nn模型訓練時間短,另一方面大資料本身就對nn模型有利。在傳統基於人工特徵的樹模型無力的情況下,只能去優化nn模型。
最後,祝願大家比賽玩的開心並能取得好成績。
幹啥啥不行,吃飯第一名
幹啥啥不行,吃飯第一名。2020年11月6號,中午從實驗室出來後,就屁顛屁顛的往食堂去了,結果讓我體會到了比如鯁在喉更甚的痛苦,這種感覺或許只有真正切身體會的人才能感受到吧。本來,今天上午是有課的,結果我給翹掉了,難不成這是給我的懲罰麼?像taoye這麼帥氣,隨便找個有口罩的路人借乙個應該不難吧,這...
最貴iPhone應用TOP10 第一名售價近千美元
不過iphone應用商店也擁有許多售價昂貴的應用,其中最貴的一款售價高達899.99美元.儘管售價昂貴,但消費者仍然會購買這些應用。ira pro並不是iphone應用商店售價最高的應用.大約在一年之前,一名德國開發者開發了一款最貴iphone應用top10,售價高達999.99美元.由於存在很大爭...
為什麼SEO不能保證排名第一名
經常碰到客戶問 谷歌排到第一多少錢,我耐心的解釋無法程式設計客棧保證第一的原因,最後客戶以保持懷疑的態度關閉了與我的對話,我想有必要寫一下這方面的東西了。排名第一是多麼誘人的商業口號,意味著源源不斷的商機和知名度,許多商家為了提高客戶的信任度,會刻意的說公司 在搜尋引擎中排名如何的好。但隨著搜尋引擎...