我參加天池大賽一半是為了練習機器學習,一半是因為好玩。因為工作、家庭的事情都很多,時間很難保證,為了不坑隊友,所以到現在比賽都是solo,自娛自樂。因為可用時間少,又是乙個人solo,所以閉門造車、走到溝裡出不來也都是常有的事。
第乙個比賽是ijcai-17 口碑商家客流量**,那個時候剛好看了時序的一些東西,覺得r語言的auto.arima很不錯,於是就把r語言關於時序的包都調了乙個遍,然後又是一頓亂七八糟的融合。我的筆記本配置不好,跑arima溫度都高的不行,正好我當時還有乙個1c2g的ecs(半年試用送的),我決定就是它了。於是在這個虛機上裝了r和python的環境,在上面跑各種演算法,很長一段時間這個虛機的cpu一直是100%。而且這個比賽,因為一直沒有走到正路上,所以結果也就毫無懸念的撲街了。
第二個比賽是阿里聚安全演算法挑戰賽,因為是平台賽,不用自己的計算資源,而且主要的處理介面都是跑的sql,所以玩的十分快樂。印象比較深的是第一題找了幾個規則,結果比演算法做的結果好很多,幾個規則就搞到了62.37分。最後總成績35名。
第三個好像是cikm,當時在看了題目,並用python把雲圖畫出來之後,我覺得這個應該用卷積神經網路來做,可以先按照影象處理一下。可是我只有乙個破筆記本,沒有什麼gpu,看了一下資料量感覺別說跑不了神經網路,就算是跑一般的機器學習演算法也要熱的宕機。本來想放棄來著,後來轉念一想何不自我挑戰一下用傳統的機器學習來做一下這道題。於是繼續操練那個1c2g的ecs。我提取了包括時序,和每張雲圖的各種特徵,跑了gbdt,rf,xgb,arima等各種演算法,並進行了融合。也看了一些使用機器學習**降雨量的**及python關於天氣的一些包和演算法,不過這些很多需要風,前期降雨量等一些我沒有的資料,所以也沒有怎麼用(後來看了冠軍的講解,發現這些東西都是可以通過分析得)。做了幾天成績做到14.15,後續就不動了,我感覺傳統演算法差不多也就這個樣了,也就不再做了,最後是55名。
然後因為比較忙,所以後面的幾個比賽,如第kdd cup 2017,大航杯「智造揚中」電力ai大賽,全國社會保險大資料應用創新大賽 什麼都是打醬油了,基本上都是扔了成績就走的。
過了年之後就是阿里聚安全演算法挑戰賽,這個比賽因為又是平台賽,所以決定全力做一下。具體解題思路,可以看一下我的這個帖子:
可能是因為題目比較適合我吧,經過初賽,複賽,24小時決賽,最後得了乙個季軍(三等獎),感覺還是滿開心的。
我其實每個比賽投入的精力都比較有限,如何用非常有限的時間和精力取得較好成績,我有一些不算是經驗的經驗吧,放在這算是拋磚引玉吧。
1,理解業務、資料,科學的資料視覺化處理對於理解資料有很大的幫助。
2,抓住要點,建立基線,快速迭代。再複雜的問題總有一些簡單的處理方法,先把它做出來,投石問路。
3,查詢資料,借鑑前人經驗。
4,做好規劃,合理安排時間,長短期結合,多種方案、模型並行
5,前期要腦洞大開,多多嘗試。後期要精細打磨,精益求精。
6,整理文件,做好記錄,磨刀不誤砍柴工,做好總結,不斷提公升。
7,在總結之外還有分享,交流,分享、交流在幫助別人的同時也可以讓自己更快、更加深入的掌握這項技術。
8,最後是由乙個好的心態,成績不論如何,自己有學到新東西,自己開心就好。
天池直播 O2O大賽冠軍經驗分享
黃偉鵬 天池id和網名都是wepon,在螞蟻金服實習期間花名元逸,參加過多次資料探勘比賽,在天池舉辦的o2o 工業4.0大資料競賽中取得第一名。現就讀於北京大學,研三。1.o2o大賽經驗分享 2.參賽思路及方法 一 最佳分享 截止到11月10日18點,在天池技術圈分享你的 商場中精確定位使用者所在店...
分享記錄我的Linux系統入門學習經驗
人生很多事情都是巧合,或者說命中註定。就拿linux於我來說,大學期間也修了linux基礎這門課,但是從來沒有想到自己會從事與linux相關的工作,更沒有想過自己可以通過linux獲取更多的東西。畢業之後,我義無反顧的選擇了linux運維作為自己工作的起點,這個想法也是實習期間就萌生的,因為既然都學...
分享記錄我的Linux系統入門學習經驗
人生很多事情都是巧合,或者說命中註定。就拿linux於我來說,大學期間也修了linux基礎這門課,但是從來沒有想到自己會從事與linux相關的工作,更沒有想過自己可以通過linux獲取更多的東西。畢業之後,我義無反顧的選擇了linux運維作為自己工作的起點,這個想法也是實習期間就萌生的,因為既然都學...