天池智慧型工業大賽大佬們的思路(需要再看)

2021-08-15 10:14:20 字數 692 閱讀 2734

打醬油參加了天池工業ai大賽1,當然沒拿到獎,看決賽答辯直播時見識到了大佬們的各種思路,真是大開眼界。記錄一下,留給以後參考。

1. 特徵構造

這個是相當重要的

第一名那個女孩子並沒有用什麼高深的方法,但是對特徵挖掘的特別好,並且提到我們可能要 「人工」智慧型,即是人為創造資料。1)通過每個特徵原始值與均值的差異,差異的絕對值構造。2)通過可能特徵的四則運算構造特徵(當然,這是剔除掉部分原有特徵後進行的,否則維度也太大了)。

2. 抗過擬合

由於大家主要使用的是皮爾森相關係數篩選的特徵,那麼確定相關係數(實際使用的是相關係數的絕對值)閾值就尤為重要。有個男孩子發現線下cv值並不隨著閾值線性變化,而是表現出w型的變化趨勢,即mse在兩個閾值的時候都較低。所以,他分別使用這兩個閾值標準篩選得到的訓練資料建模、**,對這兩個模型融合(有可能直接用的平均,我忘記了)。

另外乙個團隊使用了深度學習的方法來做,原理可能是新增隨機雜訊什麼的,具體我又忘記了。

3. 缺失值處理

其中乙個男生使用的確實值處理方法可能有助於提高模型表現,他沒有使用均值或中位數對缺失值進行處理,而是未對缺失值進行填充,使用了允許缺失值存在的xgboost模型。此外,有一些特徵值為「0」的資料經判斷後應該是機器上傳過程中出現了錯誤等,他也把這些轉化為了缺失值。

天池 全球人工智慧技術創新大賽 熱身賽二

day 1 配置執行環境 熟悉baseline torch 1.6.0 torchvision 0.7.0 安裝指令 建立環境 conda create name pytorch 1.6.0 python 3.6conda install torch 1.6.0 torchvision 0.7.0 ...

工業大資料應用的三大挑戰和五大商業趨勢

在裝置執行的過程中,自然磨損本身會使產品的品質發生一定的變化。通過資訊科技 物聯網技術的發展,通過感測器技術,實時感知資料,知道產品出了什麼故障,需要配件,使得生產過程中的這些因素能夠被精確控制,從而真正實現生產的智慧型化。一定程度上,工廠 車間的感測器所產生的大資料直接決定了 工業4.0 所要求的...

第五屆星創師智慧型創業大賽圓滿落幕

9月21日,以 in科技,創未來 為口號的第五屆星創師 智慧型創業大賽圓滿落幕。本屆大賽由新松機械人公司發起,並得到美國機械人產業協會 中國機械人產業聯盟 中國科學院智慧型製造及機械人技術創新與產業化聯盟的指導,星智匯創業孵化平台 啟迪之星 香港科技園作為本次大賽的組委會單位,積極組織並舉辦了本屆大...