綜合實訓週報七

2021-10-10 10:49:23 字數 451 閱讀 7136

本次理論學習重點在於重新回顧並梳理了這次學習賽的流程,並總結了資料探勘的一般過程與常見手法。為之後進一步的學習打好基礎。

本次賽題可分為賽題理解、資料分析、特徵工程、建模調參、模型融合等幾個過程。其中我把重點放在了特徵值的選擇上。如何對資料進行處理已經選擇合適的特徵值是比較重點在意的地方,其次是選擇合適的模型進行分析。

另外,我也了解了模型融合這一部分的內容。模型融合可以更好地提高準確率,往往是在資料探勘收尾時使用。將之前建模調參的結果進行模型融合, 嘗試多種融合方案,提交融合結果。

最後,還對新的大作業比賽的進行學習,大致了解了賽題等基本情況。

本週重點放在了對新比賽的資料分析上,對於這次學習賽則沒有花費過多時間,所以相比上次而言成績沒有發生太大的變化。

本週得到的成績如圖所示。

綜合實訓週報一

本週的理論學習主要在於學習資料探勘相關的知識,由於本人之前並沒有上過 資料探勘導論 這門課程,導致有許多的知識點都並不了解。所以本週的主要任務就是將資料探勘大概流程,所需要用到的知識大致的過了一遍。實踐學習本週主要是將該練習賽的內容看了一遍,了解了比賽相關的學習資料。之後嘗試進行相應操作,主要是進行...

綜合實訓週報六

本週主要是在之前已經了解了許多相關模型和演算法的基礎之下,進一步學習不同的模型對比與效能評估。邏輯回歸。其優點在於訓練速度較快,分類的時候,計算量僅僅只和特徵的數目相關 簡單易理解,模型的可解釋性非常好,從特徵的權重可以看到不同的特徵對最後結果的影響 適合二分類問題,不需要縮放輸入特徵 記憶體資源占...

綜合實訓週報三

本週的理論學習主要學習了特徵選擇相關的知識。特徵選擇技術可以精簡掉無用的特徵,以降低最終模型的複雜性,它的最終目的是得到乙個簡約模型,在不降低 準確率或對 準確率影響不大的情況下提高計算速度。特徵選擇不是為了減少訓練時間 實際上,一些技術會增加總體訓練時間 而是為了減少模型評分時間。有如基於特徵間的...