確認資料是否完整(nan,型別異常)
將string型別,換成category(使用onehot或者labelencoder)
資料標準化(mirmaxscaler或者standardscaler)
儲存資料(因為部分預處理過程會比較耗時,所以需要保留中間結果)
一般來說,越新的模型效果越好
lightgbm 隨機切分驗證集,構建lgb的dataset:上取樣和下取樣(本賽題不適合下取樣,本賽題資料集本身過小)。
開始引數不要用複雜,盡可能保持default。
模型是否符合預期?
線下得分(val auc)和線上成績(test auc)差異大嗎?
需要調整特徵嗎?
程式存在bug嗎?
如果成績不錯,注意保留程式,如果有複賽,需要覆盤。
特徵質量決定分數高度,調參只會讓你逼近這個高度。
相對應的二分模擬賽位址在
福州省賽 二分
題意 給定n個0到m的數字要求找到乙個最長的序列 它們的值必須的遞增或遞減的,不能存在環 其中0可以代替1到m中的任意乙個值,問最長的序列的長度是多少?題解 本來想的是先把零的個數找到,把不是零的數按照從小到大排列,找到合適的位置把零插進入,找到最長的序列,現在發現同乙個數字可能出現多次,排序之後仍...
天梯賽L3 002 特殊堆疊(陣列模擬 二分)
題目鏈結 l3 002 特殊堆疊 30 分 堆疊是一種經典的後進先出的線性結構,相關的操作主要有 入棧 在堆疊頂插入乙個元素 和 出棧 將棧頂元素返回並從堆疊中刪除 本題要求你實現另乙個附加的操作 取中值 即返回所有堆疊中元素鍵值的中值。給定 n 個元素,如果 n 是偶數,則中值定義為第 n 2 小...
NOI模擬 深邃(二分 貪心)
題意 給一棵樹,有 n n 個點,其中 k role presentation k k個關鍵點,求一種分割方案 斷掉一些邊 使得每個聯通塊至少有 1 1 個關鍵點,且使得最大塊最小。題解 二分塊的限制 然後記fi gi role presentation fi,gifi gi表示與 i i 聯通的最...