第乙個是使用相關係數來進行度量,相關係數越高,表明我們的特徵和目標變數越相關。
第二個是使用統計學當中的一些知識來進行檢測。sklearn中的selectkbest可以幫助我們完成特徵選擇的任務。常見的有卡方檢測、方差檢測等。 還有一些比如p值等。
第三個是使用基於模型的特徵選擇方法。sklearn中的selectfrommodel可以和模型一起使用。基本上分兩種,一種是使用樹形結構,比如決策樹和隨機森立,它們的模型裡面有乙個feature_importances_的屬性,可以檢視特徵的重要程度,另外一種是回歸模型,如線性回歸和svm,它裡面有coef_ 屬性,可以看模型的重要程度。
使用前兩種方法是首先看特徵是否相關,然後再運用到模型當中。而使用第三種方法是先建立模型,把特徵運用進去,然後看哪種特徵相關。
那麼在進行模型選擇的時候如何挑選合適的方法哪?下面是一些指導原則:
如果你的屬性大多是分類型別,那麼這個時候選擇統計檢測或者是樹模型。
如果你的屬性大多是數值型別,那麼使用相關係數或者線性模型。
如果你嘗試解決乙個二分類問題,使用svm是乙個不錯的選擇。
第五章總結
5.1選單 選單是windows應用程式視窗的乙個非常重要的組成部分,視窗的選單欄一般在標題欄下面。這個選單通常稱為 主選單 5.1.1建立和程式設計選單 選單用於sdi 單文件介面 或mdi 多文件介面 以及基於對話方塊的應用程式,在基於對話方塊的應用程式中新建 設計並編輯選單後,在該對話方塊的 ...
第五章總結
1事務特點 原子,隔離,一致,永久 轉帳測試 張三轉賬1000元給李四 我們可能會這樣這樣編寫語句 張三的帳戶少1000元,李四的帳戶多1000元 update bank set currentmoney currentmoney 1000 where customername 張三 update ...
第五章總結
兩個約定 約定符號 表示暫存器或者乙個記憶體單元的內容,如 ax 表示ax中內容,bx 表示bx內容,20000h 表示記憶體20000h單元的內容。約定符號idata表示常數。如mov ax,bx 就是把ds bx處的值賦值給ax loop指令 格式 loop 標號 標號有些類似在c語言中goto...