filter:過濾式,先對資料集進行特徵選擇,然後再訓練學習器。
(1)方差選擇法
使用方差選擇法,先要計算各個特徵的方差,然後根據閾值,選擇方差大於閾值的特徵。
(2)相關係數法
使用相關係數法,先要計算各個特徵對目標值的相關係數以及相關係數的p值。
(3)卡方檢驗
經典的卡方檢驗是檢驗定性自變數對定性因變數的相關性。假設自變數有n種取值,因變數有m種取值,考慮自變數等於i且因變數等於j的樣本頻數的觀察值與期望的差距,構建統計量。
(4)互資訊
經典的互資訊也是評價定性自變數對定性因變數的相關性的。
embedded:嵌入式,再學習器訓練的過程中自動的進行特徵選擇。
(1)使用l1,l2正則化項
l1正則化項使解更為稀疏,l2正則化項使解更為平滑。l1懲罰項降維的原理在於保留多個對目標值具有同等相關性的特徵中的乙個,所以沒選到的特徵不代表不重要。可結合l2懲罰項來優化。具體操作為:若乙個特徵在l1中的權值為1,選擇在l2中權值差別不大且在l1中權值為0的特徵構成同類集合,將這一集合中的特徵平分l1中的權值。
參考文獻
1.2.周志華老師的機器學習
物件導向有哪些特徵
物件導向的主要特徵包括抽象 繼承 封裝 多型。抽象就是忽略乙個主題中與當前目標無關的那些方面,以便更充分地注意與當前目標有關的方面。簡單來說就是從眾多的事物中抽取共同的 本質性的特徵,而捨棄其非本質的特徵。例如蘋果 香蕉 生梨 葡萄 桃子等,它們共同的特性就是水果。得出水果概念的過程,就是乙個抽象的...
物件導向有哪些特徵
物件導向的基本特徵有 封裝,繼承,抽象和多型 封裝 封裝是保證軟體部件具有優良的模組性的基礎,封裝的目標就是要實現軟體部件的 高內聚 低耦合 防止程式相互依賴性而帶來的變動影響。在物件導向的程式語言中,物件是封裝的最基本單位,物件導向的封裝比傳統語言的封裝更為清晰 更為有力。物件導向的封裝就是把描述...
特徵選擇方法
特徵獲取過程 特徵獲取定義的角度 特徵獲取要解決的兩個問題 啟發式方法為一種近似演算法,具有很強的主觀傾向。隨機方法是一種相對較新的方法,細分為完全隨機方法和概率隨機方法兩種。總的說來,上述三類中只有窮舉法能保證最優,但耗時並且計算複雜度很高,後兩者以效能為代價換取簡單 快速的實現,但不能保證最優。...