整合學習之 如何進行多樣性增強

2021-09-12 02:01:56 字數 494 閱讀 3020

眾所周知,對於整合學習的基學習器而言,他們的差異性越大,整合之後的效果就越好,那麼,我們怎麼增強不同模型的多樣性呢?

1.樣本擾動:比如bagging中的自助法就是了,由於生成的不同資料集間有一定的不同,所以導致訓練出來的基學習器也有一定的不同。(對於linear、svm、*****_bayes、knn這些對擾動不敏感的基學習演算法效果不大)

2.輸入擾動:對於那些有非常多的屬性,且有大量冗餘屬性的資料集,我們可以用隨機子空間法:從資料集中隨機抽取一些屬性作為子集,然後,依靠這些子集訓練基學習器。(不適合屬性較少或 冗餘屬性較少的資料集)

3.輸出擾動:比如多分類中,講多分類任務轉化為多個二分類任務, 把樣本中的標籤反轉(0—>1, 1—>0)

4.演算法引數 擾動:我們一般會給模型設定初始引數的,初始的引數不同,訓練出來的模型也會不一樣,因此我們還可以調這個老得到多個基學習器。(正常我們也是多次選取初始值訓練得到多個模型,然後選取效果好的乙個,現在只是要把這些效果差一點的模型也利用上,因此不會增加訓練時間)

如何進行Monkey Test

一 簡介 monkey是android中的乙個命令列工具,可以執行在模擬器裡或實際裝置中。它向系統傳送偽隨機的使用者事件流 如按鍵輸入 觸控螢幕輸入 手勢輸入等 實現對正在開發的應用程式進行壓力測試。monkey包括許多選項,它們大致分為四大類 基本配置選項,如設定嘗試的事件數量 執行約束選項,如設...

如何進行Code Review

code review應該怎麼做 如何高效迅速的進行codereview 下面推薦一些 code review 工具 crucible atlassian 內部 審查工具 gerrit google 開源的 git 審查工具 github 程式設計師應該很熟悉了,上面的 pull request 在...

如何進行CodeReview

規範主要分為風格規範與設計規範兩大類 主要是文字上的規定,看似表面文章,實際上非常重要。具體有如下幾個方面 1 縮排 2 行寬 3 斷行 空白行 4 括號 5 命名 字母 下劃線 大小寫 6 注釋 a 單行注釋 b 多行注釋 c 變數 方法 類 包注釋 牽涉到程式設計 模組之間的關係 設計模式等方方...