自動機器學習框架之二 AutoML

2021-09-16 23:07:38 字數 1031 閱讀 7891

auto ml(auto machine learning)自動機器學習是個寬泛的概念,有不只乙個軟體以此命名,本篇介紹的auto-ml並非谷歌基於雲平台的 automl。本篇介紹的auto-ml也是一款開源的離線工具,它的優勢在於簡單快速,且輸出資訊比較豐富。它預設支援keras、tensorflow、xgboost、lightgbm 、catboost和 sklearn等機器學習模型,整體使用進化網格搜尋的方法完成特徵處理和模型優化。

auto-ml安裝方法如下:

$ pip install auto-ml
$ git clone
本例也使用96年美國**資料,將」投票vote」作為因變數,它有只0/1兩種取值,因此使用分類方法type_of_estimator=』classifier』,訓練時需要用字典的方式指定各欄位型別:其中包括:因變數output,分型別變數categorical,時間型變數date,文字nlp,以及不參與訓練的變數ignore。

from auto_ml import predictor

import statsmodels.api as sm

data = sm.datasets.anes96.load_pandas().data

column_descriptions =

ml_predictor = predictor(type_of_estimator='classifier',

column_descriptions=column_descriptions)

model = ml_predictor.train(data)

model.score(data, data.vote)

# 謝彥技術部落格

程式的輸出較多,不在此列出,相對auto-sklearn,auto-ml的輸出內容豐富得多,包含最佳模型,特徵重要性,對**結果的各種評分,建議讀者自行執行上述例程。由於它同時支援深度學習模型和機器學習模型,可使用深度學習模型提取特徵,用機器學習模型完成具體的**,從而得到更好的訓練結果。

自動機器學習框架之一 Auto Sklearn

當我們做完了特徵工程之後,就可以代入模型訓練和 對於模型的選擇及調參,主要根據分析者的經驗。在具體使用時,經常遇到同一批資料,同一種模型,不同的分析者得出的結果相差很多。前面學習了幾種常用的機器學習方法原理以及適用場景,對於完全沒有經驗的開發者,只要有足夠時間,嘗試足夠多的演算法和引數組合,理論上也...

自動機器學習框架之三 Auto Keras

對於訓練深度學習,設計神經網路結構是其中技術含高最高的任務,優秀的網路架構往往依賴建構模型的經驗,專業領域知識,以及大量的算力試錯。實際應用中往往基於類似功能的神經網路微調生成新的網路結構。auto keras是乙個離線使用的開源庫,用於構建神經網路結構和搜尋超引數,支援rnn,cnn神經網路,它使...

自動機器學習簡述(AutoML)

一 為什麼需要自動機器學習 二 超引數優化 hyper parameter optimization 三 元學習 meta learning 四 神經網路架構搜尋 neural architecture search 五 自動化特徵工程 六 其它自動機器學習工具集 對於機器學習的新使用者而言,使用機...