最近在看《深度學習:基於keras的python實踐(魏貞原)》這本書,書中8.3建立了乙個scikit-learn的pipeline,首先標準化資料集,然後建立和評估基線神經網路模型,**如下:
# 資料正態化,改進演算法
steps =
('standardize'
, standardscaler())
)('mlp'
, model)
)pipeline = pipeline(steps)
kfold = kfold(n_splits=
10, shuffle=
true
, random_state=seed)
results = cross_val_score(pipeline, x, y, cv=kfold)
print
('standardize: %.2f (%.2f) mse'
%(results.mean(
), results.std())
)
而pipeline是什麼來的呢?
轉換器通常與分類器,回歸器或其他估計器組合在一起,以構建復合估計器。最常用的工具是pipeline。pipeline通常與featureunion結合使用,featureunion將轉換器的輸出連線到乙個復合特徵空間中。 transformedtargetregressor處理轉換目標(即對數變換y)。相反,pipelines僅轉換觀察到的資料(x)。
pipeline是使用(key,value)對的列表構建的,其中key是包含要提供此步驟名稱的字串,而value是乙個估計器物件:
函式make_pipeline是構建pipelines的簡寫;它接受不同數量的估計器,並返回乙個pipeline。它不需要也不允許命名估計器。而是將其名稱自動設定為其型別的小寫字母:
Python中sklearn版本的公升級
呼叫sklearn的impute時,發現sklearn中沒有impute的模組。from sklearn.impute import imputer報錯 modulenotfounderror no module named sklearn.impute 經過檢查,發現anaconda中的sklea...
Python安裝sklearn的問題
我使用的安裝源為,推薦使用豆瓣源,挺全的,不過有的可能沒有,我目前需要的基本都能找到 所以總的命令為 pip install i numpy 記住url 後要有空格,然後再輸入numpy 這樣numpy總算順利安裝好了,不過其他小夥伴如果能用pip install numpy方法直接成功安裝的,就不...
sklearn 中的 Pipeline 機制
管道機制在機器學習 演算法中得以應用的根源在於,引數集在新資料集 比如測試集 上的重複使用。管道機制實現了對全部步驟的流式化封裝和管理 streaming workflows with pipelines 注意 管道機制更像是程式設計技巧的創新,而非演算法的創新。接下來我們以乙個具體的例子來演示sk...