sklearn中的學習曲線函式可以幫到我們。它可以讓我們通過資料點來了解模型表現的好壞。
可以先引入這個模組
from sklearn.learning_curve import learning_curve # sklearn 0.17
from sklearn.model_selection import learning_curve # sklearn 0.18
文件中乙個合理的實現是:
learning_curve(
estimator, x, y, cv=cv, n_jobs=n_jobs, train_sizes=train_sizes)
這裡estimator
是我們正在用來**的模型,例如它可以是gaussiannb()
,x
和y
是特徵和目標。cv
是交叉驗****,例如kfold()
,'n_jobs'是平行運算的引數,train_sizes
是多少數量的訓練資料用來生成曲線。 機器學習 學習曲線
檢視模型的學習效果 通過學習曲線可以清晰的看出模型對資料的過擬合和欠擬合 len x train 個訓練樣本,訓練出 len x train 個模型,第一次使用乙個樣本訓練出第乙個模型,第二次使用兩個樣本訓練出第二個模型,第 len x train 次使用 len x train 個樣本訓練出最後乙...
機器學習筆記 學習曲線的繪製
重點總結 來看看在神經網路上的應用 如何你要檢查演算法執行是否正常或者希望優化演算法的表現那麼就需要一款工具來實現,學習曲線就是乙個很好的工具。同樣的,使用學習曲線可以檢查出演算法是處於偏差問題還是方差問題,或者是二者皆有!先來看看資料樣本數量與誤差之間的關係,通過下圖看一下 在右側,可以看到,當樣...
sklearn機器學習之 學習曲線
本文精髓源自b站 莫煩python 系列教程 適用於python3版本,相應第三方庫建議公升級至最新版本 下面展示兩種學習曲線的繪製方法 sklearn.learning curve 中的 learning curve學習曲線 可以很直觀的看出我們的 model 學習的進度,對比發現 有沒有over...