最近在學機器學習,利用自己的資料,在分割訓練集和資料集時會採用隨機種子,但是設定的種子數值不一樣時,會產生結果偏差過大的影響。例如seed=1時,score結果為70%,而seed=666時,結果只為40%,這種情況我應該以哪乙個結果為準呢?
x_train, x_test, y_train, y_test = train_test_split(x, y,test_size=0.2, random_state=1)
poly_reg.score(x_test,y_test)
out:0.7493216782658907
x_train, x_test, y_train, y_test = train_test_split(x, y,test_size=0.2, random_state=666)
poly_reg.score(x_test,y_test)
out:0.4421265961709441
或者有沒有可能是因為資料量太小,導致產生的偏差過大。
我用的資料為(79,4),演算法為多項式回歸。
python和torch定義隨機種子
在測試集上評估網路模型時,由於載入資料打亂是隨機的,每次得到的結果都會有所出入,雖然大多數時候相差不大,但也會出現r2和accuracy上下會波動一兩個點的情況,這讓我們無法有乙個準確且相對固定的指標去保留網路引數。還有在訓練網路後期還想完全復現效果時,加入隨機種子固定隨機引數都是乙個不錯的選擇。d...
pyhton 小白問題求助python 3 6
pyhton 小白問題求助 剛開始學python,對著一本書在學,但是遇到一些問題,由於書上的python版本與我用的版本不一樣,造成編輯出來的程式有問題,請大神幫檢查下問題在 謝謝!import re import json def parser url self,page url,respons...
關於隨機種子seed 的一點理解
import numpy as np num 0 while num 5 np.random.seed 1 print np.random.random num 1 print num1 0 np.random.seed 2 while num1 5 print np.random.random n...