def lgb_model(x_train, y_train, x_test):
lgb_train, lgb_test = cv_model(lgb, x_train, y_train, x_test, "lgb")
return lgb_train, lgb_test
def xgb_model(x_train, y_train, x_test):
xgb_train, xgb_test = cv_model(xgb, x_train, y_train, x_test, "xgb")
return xgb_train, xgb_test
def cat_model(x_train, y_train, x_test):
cat_train, cat_test = cv_model(catboostregressor, x_train, y_train, x_test, "cat")
return cat_train, cat_test;
看了baseline之後才發現自己一直在踩坑,發現自己一直寫的都是bug的感覺,看baseline的**賞心悅目,感覺自己差距很大,希望自己好好加油。 資料探勘第二週週報
由於我們得到的資料集是經過處理的比較規整的資料,所以上面的步驟可以簡單一下 1,匯入標準庫 importing the libraries import numpy as np import pandas as pd import matplotlib.pyplot as plt data trai...
資料探勘第六周週報
w np.ones cols initial all weight with 1 count 0 while true count 1 iscompleted true for i in range 0,length x dataset i print x print x y np.dot w,x ...
資料探勘第四周週報
得到了不是0.5的結果,說明神經網路的作用還是有的,但是在經過對於迭代次數的改變和訓練集的改變以後,還是沒有能優化到乙個更好的結果,於是乎我在考慮是不是應該回過頭對特徵工程進行進一步的處理,這一周的後幾天我都是在處理資料集的特徵,在知乎和谷歌的幫助下,我對很多的降維方法進行嘗試,有什麼低方差過濾 預...