《資料探勘》組隊學習第四次打卡

2021-10-04 16:22:10 字數 2200 閱讀 6791

一、學習內容

task4-建模調參

線性回歸模型:

模型效能驗證:

嵌入式特徵選擇:

模型對比:

模型調參:

model=linearregression(normalize=true)

model=model.fit(train_x,train_y)

print(『intercept:』,model.intercept_)

print(sorted(dict(zip(continuous_feature_names,model.coef_)).items(),key=lambda x:x[1],reverse=true))

#對標籤進行log變換,使其更接近於正態分佈

train_y_ln=np.log(train_y+1)

2.多種模型比較

from sklearn.linear_model import linearregression

from sklearn.linear_model import lasso,ridge

models=[linearregression(),

lasso(),

ridge()]

result=dict()

for model in models:

model_name=str(model).split(』(』)[0]

scores=cross_val_score(model,x=train_x,y=train_y_ln,verbose=0,cv=5,scoring=make_scorer(mean_absolute_error))

result[model_name]=scores

print(model_name+』 is finished!』)

result=pd.dataframe(result)

result.index=[『cv』+str(x) for x in range(1,6)]

print(result)

3.非線性模型

from sklearn.linear_model import linearregression

from sklearn.svm import svc

from sklearn.tree import decisiontreeregressor

from sklearn.ensemble import randomforestregressor,gradientboostingregressor

from sklearn.neural_network import mlpregressor

from xgboost.sklearn import xgbregressor

from lightgbm.sklearn import lgbmregressor

『』』models=[linearregression(),

decisiontreeregressor(),

randomforestregressor(),

gradientboostingregressor(),

mlpregressor(solver=『lbfgs』,max_iter=100),

xgbregressor(n_estimators=100,objective=『reg:squarederror』),

lgbmregressor(n_estimators=100)]

result=dict()

for model in models:

model_name=str(model).split(』(』)[0]

scores=cross_val_score(model,x=train_x,y=train_y_ln,verbose=0,cv=5,scoring=make_scorer(mean_absolute_error))

result[model_name]=scores

print(model_name+』 is finished!』)

4.模型調參

from sklearn.model_selection import gridsearchcv

parameters=

model=lgbmregressor()

clf=gridsearchcv(model,parameters,cv=5)

clf=clf.fit(train_x,train_y)

print(clf.best_params_)

《機器學習基礎》組隊學習第四次打卡

條件隨機場 馬爾可夫過程 隱馬爾科夫演算法 條件隨機場 以線性鏈條件隨機場為例 實踐 import numpy as np class crf object 實現條件隨機場 問題的維特比演算法 definit self,v,vw,e,ew param v 是定義在節點上的特徵函式,稱為狀態特徵 pa...

第四次打卡

文章目錄 一 批量歸一化和殘差網路 二 凸優化 三 梯度下降 四 目標檢測基礎 五 影象風格遷移 六 影象分類案例1 七 影象分類案例2 八 gan 九 dcgan 十 總結 一 批量歸一化和殘差網路 批量歸一化 1 對全連線層做批量歸一化 2 對卷積層做批量歸 化 3 時的批量歸 化 殘差網路 1...

pandas第四次打卡

第4章 變形 import numpy as np import pandas as pd df pd.read csv data table.csv df.head 一 透視表 1 pivot 一般狀態下,資料在dataframe會以壓縮 stacked 狀態存放,例如上面的gender,兩個類別...