【測評函式(單變數)】
波士頓房產資料(只使用房間數量這個特徵)
資料切分(train_test_split)
mse、mae、rmse、r2_score
import pandas as pd
import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import standardscaler
from sklearn.linear_model import linearregression
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.3) #劃分資料集
scaler = standardscaler() #作用:去均值和方差歸一化。可儲存訓練集中的均值、方差引數,然後直接用於轉換測試集資料。
x_train = scaler.fit_transform(x_train)
x_test = scaler.fit_transform(x_test)
from sklearn import metrics
from sklearn.metrics import r2_score
from sklearn.metrics import mean_squared_error
from sklearn.metrics import mean_absolute_error #平方絕對誤差
linreg = linearregression()
model = linreg.fit(x_train,y_train)
print(「mse均方誤差:」,mean_squared_error(y_train,model.predict(x_train)))
print(「rmse均方根誤差:」,mean_squared_error(y_train,model.predict(x_train)) ** 0.5)
print(「mae平均絕對誤差:」,mean_absolute_error(y_train,model.predict(x_train)))
print(「r2_score決定係數:」,r2_score(y_train,model.predict(x_train)))
結果:mse均方誤差: 22.343758172268284
rmse均方根誤差: 4.72691846473665
mae平均絕對誤差: 3.3216661028196164
r2_score決定係數: 0.7459490346981561
任務三 XGB演算法梳理
cart樹 cart是決策樹演算法之一,它可用於分類問題也可用於回歸問題。它與id3 c4.5等演算法不同的是,在節點分支的時候,它每次僅分成左 右兩個節點,即它假設決策樹是二叉樹。另外,它在選擇最優分割變數與最優分割點的準則也有所不同 演算法原理 cart樹的生成就是遞迴地構建二叉決策樹的過程。對...
演算法梳理高階線性回歸 任務一
機器學習的一些概念 有監督 無監督 泛化能力 過擬合欠擬合 方差和偏差以及各自解決辦法 交叉驗證 用已知某種或某些特性的樣本作為訓練集,以建立乙個數學模型,再用已建立的模型來預 測未知樣本,此種方法被稱為有監督學習 與監督學習相比,無監督學習的訓練集中沒有人為的標註的結果 泛化能力,模型的 能力 線...
初級演算法梳理 任務1 線性回歸演算法梳理
有監督 無監督 泛化能力 過擬合欠擬合 方差和偏差以及各自解決辦法 交叉驗證 線性回歸的原理 線性回歸損失函式 代價函式 目標函式 優化方法 梯度下降法 牛頓法 擬牛頓法等 線性回歸的評估指標 sklearn引數詳解 機器學習任務包括兩類,有監督的和無監督的,有監督的主要包括分類與回歸,非監督的主要...