摘要:本文主要介紹線性回歸演算法的定義,公式,回歸實戰。
用來對連續性資料進行**,來確定兩種或者兩種以上變數間的相互關係。
換句話說,它是一種用於資料擬合的工具,從許多資料中找到一條直線能夠擬合含大部分資料,從而可以根據輸入的值**輸出的值。
線性是指擬合的資料是呈線性的,而回歸是指可根據以前的資料**出乙個準確的輸出。
1.訓練模型和**結果
import numpy as np
import pandas as pd
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.linear_model import linearregression
from sklearn.preprocessing import standardscaler
boston = load_boston()
x = boston.data
y = boston.target
train_x,test_x,train_y,test_y = train_test_split(x,y,test_size=0.2,random_state=0)
#資料標準化處理 結果比沒有處理的模型效果差
# stand = standardscaler()
# train_x = stand.fit_transform(train_x)
# test_x = stand.fit_transform(test_x)
lr = linearregression()
lr.fit(train_x,train_y)
result = lr.predict(test_x)
2.模型效能
#模型效能 0.6左右 比較差
from sklearn.metrics import r2_score
ls_sc = r2_score(test_y,result)
print(ls_sc)
3.視覺化資料,這裡顯示實際值和**值的比較折線圖。
import matplotlib
import matplotlib.pyplot as plt
#繪圖#設定畫布大小
4.視覺化資料,使用x的乙個維度,第一張圖取0,第二張圖取1,0和1分別代表不同的特徵;來顯示**結果;紅色的data是訓練集結果,藍色的true是**資料真實值,綠色五角星是模型**值;這裡主要關注藍色和綠色的符合程度,符合度高,模型效果越好。
機器學習演算法之線性回歸
有監督學習 學習樣本為 d xi,yi n i 1 輸出 的結果yi為連續值變數 需要學習對映 y 假定輸入x和輸出y之間有線性相關關係 對於給定的x,其輸出y f x wt x b 可以利用最小二乘法對w和b進行估計 根據自變數個數可以將線性回歸主要分為兩種 一元線性回歸和多元線性回歸。一元線性回...
機器學習演算法 線性回歸
線性回歸應該算機器學習演算法裡面最基礎的演算法了,分別用作回歸 y值為連續值 和分類 y值為離散 在學習線性回歸的過程中,有很多機器學習的概念和方法是在這時候提出的。在現實中變數之間的關係,是有確定的和非確定的。確定關係指的是變數之間可以使用函式關係式表示,非確定的部分我們可以用概率分布來表示,如乙...
機器學習演算法 線性回歸
樣本特徵只有乙個的線性回歸問題,為簡單線性回歸。樣本特徵有多個的線性回歸問題,為多元線性回歸。兩個變數之間的關係是一次函式關係的 圖象是直線,這樣的兩個變數之間的關係就是 線性關係 如果不是一次函式關係的 圖象不是直線,就是 非線性關係 線性回歸演算法將無數的訓練集資料放在乙個座標系中,以座標系的乙...