step 1 資料預處理
import pandas as pd
from sklearn.model_selection import train_test_split
dataset = pd.read_csv('studentscores.csv')
x = dataset.iloc[ : , : 1 ].values
y = dataset.iloc[ : , 1].values
x_train, x_test, y_train, y_test = train_test_split(x,y,test_size=1/4,random_state=0)
step 2 利用簡單線性回歸模型訓練
我們使用sklearn.linear_model庫中的linearregression類的fit()方法,將regressor物件對資料集進行訓練。
from sklearn.linear_model import linearregression
regressor = linearregression()
regressor = regressor.fit(x_train, y_train)
step 3 **結果
**測試集的觀察結果,將輸出儲存至y_pred。
我們利用linearregression類的**方法進行**。
y_pred = regressor.predict(x_test)
step 4 視覺化
我們使用matplotlib.pyplot庫對我們的訓練集結果和測試集結果繪製散點圖。
plt.scatter(x_train , y_train, color = 'red')
plt.plot(x_train , regressor.predict(x_train), color ='blue')
plt.show()
plt.scatter(x_test , y_test, color = 'red')
plt.plot(x_test , regressor.predict(x_test), color ='blue')
plt.show()
參考鏈結
100-days-of-ml-code
機器學習回歸篇 簡單線性回歸
之前的幾篇裡面講了機器學習分類問題的一些演算法,下面幾篇來講一下回歸問題。回歸問題和分類問題有什麼區別呢?分類問題 的結果是一些類別值,比如說,顏色類別,電腦品牌,有無信譽等。回歸問題 的是連續型的數值,如房價,人數,降雨量等等 生活中我們做決定的過程通常是根據兩個或多個變數之間的關係,解決回歸問題...
機器學習線性回歸 機器學習中的簡單線性回歸步驟
簡單線性回歸,這是一種基於自變數值 x 來 因變數值 y 的方法。假設這兩個變數是線性相關的。因此,我們嘗試尋找一種根據特徵或自變數 x 的線性函式來精確 響應值 y 我們將按照之前的資料預處理資訊圖表那樣來執行相同的步驟 其中第三相關庫matplotlib是用來視覺化資料的。匯入資料集 檢查缺失資...
機器學習(1) 簡單線性回歸
coding utf8 import numpy as np import matplotlib as mpl import matplotlib.pyplot as plt from matplotlib.font manager import rebuild rebuild mpl.rcpara...