資料探勘學習基於最小二乘法的線性回歸演算法

資料探勘學習–基於最小二乘法的線性回歸演算法（演算法理論知識）

1.前言

2.回歸演算法

關於回歸演算法，和在資料探勘中的分類演算法有著如出一轍的功能，但是他們之間為何不是同一樣東西呢，原因就是分類演算法解決的資料是離散的屬性，也就是他們的訓練資料和待分類資料是離散的。而面對連續屬性的資料，分類演算法顯得不那麼恰當了。自然就想到了使用線性回歸的方法，將可能會出現連續屬性的資料回歸到一條直線方程或者是超平面上，也達到了進行分類**的目的。

2.最小二乘法

關於最小二乘法，這是一種數學方法，又稱做是最小平方法。這種數學方法是利用最小化實際值與預計值（選擇的一條回歸直線或回歸超平面）之間的誤差，從而得到一條更優的回歸直線方程。通過最小化誤差（擬合誤差或者總殘差）得到回歸性更強，**更加準確的回歸方程。

3.最小二乘法應用的推導過程

我們現有的訓練資料（使用訓練資料建模），訓練資料假設為最簡單的二元組（x1,y1,x2,y2,…,xn,yn），同時也假設這些訓練資料點都比較靠近一條直線 y = ax + b，而由於有訓練資料即可以進行總殘差即擬合誤差計算：

通過將這個總殘差最小化，由此就可以計算出引數a，b，進而得到具有回歸效能的直線方程：y = ax + b，達到了由訓練資料建立回歸模型進而解決實際問題的乙個模式。

在最小化擬合誤差的過程中，我們實際的目標是要得到更加優化的引數a和b，而就相當於這是乙個二元函式，二元就是兩個未知數a，b，那麼求二元函式極值就聯絡到了用偏導數為0來求：

即：

這樣就是達到了（利用訓練資料計算模型引數a，b）的目標。

資料探勘學習 基於最小二乘法的線性回歸演算法

最小二乘法

最小二乘法

最小二乘法

相關推薦

資料探勘學習基於最小二乘法的線性回歸演算法