演算法梳理高階線性回歸 任務一

2021-09-11 12:45:46 字數 932 閱讀 4528

機器學習的一些概念(有監督、無監督、泛化能力、過擬合欠擬合(方差和偏差以及各自解決辦法)、交叉驗證)

用已知某種或某些特性的樣本作為訓練集,以建立乙個數學模型,再用已建立的模型來預

測未知樣本,此種方法被稱為有監督學習

與監督學習相比,無監督學習的訓練集中沒有人為的標註的結果

泛化能力,模型的**能力

線性回歸的原理

回歸演算法是一種比較常用的機器學習演算法,用來建立「解釋」變數(自變數x)和觀

測值(因變數y)之間的關係;從機器學習的角度來講,用於構建乙個演算法模型(函

數)來做屬性(x)與標籤(y)之間的對映關係,在演算法的學習過程中,試圖尋找乙個

函式 使得引數之間的關係擬合性最好

線性回歸損失函式、代價函式、目標函式的概念

(**值-真實值)**2

1/2sum(1到m)(**值-真實值)**2

h(x)=thetade轉置x,即目標線性方程

一元線性回歸的引數求解公式推導

最直接的,解線性方程

最大釋然函式/最小二乘法都可以

多元線性回歸的引數求解公式推導

梯度下降

線性回歸的評估指標有哪些?原理是什麼?

explained_varicance_score:可解釋方差的回歸評分函式

mean_absolute_error:平均絕對誤差

mean_squared_error:平均平方誤差

sklearn引數詳解(sklearn包裡面線性回歸的每個引數的作用)

lr = sklearn.linear_model.linearregression(fit_intercept=true, normalize=false, copy_x=true, n_jobs=1)

fit_intercept截距項

copy_x是否被改寫

n_jobs記憶體執行的一種方式

任務1 線性回歸演算法梳理

1 機器學習的一些概念 1 有監督 訓練資料有標記資訊 2 無監督 訓練資料無標記資訊 3 泛化能力 演算法適用於新樣本的能力 4 過擬合 訓練樣本學得太好,泛化能力不足,通常表現為在訓練集上具有高方差和低偏差 5 欠擬合 訓練樣本學得不好,不是過於密切地跟蹤訓練資料,而是乙個不合適的模型忽略了訓練...

初級演算法梳理 任務1 線性回歸演算法梳理

有監督 無監督 泛化能力 過擬合欠擬合 方差和偏差以及各自解決辦法 交叉驗證 線性回歸的原理 線性回歸損失函式 代價函式 目標函式 優化方法 梯度下降法 牛頓法 擬牛頓法等 線性回歸的評估指標 sklearn引數詳解 機器學習任務包括兩類,有監督的和無監督的,有監督的主要包括分類與回歸,非監督的主要...

線性回歸演算法梳理

機器學習的一些概念 有監督 有目標值y 無監督 無目標值y 泛化能力 在 集上的 能力 過擬合欠擬合 方差和偏差以及各自解決辦法 測試集 能力不好叫欠擬合,在測試集上ok,訓練集ng 方差能解決過你和問題,偏差能解決欠擬合問題 交叉驗證 將樣本分為n分,按照一定的劃分方式劃分訓練集和測試集,互相交叉...