機器學習的一些概念(有監督、無監督、泛化能力、過擬合欠擬合(方差和偏差以及各自解決辦法)、交叉驗證)
用已知某種或某些特性的樣本作為訓練集,以建立乙個數學模型,再用已建立的模型來預
測未知樣本,此種方法被稱為有監督學習
與監督學習相比,無監督學習的訓練集中沒有人為的標註的結果
泛化能力,模型的**能力
線性回歸的原理
回歸演算法是一種比較常用的機器學習演算法,用來建立「解釋」變數(自變數x)和觀
測值(因變數y)之間的關係;從機器學習的角度來講,用於構建乙個演算法模型(函
數)來做屬性(x)與標籤(y)之間的對映關係,在演算法的學習過程中,試圖尋找乙個
函式 使得引數之間的關係擬合性最好
線性回歸損失函式、代價函式、目標函式的概念
(**值-真實值)**2
1/2sum(1到m)(**值-真實值)**2
h(x)=thetade轉置x,即目標線性方程
一元線性回歸的引數求解公式推導
最直接的,解線性方程
最大釋然函式/最小二乘法都可以
多元線性回歸的引數求解公式推導
梯度下降
線性回歸的評估指標有哪些?原理是什麼?
explained_varicance_score:可解釋方差的回歸評分函式
mean_absolute_error:平均絕對誤差
mean_squared_error:平均平方誤差
sklearn引數詳解(sklearn包裡面線性回歸的每個引數的作用)
lr = sklearn.linear_model.linearregression(fit_intercept=true, normalize=false, copy_x=true, n_jobs=1)
fit_intercept截距項
copy_x是否被改寫
n_jobs記憶體執行的一種方式
任務1 線性回歸演算法梳理
1 機器學習的一些概念 1 有監督 訓練資料有標記資訊 2 無監督 訓練資料無標記資訊 3 泛化能力 演算法適用於新樣本的能力 4 過擬合 訓練樣本學得太好,泛化能力不足,通常表現為在訓練集上具有高方差和低偏差 5 欠擬合 訓練樣本學得不好,不是過於密切地跟蹤訓練資料,而是乙個不合適的模型忽略了訓練...
初級演算法梳理 任務1 線性回歸演算法梳理
有監督 無監督 泛化能力 過擬合欠擬合 方差和偏差以及各自解決辦法 交叉驗證 線性回歸的原理 線性回歸損失函式 代價函式 目標函式 優化方法 梯度下降法 牛頓法 擬牛頓法等 線性回歸的評估指標 sklearn引數詳解 機器學習任務包括兩類,有監督的和無監督的,有監督的主要包括分類與回歸,非監督的主要...
線性回歸演算法梳理
機器學習的一些概念 有監督 有目標值y 無監督 無目標值y 泛化能力 在 集上的 能力 過擬合欠擬合 方差和偏差以及各自解決辦法 測試集 能力不好叫欠擬合,在測試集上ok,訓練集ng 方差能解決過你和問題,偏差能解決欠擬合問題 交叉驗證 將樣本分為n分,按照一定的劃分方式劃分訓練集和測試集,互相交叉...