機器學習筆記(二)

2021-08-07 10:38:43 字數 408 閱讀 7599

總結自 《機器學習》周志華

模型評估與選擇

錯誤率=樣本總數/分類錯誤的樣本數

精度=1-錯誤率

誤差:實際**輸出與樣本真實輸出之間的差異

訓練誤差:學習器在訓練集上的誤差

泛化誤差:學習器在新樣本上的誤差

過擬合:學習能力過於強大,將訓練樣本本身的一些不太一般的特點當作所有潛在樣本的特點導致演算法泛化效能下降

欠擬合:學習能力過於弱小,還未將訓練樣本的一般特點學習到位

小心得:泛化誤差在實際運用中不能直接獲得,因此對於學習演算法的選擇以及引數配置的選擇上無法依賴於泛化誤差的評估,而訓練誤差由於有過擬合現象的出現(即使訓練誤差很小,泛化誤差卻可能很大)也不適合用來做模型評估

機器學習(筆記二)

1,機器學習概念 機器學習是從資料中自動分析獲得模型,並利用模型對未知資料進行 2.機器學習的工作流程 1 獲取資料 2 資料基本處理 3 特徵工程 4 機器學習 模型訓練 5 模型評估 3.對資料集的解釋 在資料集中 一行資料稱為乙個樣本 一列資料稱為乙個特徵 有些資料有目標值 標籤值 有些沒有 ...

筆記 機器學習入門(二)

第一周有三大節,第一節是introduction,簡單介紹了機器學習的分類,監督學習和非監督學習各自的特點和區別,殘念的是做了三次課後作業,都沒能全部做對,多選題對於英語差的我來說真的是太不友好了。第二節主要講述了單變數的線性回歸問題。模型表述 依舊是通過預估房價的例子來構建了模型,對於資料集的描述...

機器學習筆記 二 Regression回歸

這裡面,輸入變數x有兩個,乙個是居住面積 living area 乙個是房間數目 bedrooms 所以x 是乙個二維向量。我們假設輸入和輸出呈線性關係,那麼便有下面的公式。其中,其中右邊是線性代數中向量相乘的寫法。這樣一來,我們最終是要學習的就是parameters 也就是求 的值,使得h x 最...