Task 1 線性回歸演算法梳理(學習整理筆記)

2021-09-25 23:02:46 字數 1111 閱讀 8337

1、概念

機器學習中比較活躍的四大應用領域:資料探勘、計算機視覺、自然語言處理、機械人決策

機器學習的兩大基本問題:回歸問題、分類問題

機器學習模型:f

features

label

樣本資料集

2、有監督學習(supervised learning)

把訓練和分類的結果一併丟給計算機分析。 計算機進行學習之後,再丟給它新的未知的資料,它也能計算出該資料導致各種結果的概率,給你乙個最接近正確的結果。 由於計算機在學習的過程中不僅有訓練資料,而且有訓練結果(標籤),因此訓練的效果通常不錯。

舉例:不僅把書給學生進行訓練給書本分類的能力,而且把分類的結果(哪本書屬於哪些類別)也給了學生做標準參考。

有監督學習的結果可分為兩類:分類或回歸。

無監督學習(unsupervised learning)

只給計算機訓練資料,不給結果(標籤),因此計算機無法準確地知道哪些資料具有哪些標籤,只能憑藉強大的計算能力分析資料的特徵,從而得到一定的成果,通常是得到一些集合,集合內的資料在某些特徵上相同或相似。

舉例:只給學生進行未分類的書本進行訓練,不給標準參考,學生只能自己分析哪些書比較像,根據相同與相似點列出清單,說明哪些書比較可能是同一類別的。

半監督學習(semi-supervised learning)

有監督學習和無監督學習的中間帶就是半監督學習(semi-supervised learning)。對於半監督學習,其訓練資料的一部分是有標籤的,另一部分沒有標籤,而沒標籤資料的數量常常遠遠大於有標籤資料數量(這也是符合現實情況的)。

隱藏在半監督學習下的基本規律在於:資料的分布必然不是完全隨機的,通過一些有標籤資料的區域性特徵,以及更多沒標籤資料的整體分布,就可以得到可以接受甚至是非常好的分類結果。

舉例:給學生很多未分類的書本與少量的清單,清單上說明哪些書屬於同一類別。

3、泛化能力是模型對未知資料的**能力。實際當中,通常通過測試誤差來評價學習方法的能力。

4、過擬合欠擬合及解決方法

5、交叉驗證線性回歸的原理

6、線性回歸損失函式、代價函式、目標函式

7、優化方法(梯度下降法、牛頓法、擬牛頓法等)

8.線性回歸的評估指標

9、sklearn引數詳解

Task1 線性回歸演算法梳理

1.有監督學習 訓練資料有標記 2.無監督學習 訓練資料沒有標記 3.泛化能力 學得模型適用於新樣本的能力 4.過擬合欠擬合 方差和偏差以及各自解決辦法 1 過擬合 當學習器把訓練樣本學得太好時,可能已經把訓練樣本自身的一些特點當作了所有潛在樣本都會有的一般性質,這樣就會導致泛化效能下降。解決方法 ...

Task1 線性回歸演算法梳理

有監督 是乙個機器學習中的方法,可以由訓練資料中學到或建立乙個模式 learning model 並依此模式推測新的例項。訓練資料是由輸入物件 通常是向量 和預期輸出所組成。函式的輸出可以是乙個連續的值 稱為回歸分析 或是 乙個分類標籤 稱作分類 乙個監督式學習者的任務在觀察完一些訓練範例 輸入和預...

TASK1 隨機森林演算法梳理

整合學習是訓練多個個體學習器 常為弱分類器 根據一定的結合策略形成乙個強監督模型,其思想是即便某乙個弱分類器得到了錯誤的 其他的弱分類器也可以將錯誤糾正回來。整合學習可用於分類問題整合,回歸問題整合,特徵選取整合,異常點檢測整合等等。根據個體學習器的生成方式分為 個體學習器間存在強依賴關係 必須序列...