機器學習筆記 01

2021-10-20 18:36:50 字數 932 閱讀 2559

(本csdn部落格學習筆記對應為機器學習西瓜書教材,一切內容以西瓜書教材為準)

新學期的學習依舊,這次發表在csdn部落格上的是西瓜書版機器學習教材的學習心得和筆記的主要內容,可能不是很詳盡,但保證是本人理解與提煉的結果。

1.1引言

機器學習:通過計算的手段,利用經驗改善系統的效能

一般流程:資料-學習演算法-模型-**結果

1.2基本術語

①資料 資料集:待研究的全部物件(如全部100個待研究的西瓜)

資料樣本:1個待研究的物件(如100個西瓜中的1個西瓜)

特徵向量:可以使用數值衡量的基本特徵(如西瓜的含糖量)

屬性:某些固有特質(如西瓜的種類)

②學習演算法:機器學習的主要部分——學習&訓練

③模型 有監督學習:分類 二分類-是否類問題

多分類-多目標選擇問題

回歸 y=r 大範圍時間或其他影響因素下某特定指標的變化規律和發展**

無監督學習:聚類 機器自行對目標進行分組

分成的每個組被稱為「簇」(cluster)

④** 測試、測試樣本

泛化能力——模型用於**未經訓練的全新資料及的能力

1.3 假設空間

進行科學推理的手段

歸納:由特殊到一半——狹義:從訓練集中得到概念

廣義:從樣本中進行學習

演繹:由一般到特殊

1.4 歸納偏好

選擇同乙個資料及訓練出不同模型時的選擇方式

基本原則-奧卡姆剃刀原理:選擇所有解中最簡單的乙個解(也可能有其他多種理解方式)

1.5 發展歷程

機器學習的個人理解:一種有著自我學習和改善能力的程式,通過收集資料集的方式進行學習,在程式自主進行學習的過程中應該儘量減少人為干預。

機器學習筆記01 機器學習簡介

機器學習是人工智慧的乙個分支,它業是一類演算法的總稱。這些演算法能夠根據提供的訓練資料按照一定的方式來學習,最終用於 或者分類。更具體的說,機器學習可以看作是尋找乙個函式,輸入是樣本資料,輸出是期望的結果,只是這個函式過於複雜,以至於不太方便形式化表達。需要注意的是,機器學習的目標是使學到的函式很好...

機器學習菜鳥筆記01

一般把學習器的實際 值與樣本真實輸出值之間的差異稱為 誤差 學習器在訓練集上的誤差稱為 訓練誤差 或者 經驗誤差 學習器在新樣本上的誤差 稱為泛化誤差 過擬合 如果學習器將訓練樣本學習到誤差接近為0,則會把訓練樣本自身的一些特點當做所有潛在樣本都會具有的一般性質,這樣會導致泛化效能降低。如果僅有乙個...

機器學習筆記 01 機器學習基礎知識

1.訓練集與測試集 將資料分成兩部分 一部分用於機器的訓練,即讓機器從這些資料中獲取合適的引數,構建出模型,這些資料稱為訓練集 另一部分用於機器訓練出來的模型進行 根據一些指標來判斷模型的好壞,這些資料稱為測試集 2.分類問題與回歸問題 分類 的結果是離散值 例如明天是否會下雨,腫瘤是良性或者是惡性...