機器學習第一章

2021-08-10 05:35:43 字數 827 閱讀 4976

q:什麼是機器學習

機器學習不同於以往的計算機程式設計,致力於研究如何通過計算機手段,利用以往的經驗來改善系統自身的效能。一般的程式設計都是明確的告訴電腦該做什麼。機器學習希望提供資料給學習演算法,讓它自己學習,找到其種的規律。在面對新情況的時候就能應用已產生的模型,提供相應的判斷。機器學習的本質任務是**。

q:機器學習中需要掌握的基本概念。

樣本,示例:每條記錄關於乙個時間(物件)的描述。

資料集:這組樣本、記錄、示例的集合。

屬性、特徵:反映事件或物件在某方面的表現或性質的事項。

屬性值:屬性上的取值。

樣本空間、屬性空間、輸入空間:屬性張成的空間。

學習、訓練:從資料中學的模型的過程。

訓練集:由訓練樣本組成的集合。

假設:模型對應了關於資料的某種潛在的規律。通過學習後得到的乙個函式。

標記:關於樣本結果的資訊。擁有標記資訊的示例稱為樣例。

泛化:學得模型適用於新樣本的能力。

q:假設空間

假設空間就是所有可能假設都存在的空間。也就是符合任務要求的假設函式形式的集合。學習過程就是在這樣乙個假設空間中進行搜尋,找到與訓練集匹配的假設。        由於有限樣本訓練集,可能存在多個假設與訓練集一致,這個空間稱為版本空間,其實就是可能正確的假設集合。

q:什麼是歸納偏好?

因為版本空間的存在,乙個新的樣本在面臨三個假設可能會產生不同的輸出(好瓜,壞瓜)。乙個學習演算法必定有其歸納偏好。

除訓練集上所有樣本的總誤差與學習演算法無關——nfl定理,說明看起來表現更好的演算法a,在某些樣本下b比a更一致。

任何的學習演算法必須建立在具體的學習問題上,而不是單純地討論兩個學習演算法的好壞。

機器學習第一章

今天進行了機器學習第一章的學習,我覺得首先你可以認清這些概念 1 模型 策略 演算法 2 分類與回歸的概念 3 監督 無監督 半監督問題 2 過擬合 欠擬合 下面是拓展的一些概念 海森矩陣 黑塞矩陣 hessian matrix 又譯作海森矩陣 海瑟矩陣 海塞矩陣等,是乙個多元函式的二階偏導數構成的...

《機器學習》 第一章

圖書館借了本機器學習,作者是 tom m.mitchell,亞馬遜這本書排名挺靠前的。好了,直接開篇。接下來大篇幅講述了,如何挑選訓練經驗,選擇目標函式,目標函式的表示,選擇函式逼近演算法。整個設計下來,分為了四大模組 執行系統 鑑定器 泛化器 實驗生成器。看過這本書的都會被第一章的跳棋學習深深吸引...

機器學習實戰 第一章

機器學習能讓我們從資料集得到啟發 搜素引擎,郵件過濾系統,推薦系統,資料探勘 啤酒和尿布 機器學習在我們生活中隨處可見。機器學習是必學的。即使想做其他方向的研究,ml也是基礎 1 機器學習專業術語 訓練集,測試集,目標變數 如 鳥的類別 知識表示 如 可以採用規則集的形式,也可以採用概率的形式 採用...