《機器學習》筆記(一) 緒論

2021-09-28 05:56:34 字數 574 閱讀 6076

機器學習定義:機器學習是對依據經驗提公升自身效能或豐富自身知識的各種演算法和系統的系統性研究。

機器學習「原料」:任務、模型及特徵,模型佔據中心地位。

正確特徵+正確模型=完成任務

任務與學習問題的區別 任務

通過模型來完成

學習問題(學習任務)通過能夠產生模型的學習演算法來解決

機器學習方法的核心:依據經驗提公升效能(增添訓練資料)。

預期實現目標:在實際應用時演算法具有良好的效能。不能一味追求在訓練集上的表現,否則會存在過擬合(overfitting) 的危險。

對無法擬合的訓練資料的處理方式:(1)捨棄資料,認為該資料是雜訊。(2)嘗試描述能力更強的分類器,前提條件:訓練集資料量大、能確保特徵的可靠性。

機器學習學習筆記(一) 緒論

之前寫了一篇深度學習 優化與識別的學習筆記,但是後來豆瓣書評上對這本書的評價不高,就直接放棄刪除了。1.1引言 1.2基本術語 要進行機器學習,先要有資料,假定我們收集了一批關於西瓜的資料,例如 色澤 青綠 根蒂 蜷縮 敲聲 濁響 色澤 烏黑 根蒂 稍蜷 敲聲 沉悶 色澤 淺白 根蒂 硬挺 敲聲 清...

周志華《機器學習》筆記(一)緒論

第一章 緒論 1 資料集 data set 機器學習資料的集合 2 示例 樣本 instance sample 每條資料描述了乙個物件的資訊,該物件稱之為示例,一般用x表示 3 屬性 attribute 資料描述的樣本在某些方面的性質 4 樣本空間 sample space 樣本張成的空間,又稱 屬...

機器學習 西瓜書(筆記一) 緒論

在機器學習中常見的基本術語包含 資料集 屬性值 屬性空間 特徵向量 訓練集 測試集等等,各自的英文表示在思維導圖中有提及。假設空間主要提及了兩種方法 歸納法和演繹法。歸納法是從特殊到一般的 泛化 演繹法是從一般到特殊的 特化 歸納偏好指的是總誤差是與學習演算法無關的,任意兩種演算法的誤差都相等。說到...