開始學ml了!第一次用csdn寫blog,聊以自娛,也算是監督和動力叭 ?
基本概念
【機器學習】 研究如何通過計算的手段,利用經驗來改善系統自身的效能(研究物件:學習演算法)
(【統計學習】是一套以理解資料為目的的龐大工具集)
【學習演算法】 在計算機上從資料中產生模型的演算法l
\mathcal
l【模型 / 學習器】 從資料中學得的結果(全域性性or區域性性)
【資料集】記錄的集合d=
【示例 / 樣本 / 特徵向量】 關於乙個事件或物件的描述(記錄)- 通常假設每個樣本iid分布xi= ( xi1, xi2, …, xid )(青綠,蜷縮,濁響)
【屬性 / 特徵】 反映事件或物件在某方面的表現或性質的事項色澤
【屬性值】 屬性的取值 xij
烏黑
【屬性空間 / 樣本空間 / 輸入空間】 屬性張成的空間χ
\chi
χ(色澤,根蒂,敲聲)
【標記】 關於示例結果的資訊 yi
好瓜
【標記空間 / 輸出空間】所有標記的集合υ
\upsilon
υ=
【樣例】 擁有了標記資訊的示例 (xi, yi )((青綠,蜷縮,濁響),好瓜)
【訓練資料-訓練集】 & 【測試資料-測試集】
【泛化能力】學得模型適用於新樣本的能力 —> 【歸納學習】
【歸納】泛化過程 【演繹】特化過程
【假設空間】所有假設組成的空間好瓜 (色澤=?) /\ (根蒂=?) /\ (敲聲=?) (ps:萬用字元*)
【版本空間 / 假設集合】與訓練集一致的假設集合
【歸納偏好】演算法在學習過程中對某種型別假設的偏好
機器學習分類
特點主要演算法
用途監督式學習
有標記資訊
分類(二分類or多分類 - 離散)、回歸(連續)
面向**的統計模型的建立;對乙個或多個給定的輸入(input) 估計某個輸出(output)
非監督式學習
沒有標記資訊
聚類學習資料的關係和結構
西瓜書 學習筆記 (1)緒論
個人自學筆記,內容摘自原書 個人理解,不一定正確,若有誤,歡迎指出。機器學習的定義 假設用p來評估電腦程式在某任務類t上的效能,若乙個程式通過利用經驗e在任務t中獲得了效能改善,則我們就說關於t和p,該程式對e進行了學習。mitchell,1997 通俗地說,機器學習即是通過學習演算法,從經驗 資料...
機器學習 西瓜書(筆記一) 緒論
在機器學習中常見的基本術語包含 資料集 屬性值 屬性空間 特徵向量 訓練集 測試集等等,各自的英文表示在思維導圖中有提及。假設空間主要提及了兩種方法 歸納法和演繹法。歸納法是從特殊到一般的 泛化 演繹法是從一般到特殊的 特化 歸納偏好指的是總誤差是與學習演算法無關的,任意兩種演算法的誤差都相等。說到...
機器學習(西瓜書) 緒論筆記
正如我們根據過去的經驗來判斷明天的天氣,吃貨們希望從購買經驗中挑選乙個好瓜,那能不能讓計算機幫助人類來實現這個呢?機器學習正是這樣的一門學科,人的 經驗 對應計算機中的 資料 讓計算機來學習這些經驗資料,生成乙個演算法模型,在面對新的情況中,計算機便能作出有效的判斷,這便是機器學習。另一本經典教材的...