1.1引言
機器學習定義:研究如何通過計算的手段,利用經驗(資料)改善系統的效能。
在計算機上從資料中產生模型的演算法,即學習演算法。
假設用p評估電腦程式在某任務類t上的效能,程式利用經驗e,在t上改善了p
1.2基本術語
資料集:記錄的集合
屬性/特徵:事件或物件在某方面的表現或性質的事項
屬性值:屬性的取值
屬性空間/樣本空間/輸入空間:屬性張成的空間
特徵向量:乙個示例
維數:屬性的個數
標記:示例的結果(好瓜、壞瓜)
樣例:有標記資訊的示例
標記空間/輸出空間:所有標記的集合
分類:離散值
回歸:連續值
聚類:將訓練集中的西瓜分成若干組
監督學習:訓練資料有標記資訊,對應分類和回歸
無監督學習:訓練資料沒有標記資訊,對應聚類
泛化能力:學得模型適用於新樣本的能力
1.3假設空間
科學推理的2大基本手段:歸納、演繹
歸納學習:從樣例中學習
概念學習/概念形成:狹義的歸納學習,從訓練資料中學得概念
布林概念學習:可表示為0/1布林值的目標概念的學習
版本空間:多個假設與訓練集一致
1.4歸納偏好
機器學習演算法在學習過程中對某種型別假設的偏好
奧卡姆剃刀:若有多個假設與觀察一致,則選最簡單的那個
沒有免費的午餐:學習演算法的期望效能相同
1.5發展歷程
svm支援向量機
深度學習:狹義,很多層的神經網路
1.6應用現狀
計算機視覺
自然語言處理
生物資訊學
天氣預報、能源勘測、環境檢測
商業營銷
自動駕駛
人類如何學習,sdm(space distributed memory)
《機器學習》周志華讀書筆記(一)緒論
什麼是機器學習?mitchell,1997 假設用p來評估電腦程式在某任務類t上的效能,若乙個程式通過利用經驗e在t中任務上獲得了效能改善,則我們就說關於t和p,該程式對e進行了學習。全文第1章緒論部分重點介紹了機器學習中的基本術語 假設空間 歸納偏好 發展歷程與現狀 基本術語 以一批西瓜為例 估計...
《機器學習實戰》讀書筆記 1
本人開發工具為pycharm,python版本是3.5 第二章 knn 2.1 概述 k 緊鄰演算法的一般流程 收集資料 可以使用任何方法 準備資料 距離計算所需要的數值,最好是結構化的資料格式 分子資料 可以使用任何方法 訓練資料 此步驟不適應於k 緊鄰演算法 測試資料 計算錯誤率 使用演算法 首...
第1章 緒論
1.1空間分析的概念 空間分析是地學領域的重要概念,是gis的核心功能,關於空間分析的定義目前還不夠統一 下面為較為典型的幾種 空間目標是空間分析的具體物件。空間分析目標具有空間位置,分布,形態,空間關係 距離,方位,拓撲,相關場 等基本特徵 空間關係指的是地理實體之間存在的與空間特徵有關的的關係,...