由於想入深度學習坑,但基礎太薄弱,打算還是先把機器學習系統學習一遍,參考教材為周志華的《機器學習》,之後再重點學習神經網路、caffe啥的吧。
機器學習基本術語
(1)資料的集合為資料集,每乙個資料具有屬性還有相應的屬性值
(2)從資料中學得模型的過程稱為「學習」或「訓練」,使用的資料稱為「訓練資料」、樣本稱為「訓練樣本」、「訓練集」
(3)資料訓練是尋找輸入空間和輸出空間的一般關係
(4)訓練結果通常包括「分類」(離散結果1,2,3...),「回歸」(連續結果,0.97,0.94,0,61..),聚類(未知類別)
(5)有監督學習(分類和回歸),無監督學習(聚類)
(6)學習得到模型適用於新樣本的能力稱為「泛化能力」
(7)歸納學習:從樣例歸結出一般規律
(8)假設空間:所有假設組成的空間,對資料所有屬性值的遍歷
(9)版本空間:滿足當前
訓練集結論的集合,是假設空間的子集
(10)歸納偏好:任意兩個學習演算法在誤差均勻分布的情況下效能相同,因此需要根據先驗知識引入歸納偏好,這樣學習演算法才有意義
學習機器學習從資料探勘開始
第乙個問題,為何要先從資料探勘開始。學習機器學習的話,你大部分都是一些資料演算法,演算法的一些應用才是我們最後想要的。而資料探勘呢?正好是機器學習最好的應用,從目前的情況來看,資料探勘,推薦系統的材料也是最豐富的,對學習機器學習的幫助很大。第二個問題,是不是學習機器學習的過程,就一定要從資料探勘開始...
機器學習 機器學習目錄
注 後期有時間的話會對每乙個演算法進行講解。1 普通線性回歸 2 廣義線性模型 3 邏輯回歸 4 線性判定分析1 決策樹基本原理與構建 2 cart演算法 3 回歸決策樹 4 分類決策樹1 貝葉斯定理與樸素貝葉斯 2 高斯貝葉斯分類器 3 多項式貝葉斯分類器 4 伯努利貝葉斯分類器 5 遞增式學習1...
機器學習 機器學習概論
3 模型評估與模型選擇 4.具體應用 統計學習 是關於計算機基於 資料 構建概率統計模型並運用模型對資料進行 分析 統計學習的三要素 模型在監督學習中,模型就是所要學習的條件概率分布或決策函式。這在後面的章節中會重點介紹。策略 評價模型的標準 用損失函式和代價函式來度量 錯誤的程度。1 幾種損失函式...