基本概念
訓練集,測試集,特徵值,監督學習,非監督學習,半監督學習,分類,回歸
概念學習
人類學習概念:鳥,車,計算機
定義:概念學習是指從有關某個布林函式的輸入輸出訓訓練陽曆中推斷出該布林數
例子:學習「享受運動」這一概念:小明進行水上運動,是否享受運動取決於很多因素
這裡舉乙個例子
小明是否進行水上運動,取決於天氣,溫度,濕度風力,水溫,預報等特徵工程,通過對小明是否享受運動的label值的驗證,最終通過演算法精準找出他們之中潛在的規律,進而達到精準判斷。
概念定義在例項( instance)集合之上,這個集合表示為x。(x代表所有可能的日子,每個日子的值由天氣,溫度,濕度,風力,水溫,預報6個屬性表示。
待學習的概念或目標図數成為目標概念( target concept),記做c。
c(x)=1.當享受運動時,c(×)=0當不享受運動時,c(x)也可叫做y
x:每乙個例項
x:樣例,所有例項的集合
學習目標:f:x->y
概念詳解
訓練集訓練集/訓練樣例:用來進行訓練,也就是產生模型或者演算法的資料集
測試集(/測試樣例:用來專門進行測試已經學習好的模型或者演算法的資料集
特徵向量:屬性的集合,通常用乙個向量來表示,附屬於乙個例項
標記:c(x),例項類別的標記
正例:表完成的資料,1
反例:表未完成的資料,0
有監督學習( supervised| earning):訓練集有類別標記
無監督學習( unsupervised| earning):無類別標記
半監督學習(semi- supervised| earning):有類別標記的訓練集+無標記的訓練集
機器學習中分類和**演算法的評估
準確率速度
強壯性可規模性
可解釋性
機器學習步驟框架
把資料拆分為訓練集和測試集
用訓練集和訓練集的特徵向量來訓練演算法
用學習來的演算法運用在測試集上來評估演算法(可能要設計到調整引數用驗證集)
機器學習 機器學習基礎
資料集劃分的api 返回值 訓練特徵,測試特徵,訓練目標,測試目標 方式1 獲取小規模的資料集 importsklearn.datasets as datasets iris datasets.load iris 提取樣本資料 feature iris data target iris target...
機器學習 機器學習目錄
注 後期有時間的話會對每乙個演算法進行講解。1 普通線性回歸 2 廣義線性模型 3 邏輯回歸 4 線性判定分析1 決策樹基本原理與構建 2 cart演算法 3 回歸決策樹 4 分類決策樹1 貝葉斯定理與樸素貝葉斯 2 高斯貝葉斯分類器 3 多項式貝葉斯分類器 4 伯努利貝葉斯分類器 5 遞增式學習1...
機器學習 機器學習概論
3 模型評估與模型選擇 4.具體應用 統計學習 是關於計算機基於 資料 構建概率統計模型並運用模型對資料進行 分析 統計學習的三要素 模型在監督學習中,模型就是所要學習的條件概率分布或決策函式。這在後面的章節中會重點介紹。策略 評價模型的標準 用損失函式和代價函式來度量 錯誤的程度。1 幾種損失函式...