一.機器學習分類
1.監督學習
監督學習是指利用一組已知類別的樣本調整分類器的引數,使其達到所要求效能的過程,也稱為監督訓練或有教師學習。在監督學習的過程中會提供對錯指示,通過不斷地重複訓練,使其找到給定的訓練資料集中的某種模式或規律,當新的資料到來時,可以根據這個函式**結果。監督學習的訓練集要求包括輸入和輸出,主要應用於分類和**。
2. 非監督學習
與監督學習不同,在非監督學習中,無須對資料集進行標記,即沒有輸出。其需要從資料集中發現隱含的某種結構,從而獲得樣本資料的結構特徵,判斷哪些資料比較相似。因此,非監督學習目標不是告訴計算機怎麼做,而是讓它去學習怎樣做事情。
3. 半監督學習
半監督學習是監督學習和非監督學習的結合,其在訓練階段使用的是未標記的資料和已標記的資料,不僅要學習屬性之間的結構關係,也要輸出分類模型進行**。
5. 強化學習
強化學習(reinforcement learning, rl),又稱再勵學習、評價學習或增強學習,是機器學習的正規化和方**之一,用於描述和解決智慧型體(agent)在與環境的互動過程中通過學習策略以達成回報最大化或實現特定目標的問題.
二.,機器學習優化方法
梯度下降是最常用的優化方法之一,梯度下降分為以下幾種。
(全量)梯度下降
隨機梯度下降
小批量梯度下降
4.自適應學習率的adagrad演算法
三.機器學習模型選擇
交叉驗證
所有資料分為三部分:訓練集、交叉驗證集和測試集。交叉驗證集不僅在選擇模型時有用,在超引數選擇、正則項引數 [公式] 和評價模型中也很有用。
k-摺疊交叉驗證
bias與variance,欠擬合與過擬合
欠擬合一般表示模型對資料的表現能力不足,通常是模型的複雜度不夠,並且bias高,訓練集的損失值高,測試集的損失值也高;
過擬合一般表示模型對資料的表現能力過好,通常是模型的複雜度過高,並且variance高,訓練集的損失值低,測試集的損失值高.
機器學習概述
什麼是機器學習?what is machine learning?machines can learning by ayalyzing large amouts of data.ml是一種重在尋找資料中的模式並使用這些模式來做出 的研究和演算法的門類。ml是ai的一部分,並且和知識發現與資料探勘有所...
機器學習概述
機器學習之父 卡內基梅隆大學計算機學院院長湯姆 公尺切爾 tom michael mitchell 在1997年給機器學習這樣的定義 對於乙個給定的任務t task 在合理的效能度量方案p performance 的前提下,某個計算程式可以自主學習任務t的經驗e experience 隨著提供合適的...
機器學習概述
在面對新來的事物做判斷時,傳統的方式會採用一長串負責的規則去進行判斷,如果新來的樣本符合我們規則,我們就可以準確的判斷樣本的好壞 品質等型別,當遇見我們規則不發匹配的時候,我們就無法正確做出判斷,以及隨後要更新我們已有的規則。在面對大資料 變化頻發的狀況下,傳統的方式不適合去使用。example e...