定義:如果某電腦程式在t任務中的效能(由p衡量)隨著經驗e的提高而提高,則可以說它是從經驗e中學習有關某類任務t和效能度量p的。
簡單的來說:
打個比方—>玩跳棋。
e =玩許多跳棋遊戲的經驗
t =扮演跳棋的任務。
p =程式將贏得下一場比賽的概率。
通常,可以將任何機器學習問題分配給以下兩種廣泛的分類之一:
監督學習和無監督學習。
在監督學習中,我們得到了乙個資料集,並且已經知道我們正確的輸出應該是什麼樣子,並且認為輸入和輸出之間存在關係。
監督學習問題分為「回歸」和「分類」問題。
在回歸問題中,我們試圖**連續輸出中的結果,這意味著我們試圖將輸入變數對映到某個連續函式。(根據之前的資料,**乙個準確的輸出值。)
在分類問題中,我們改為嘗試**離散輸出中的結果。換句話說,我們正在嘗試將輸入變數對映為離散類別。a)回歸-給定乙個人的**,我們必須根據給定的**來**他們的年齡
b)分類-對於患有腫瘤的患者,我們必須**腫瘤是惡性還是良性的。
無監督學習使我們幾乎或根本不了解結果應該是什麼樣。我們可以從資料中獲得結構,而不必知道變數的影響。
我們可以通過基於資料中變數之間的關係對資料進行聚類來推導此結構。
在無監督學習的情況下,沒有基於**結果的反饋。
m = 訓練樣本的數目
x = 輸入變數,特徵量
y = 輸出變數,目標變數(**的結果)
為了更正式地描述監督學習問題,我們的目標是給定訓練集,以學習函式h:x→y,以便h(x)是y對應值的「良好」**因子。由於歷史原因,此函式h稱為假設。如圖所現。
代價函式
意義:如何把最有可能的直線與我們資料所擬合
梯度下降
α–是步長
這個是梯度下降的方向。
機器學習1 0
支援向量機 support vector machine,svm 的基本模型是在特徵空間上找到最佳的分離超平面使得訓練集上正負樣本間隔最大。兩條線哪乙個分的更好。使點到線段距離最大。藍線到最近的距離點太小,會造成誤差 2.核函式的作用就是隱含著乙個從低維空間向高維空間的對映關係,這樣就使得在低維空間...
機器學習(10) 推薦系統
估計這章內容後面來的概率也比較低吧,學到一點思想,但畢竟現在推薦系統作為企業超看重的部分,發展較好,這些內容是不夠的,太入門了 推薦系統能領悟特徵學習的思想,不需要手動建立特徵 未防止後面看不懂,這裡做個說明 nu表示 使用者數量,nm表示電影數量,r i,j 1表示使用者j看過電影i,y i,j ...
1 0 機器學習所需的數學
從大學到現在,課堂上學的和自學的數學其實不算少了,可是在研究的過程中總是發現需要補充新的數學知識。learning和vision都是很多種數學的交匯場。看著不同的理論體系的交匯,對於乙個researcher來說,往往是非常exciting的enjoyable的事情。不過,這也代表著要充分了解這個領域...