課程來自coursera上的國立台灣大學《機器學習基石》(machine learning foundations),由林軒田老師講授。
首先回顧下機器學習的一般性定義:
集合是所有可能的輸入,集合是所有可能的輸出,函式f是到
的乙個對映,這個函式利用輸入得到正確的輸出。問題是我們不知道f的形式,我們手頭有的只是一些經驗資料d,是不是可以通過乙個學習演算法a從備選函式集h中找到乙個函式g,使它在訓練資料d的範圍內保證得到正確的結果,此時我們認為g是對f的乙個可接受的近似。
以信用卡問題為例解釋如何設定備選函式集:
乙個客戶,他的資料可用乙個特徵向量表示:
為了簡化,這裡假設使用者特徵向量只有2維,即影響發卡的因素只有兩個(x1,x2),因此每個特徵向量都能表示成平面上的乙個點。將歷史資料一一繪製出來就得到上面的圖,圖中藍色圓圈代表發卡的使用者,紅色的叉代表不發卡的使用者,乙個正確的權向量應當構成一條直線,在平面上將圈和叉劃分開來。
因為是在實數域取值,理論上權向量w有無窮多個,h(w)隨著w的變化也有無窮多個備選函式,該如何選取近似目標函式g?
教程給出的方法是,首先給定乙個初始函式g0(或乙個初始權向量w0),如果該直線對樣本的劃分出現錯誤,我們就糾正它(糾正w0)並重複這個過程直到正確的劃分出現。
史上z zui難回答的26個問題 2
今天咱們接著上回文章,繼續來了解你所不了解的事。14 宰相肚裡能撐船的來歷 theoriginofprimeminister sbigheartenoughtosailaboatin 宋時宰相王安石中年喪妻,續娶了一妾名喚姣娘。老夫少妻的生活,使得姣娘私下與年輕僕人 王安石知道後,本來火冒三丈,但一...
編碼問題學習 2
c 中string char wstring wchar t window以下 char cname 北京市 多位元組轉化成寬字元字串!unsigned short wsname 50 int widecharcount multibytetowidechar cp acp,0,lpstr cnam...
機器學習面試問題2
logistic 邏輯回歸 是一種廣義線性回歸分析模型,是一種分類演算法。通過函式l將w x b對應乙個隱狀態p,p l w x b 然後根據p 與1 p的大小決定因變數的值。l是logistic函式.該模型是典型的數學模型,它服從邏輯斯蒂分布。二項邏輯斯蒂回歸模型是如下的條件概率分布 在這裡,x是...