本節知識點較少,自己記錄留作自用,讀者可以跳過。
官網給出的一張學習路線圖,大概闡明了重要的知識點和學習過程,也羅列了課程布置的若干任務、智慧型系統↔函式本節課梳理課程的大綱也是依賴於這張路線圖來進行的。
圖源**李巨集毅機器學習公開課
為了便於我們對機器學習快速建立乙個了解,所謂機器學習的智慧型系統,可以看成是我們給定一種形式的輸入,讓機器反饋給我們相應的乙個輸出。函式的型別
在我們學習如何讓機器幫忙找到乙個合適的函式之前,首先要先弄清楚,我們需要乙個怎樣的函式,即函式的型別。①回歸任務(regression)
當我們期望得到的結果是乙個數值型別的時候,我們所進行的任務就叫做數值回歸。
p.s. 這裡是***主要是對概念進行乙個簡化描述,回歸的嚴謹定義並不是這樣。②分類任務
當我們期望機器對於給定的類標進行乙個選擇的時候,我們就是在對資料或者事務進行乙個分類。
根據類標的個數,分類任務可以分成是二分類(binary)或者是多分類(multiple-class)。③產生任務
根據給定的一些資料集,我們希望產生一些更為複雜的輸出,這個時候可以把這個機器學習任務統稱為產生任務。怎樣告訴機器我們需要什麼型別的函式呢?①有監督學習(supervised learning)
所謂監督學習就是要同時告訴機器資料以及資料相應的標籤,人工定義乙個模型的損失函式作為評價標準,使用某種演算法,讓機器找出損失函式值(loss)最低的模型。
還有乙個近幾年來新興的學習概念【強化學習】(reinforcement learning),現將其和監督學習進行乙個比較:②無監督學習(unsupervised learning)【監督學習】:拿下圍棋這件事為例,如果要用監督學習的模式來訓練機器下圍棋,則需要將棋盤上可能出現的每一種棋局情況以及相應的最優步驟都告訴機器,來進行訓練。
【強化學習】:但是用強化學習的觀念來訓練機器下圍棋的時候,就只需要給定初始的棋局,讓機器自己和自己(或者和人)進行對決,利用得到的結果(reward)來矯正學習過程,進行閉環控制。
僅僅給機器一堆資料,但是不給定任何標記,使用相應的演算法,也能讓機器進行學習。explainable ai
以影象識別任務為例,機器不僅要告訴人類這張裡有什麼物體,還需要說明它判斷此的理由是什麼。為了應對有些不法分子專門針對機器特定的演算法設計有些具有強誤導性的雜訊訊號,從而使得演算法崩潰的情況。如何將資料集進行壓縮,從而使得演算法可執行。anomaly detection異常檢測是乙個讓機器知道「自己並不知道」這樣的乙個哲學問題。拿影象識別系統為例,當乙個識別動物的影象系統突然傳入了動漫**人物,我們期望的結果並非系統根據畫素點的特點強行把這張劃分到某乙個特定的動物類別;而是機器可以向人類反饋出它無法處理這類分類任務的資訊。
通常意義上我們對模型進行訓練時,會將資料劃分成訓練集、測試集、驗證集等,但是這些集合上的資料具有較為相同的形式和特點。但是在實際應用中,我們用來訓練的資料,和用來測試的客戶資料往往會存在很多偏差,導致模型的正確率會驟降。
又涉及到乙個哲學問題:所謂機器學習是讓機器具有學習的能力;
而meta learning就是讓機器通過這個程式來學習如何學習。
meta learning提出來的意義就在於,我們希望通過機器自主學習來找到乙個更為高效的演算法。雖然,現在很多機器學習的演算法和模型的落地產品看起來效果不錯,那是得利於機器強大的計算能力,但其實機器使用的學習演算法效率並不能算最優。ML 李巨集毅機器學習一 error
error反映的是整個模型的準確度,bias反映的是模型在樣本上的輸出與真實值之間的誤差,即模型本身的精準度。variance反映的是模型每一次輸出結果與模型輸出期望值之間的誤差,即模型的穩定性 1.where does the error come from?error有兩種 分別是bias和va...
台大李巨集毅機器學習 學習筆記03
在這個作業中,我們將用梯度下降方法 pm2.5的值 hw1要求 1 要求python3.5 2 只能用 1 numpy 2 scipy 3 pandas 3 請用梯度下降手寫線性回歸 4 最好的公共簡單基線 5 對於想載入模型而並不想執行整個訓練過程的人 請上傳訓練 並命名成 train.py 只要...
台大李巨集毅機器學習 學習筆記05
回歸 假設現在有一些資料點,我們用一條直線對這些點進行擬合 這條直線稱為最佳擬合直線 這個擬合的過程就叫做回歸。我們想要的函式應該是 能接受所有的輸入然後 出類別。梯度下降法 這裡需要一點點向量方面的數學基礎 向量 值 方向 梯度 向量 梯度 梯度值 梯度方向 梯度下降法的思想 要找到某函式的最大值...