台大機器學習基石 1

2022-07-30 02:06:11 字數 1206 閱讀 9598

機器學習對於適用場景有一定的前提條件:

可以找到某種模式

不容易程式設計實現,不能對目標下乙個簡單的定義

能找到訓練的資料,資料量越大越好

使用機器學習的乙個小例子——銀行信用卡批准

例如銀行會收到申請客戶的個人資料,然後根據個人資訊進行分析,選擇是否發放信用卡,以達到銀行最大收益。

機器學習所扮演的角色就是訓練出某種發卡策略。

數學描述:

x:使用者個人資料

y:是否要發卡

目標函式f:x->y(f為目標函式,通過使用者資料,得出是否發卡的策略)

訓練資料d=

假設hypothesis:g:x->y的表現很好

如下圖能夠形象的表現出機器學習的數學過程。

這裡面有個隱含的過程,也就是d資料集實際上是由某種理想化(不可知)的公式f演算得到的.

而機器學習的過程也只是在不斷逼近,試圖得到f,但是只能得到它的近似函式g,g約等於f。

那麼在這個例子裡,g會是怎麼樣的一種形式呢?接下來,就具體的講一講。

個人資料報含:年齡、性別、年收入、居住時間、工齡、負債。

g屬於假設集合h

h1:年收入》20萬

h2:負債》8萬

h3:工齡<=2年

機器學習過程就是為g挑集合h中選擇最好的乙個。

機器學習的模型就是指:演演算法a與假設集合h。

因此總結:機器學習,根據資料d,計算出假設g,約等於目標函式f。

首先從兩者的目標角度來講,機器學習是通過資料找到某種pattern,找到近似函式g;而資料探勘則是通過資料找到當中有趣的元素。但是某些情況下,它們並不區分,因為有趣的元素可以是這個pattern,這時它們的目標相同。

然後從它們的訓練過程來講,都是需要喂資料的。

接著,是由於資料探勘的特點:資料探勘是在大資料方面切入的,所以更加注重大資料的高效計算。

最後,它們之間是互相促進的,有時候發現了g,那也能幫助找到有趣重要的元素,反之也是。

1.機器學習是實現人工智慧的一種方式。

統計是實現機器學習的一種方法。

傳統的統計學是從數學出發,更加注重假設與證明;機器學習從電腦出發,更注重怎麼計算處理,而不只是數學上的證明等。

台大 林軒田老師 機器學習基石學習筆記2

第一節課中,主要講解的是機器學習的基本思路和相關的應用,算是一種對機器學習的大致介紹和簡單的科普。到了第二講,林老師將重點放在了pla演算法上,通過這個演算法讓機器學習的演演算法大門正式開啟了。對於機器學習,類似人的成長一般,一般是先學會判斷是和不是,所以這一講是介紹一種可以回答是非題的機器學習演演...

台大 林軒田老師 機器學習基石學習筆記13

上節講的是非線性分類模型,通過線性與非線性空間之間的變換,將非線性模型映轉換為線性模型,再進行分類,分析了非線性變換可能會使計算複雜度增加。強調了緯度和負責度之間的關係。這節中,這種模型複雜度增加帶來機器學習中乙個很常見的問題 過擬合。機器學習的終極目標就是為了 當然 前我們要對資料進行訓練。用原生...

力薦 台大林軒田《機器學習基石》資源彙總

原文 重磅 吳恩達新書 machine learning yearning 最新版分享 紅色石頭的個人 redstonewill.com 首先附上這門課的主頁 hsuan tien lin 機器學習基石 機器學習基石 林軒田 這門課主要涉及機器學習關鍵問題的四個方面 其中每個方面包含4節課,總共有1...