這是加州理工學院的《機器學習與資料探勘》的公開課的第一講:學習問題。整節課從下面五個方面進行,(1)機器學習的例子,(2)學習的構成,(3)乙個簡單的模型,
(4)學習的型別,(5)一道思考題。
1、機器學習的例子:**觀眾會如何評價一部電影
2、學習的構成
學習的組成一般有:輸入、輸出、目標函式、訓練集(輸入輸出構成的)、假設函式
目標函式是未知的,是我們要求解的。通過客觀分析得到乙個假設集,然後訓練集通過學習演算法不斷學習,最終得到乙個無限接近目標函式的假設函式。假設函式即是最終解。
3.學習模型
h是整個假設集,g是最終解,h是h中任意乙個元素。
(1)乙個簡單的假設集——感知器
x1,x2,....,xd是固定的,通過改變wi和w0的值找到滿意的解。然後設定零點x0,使得整個等式符號為正,這樣整個式子變為w向量和x向量的內積。
(2)乙個簡單的學習演算法—— pla
利用給定的訓練集通過上面的感知器假說集進行運算,然後找出分類錯誤的點,並調節權制w。如圖,當h(x)=+1即y=+1分類錯誤時,權值向量w與輸入向量的夾角小於90度,所以改變權值使得w=w+yx,會使得h(x)=-1。反之同理可得y=-1的情況。
對於因為乙個分類錯誤的點調節權值而導致所有點分類錯誤的情況,可選擇乙個分類錯誤的點進行pla的不斷迭代。
4.學習型別
機器學習的本質是利用很多的觀察結果即資料去挖掘乙個潛在的過程。機器學習分為三類:(1)監督學習,(2)非監督學習,(3)增強學習
假設你有乙個售貨機,需要自動識別硬幣值。
(1)你可以實際測量每種硬幣的尺寸,得出對值(尺寸,幣值),然後學習就可以自動分類到確定幣值,這就是監督學習。監督學習會給定訓練集包含輸入和正確的輸出(input, correct output) 。
(2)你也可以不測硬幣的尺寸,直接進心識別,然後會識別出不同尺寸堆的硬幣,但無法得知每種尺寸的硬幣的幣值,這就是非監督學習。非監督學習給定訓練集只包含輸入,不包含輸出(input,?)
(3)增強學習是指給定輸入和一些輸出,並對輸出進行評價,從而矯正答案。(input,some output,grade for output)
機器學習Lesson 1 機器學習簡介
e the experience of playing many games of checkers t the task of playing checkers.p the probability that the program will win the next game.它被稱作監督學習是因...
Lesson 1 計算機基礎
1.1計算機是什麼?2.1 計算機語 的基本概念 解釋型語 代表語 python 3.1 互動 式的種類 3.3 dos命令 4.1 本 件 ascii 美國 編碼 使 7位來對美國常 的字元進 編碼 包含128個字元 包括 數字 0 9 大小寫字母 52個 控制字元 32個 專用 34個 iso ...
lesson1 變數型別 運算子
counter 100 賦值整型變數 miles 1000.0 浮點型 name 哦哦哦哦 字串 print counter print miles print name a b c 1print a,b,c 1 1 1a,b,c 1,2,john print a,b,c 1 2 johnpytho...