希望m最終能取代m(假設集大小)
到底m會不會漲的很慢?假設的數量不會太多?
如果長得很慢,能不能取代掉原來的m?
mh成長函式:到底這個假設集,在n個點上,到底能產生多少種dichotomies?
如果是positive rays,在n=2時候就露出破綻,不能產生那種情形
如果是positive interval,在n=3露出破綻,有一些做不出來
如果是convex set,沒有絲毫破綻
如果是2d perceptrons,不知道成長函式長什麼樣子,但知道4個點的時候就露出一線曙光
k是個break point,k+1之後都是break point
shalter的意思:對n個點,有方法能分成2^n種二分法
最多只能產生四種二分法(為了堅持之前的承諾)
已經知道break point的情況下,其實也就確定了所作假設的型別。比如如果是一維射線,那break point就是2.
定義乙個新的定義:界限函式,bound function。說了成長函式在k有breakpoint,告訴我最多有幾種二分法。
不想要管成長函式到底長什麼樣子,想看到底有多少排列組合。
可以根據那個breakpoint來看,不用看具體是什麼樣的假設集
之前乙個個算出的,k=2的時候,一線曙光發生在k=2的時候,最多的二分法情況為3,4,在有2,3個點的時候。
把剩下的全部填好。第一列,當k=1,無論多少個點都是1.
當n<k,我有n個點,任何k個點不能shatter,條件說了跟沒說一樣,就是2^n種二分法。
當n=k的時候,對角線可以證明就減1,之後馬上滿足。
界限函式的值是15,但最多只能做出14種。b函式只是成長函式的上限,不一定有等號。
最後得出上限的上限。
機器學習基石 學習型別
二分類 多分類回歸 結構化學習 nlp領域相關 無監督學習 半監督學習 有監督學習 增強學習 沒有真實的輸出y,根據模型的輸出反饋,如果反饋結果良好,更接近真實輸出,就給其正向激勵,如果反饋結果不好,偏離真實輸出,就給其反向激勵。batch learning online learning acti...
台大機器學習基石 1
機器學習對於適用場景有一定的前提條件 可以找到某種模式 不容易程式設計實現,不能對目標下乙個簡單的定義 能找到訓練的資料,資料量越大越好 使用機器學習的乙個小例子 銀行信用卡批准 例如銀行會收到申請客戶的個人資料,然後根據個人資訊進行分析,選擇是否發放信用卡,以達到銀行最大收益。機器學習所扮演的角色...
《機器學習基石》 正則化
本節涉及的知識點包括 1 所謂正則化,就是在原來的假設空間上加上一定限制條件 2 推導線性回歸中引入l2正則 3 帶正則化約束條件的問題 等價於 無約束的加正則項的augmented error 4 vc維解釋正則的好處 5 選擇一般正則項的三個原則 6 l1正則和l2正則的對比 所謂正則化假設空間...