斯坦福機器學習筆記 1

2021-08-10 11:09:34 字數 651 閱讀 7001

邏輯回歸與線性回歸:

線性回歸主要應用於連續性的模型,邏輯回歸主要用於解決分類問題,**的結果通常是非0即1。

今天的課程主要**的是如何預防過擬合。

主要有兩種方法:

1)減少特徵數目 :通過在cost function後加一些額外的term,來減少某些個別特徵的權重

2)regularization(正則化):減小所有特徵的值 m

關於神經網路的結構:

神經網路的輸入通常會多加乙個偏置單元,x0=1;偏置單元的係數通常並不參與正則化。

斯坦福機器學習筆記五

有時候發現訓練出來的模型誤差很大,會有很多解決辦法。例如 增加更多的訓練樣本,減少特徵數目,增加特徵數目,增加多項式特徵,減小或增大正則化引數 的值 但是這些嘗試往往會浪費很多時間,所有這裡提出了一種機器學習診斷法。1 資料的分配 將資料分為三部分,訓練集 60 交叉驗證集 20 和測試集 20 利...

斯坦福機器學習筆記十

這裡以電影推薦的栗子來說明什麼是推薦系統。nu 代表使用者的數量 nm 代表電影的數量 r i,j 如果使用者給電影評過分,則r i,j 1 y ij 代表使用者i給電影j的評分 mj 代表使用者j評過分的電影總數 j 代表使用者j的引數向量 x i 代表電影i的特徵向量 如圖所示,推薦系統能夠幫我...

斯坦福機器學習筆記十二

由於大規模資料集求最優解,計算量非常大,對於這樣的問題,如果能夠將資料集分配給多台計算機,讓每台計算機處理資料集的乙個子集,然後將計算結果彙總再求和,這樣的方法叫做對映簡化。如果任何學習演算法能夠表達為,對訓練集的函式求和,那麼就能將這個任務分配給多台 計算機 或者同一臺計算機的不同cpu核心 以達...