L1正規表示式與L2正規表示式

2021-08-16 20:01:20 字數 1915 閱讀 9904

**:

一、 奧卡姆剃刀(occam』s razor)原理:

在所有可能選擇的模型中,我們應選擇能夠很好的解釋資料,並且十分簡單的模型。從貝葉斯的角度來看,正則項對應於模型的先驗概率。可以假設複雜模型有較小的先驗概率,簡單模型有較大的先驗概率。   

二、正則化項

2.1、什麼是正則化?

正則化是結構風險最小化策略的實現,在經驗風險上加乙個正則項或罰項,正則項一共有兩種l1正則化和l2正則化,或者l1範數和l2範數。對於線性回歸模型,使用l1正則化的模型叫做lasso回歸;使用l2正則化的模型叫做ridge回歸(嶺回歸)

2.2、正則化項和模型複雜度之間的關係

正則化項一般是模型複雜度的單調遞增的函式,模型越複雜,正則化值越大。

一般來說,監督學習可以看做最小化下面的目標函式:

上式中的第1項為經驗風險,即模型f(x)關於訓練資料集的平均損失;第2項為正則化項,去約束我們的模型更加簡單

三、l1範數

3.1概念:l1範數是指向量中各個元素絕對值之和。||

w||1

表示l1範數|

|w||

1表示l

1範數

3.2 為什麼l1範數會使權值稀疏?

任何的正則化運算元,如果他在wi=0的地方不可微,並且可以分解為「求和」 的形式,那麼這個正則化運算元就可以實現稀疏。

3.3 引數稀疏有什麼好處?

(1)特徵選擇(feature selection)

引數稀疏規則化能夠實現特徵的自動選擇,在特徵工程的過程中,一般來說,xi的大部分元素(特徵)都和其標籤yi沒有關係的。我們在最小化目標函式的時候,考慮了這些無關特徵,雖然可以獲得最小的訓練誤差,但是對於新的樣本時,這些沒用的資訊反而被考慮,干擾了對樣本的**。稀疏規則化將這些沒用的特徵的權重置為0,去掉這些沒用的特徵。

(2)可解釋性

將無關特徵置為0,模型更容易解釋。例如:患某種病的概率為y,我們收集到的資料x是1000維的,我們的任務是尋找這1000種因素是如何影響患上這種病的概率。假設,我們有乙個回歸模型:y=w1*x1+w2*x2+…+w1000*x1000+b,通過學習,我們最後學習到w*只有很少的非零元素。例如只有5個非零的w*,那麼這5個w*含有患上這種病的關鍵資訊。也就是說,是否患上這種病和這5個特徵相關,那事情變得容易處理多了。

四、l2範數

4.1 概念:l2範數是指向量各元素的平方和再開根號。||

w||表

示l2範

數 ||w

||表示

l2範數

正則化項可以取不同的形式。對於回歸問題中,損失函式是平方損失,正則化項為引數向量l2的範數。

4.2 為什麼l2範數可以防止過擬合?

左一:欠擬合;中間:正常擬合;右側:過擬合

線性回歸擬合圖

讓l2範數的正則項||w||2最小,可以使得w的每個元素都很小,都接近於0。(l1範數讓w等於0),而越小的引數說明模型越簡單,越簡單的模型越不容易產生過擬合的現象。(結合上圖線性回歸擬合圖可知,限制了某些引數很小,其實也就限制了多項式的某些分量的影響很小,這也就相當於減少了變數的個數)

正規表示式 1 初識正規表示式

簡單地說,正規表示式就是一套處理字串的規則和方法,以行為單位對字串進行處理,通過特殊的符號的輔助,我們可以快速的過濾,替換某些特定的字串。運維工作中,會有大量訪問日誌,錯誤日誌,大資料。如何能夠快速的過濾出我們需要的內容,這就需要正規表示式。awk,sed,grep egrep 三劍客要想能工作的更...

正規表示式 1 正規表示式基礎

1.正規表示式基礎 正規表示式描述了一種字串匹配的模式,即可以使使用者通過一系列普通字元或特殊字元構建能夠明確描述文字字串的匹配模式,可以用來檢查某個字串是否含有某種子字串,將匹配的子字串做替換或者從某個字串中取出符合某個條件的子字串等。1.1 正規表示式的基本結構 乙個正規表示式就是由普通字元 如...

正規表示式 正規表示式 總結

非負整數 d 正整數 0 9 1 9 0 9 非正整數 d 0 負整數 0 9 1 9 0 9 整數 d 非負浮點數 d d 正浮點數 0 9 0 9 1 9 0 9 0 9 1 9 0 9 0 9 0 9 1 9 0 9 非正浮點數 d d 0 0 負浮點數 正浮點數正則式 英文本串 a za z...