統計方法三要素 模型 策略 演算法

2021-10-01 21:10:03 字數 1019 閱讀 5716

參考:

條件概率分布或決策函式,在監督學習中指的是所有可能的目標分布或函式的假設空間。

按照什麼樣的準則學習,從而得到最優的模型,比如損失函式、風險函式、正則化、經驗風險、結構風險等等。

損失函式 度量 模型一次**的好壞。

風險函式 度量平均意義模型**的好壞。

損失函式值越小,模型越好。由於模型的輸入、輸出是隨機變數,遵循聯合概率分布p(x, y),所以損失函式的期望:

這是理論下模型f(x)關於聯合概率分布p(x, y)平均意義下的損失,稱為風險函式(risk function)或期望損失(expected loss)。

學習的目標就是選擇期望風險最小的模型。

給定乙個訓練資料集 t = 。

模型關於訓練資料集平均損失稱為經驗風險(empirical risk) 或經驗損失(expirical loss),記作remp(f):

根據大數定理,當樣本容量n趨於無窮時,經驗風險remp(f) 趨於 期望風險rexp(f)。所以乙個自然的想法就是使用經驗風險估計期望風險

但是,由於訓練樣本小,所以使用經驗風險估計期望風險並不理想。要對經驗風險進行矯正,這就需要監督學習的兩大策略:

學習模型的具體計算方法,比如梯度下降、隨機梯度下降等。

統計學習三要素 模型 策略 演算法

統計學習方法都是由模型 策略和演算法構成的,即 方法 模型 策略 演算法 統計學習首要考慮的問題是學習什麼樣的模型。在監督學習過程中,模型就是所要學習的條件概率分布或決策函式。模型的假設空間 hypothesis space 包含所有可能的條件概率分布或決策函式。例如,假設決策函式是輸入變數的線性函...

統計學習三要素 模型 策略 演算法

統計學習方法都是由模型 策略和演算法構成的,即 方法 模型 策略 演算法 統計學習首要考慮的問題是學習什麼樣的模型。在監督學習過程中,模型就是所要學習的條件概率分布或決策函式。模型的假設空間 hypothesis space 包含所有可能的條件概率分布或決策函式。例如,假設決策函式是輸入變數的線性函...

統計學習方法三要素

本文節選自李航博士 統計學習方法 第一章第三節的內容。文中將統計學習方法簡單表示為如下公式。另外,後文中提及的內容主要是針對監督學習進行說明。方法 模型 策略 演算法 監督學習過程中,模型就是所要學習的條件概率分布或決策函式 即訓練集到樣本集的對映函式 其假設空間包括所有可能的條件概率分布或決策函式...