ai新人必看 | 引數和超引數還分不清楚嗎?
計算機學科裡有太多的術語,而且許多術語的使用並不一致。哪怕是相同的術語,不同學科的人理解一定有所不同。
比如說:「模型引數(model parameter)」和「模型超引數(model hyperparameter)」。
對於初學者來說,這些沒有明確定義的術語肯定很令人困惑。尤其是對於些來自統計學或經濟學領域的人。
我們來仔細研究一下這些條款。
什麼是模型引數?
模型引數是模型內部的配置變數,其值可以根據資料進行估計。
模型在進行**時需要它們。
它們的值定義了可使用的模型。
他們是從資料估計或獲悉的。
它們通常不由程式設計者手動設定。
他們通常被儲存為學習模型的一部分。
引數是機器學習演算法的關鍵。它們通常由過去的訓練資料中總結得出。
在經典的機器學習文獻中,我們可以將模型看作假設,將引數視為對特定資料集的量身打造的假設。
最優化演算法是估計模型引數的有效工具。
統計:在統計學中,您可以假設乙個變數的分布,如高斯分布。高斯分布的兩個引數是平均值(μ)和標準偏差(西格瑪)。這適用於機器學習,其中這些引數可以從資料中估算出來並用作**模型的一部分。
程式設計:在程式設計中,您可以將引數傳遞給函式。在這種情況下,引數是乙個函式引數,它可能具有乙個值範圍之一。在機器學習中,您使用的特定模型是函式,需要引數才能對新資料進行**。
模型是否具有固定或可變數量的引數決定了它是否可以被稱為「引數」或「非引數」。
模型引數的一些示例包括:
神經網路中的權重。
支援向量機中的支援向量。
線性回歸或邏輯回歸中的係數。
什麼是模型超引數?
模型超引數是模型外部的配置,其值無法從資料中估計。
它們通常用於幫助估計模型引數。
它們通常由人工指定。
他們通常可以使用啟發式設定。
他們經常被調整為給定的**建模問題。
我們雖然無法知道給定問題的模型超引數的最佳值,但是我們可以使用經驗法則,在其他問題上使用複製值,或通過反覆試驗來搜尋最佳值。
當機器學習演算法針對特定問題進行調整時(例如,使用網格搜尋或隨機搜尋時),那麼正在調整模型的超引數或順序以發現導致最熟練的模型的引數**。
「許多模型有不能從資料直接估計的重要引數。例如,在k近鄰分類模型中…因為沒有可用於計算適當值的分析公式,這種型別的模型引數被稱為調整引數。」
- 第64-65頁,《應用**模型》,2013
如果模型超引數被稱為模型引數,會造成很多混淆。克服這種困惑的乙個經驗法則如下:
如果必須手動指定模型引數,那麼它可能是乙個模型超引數。
模型超引數的一些例子包括:
訓練神經網路的學習速率。
用於支援向量機的c和sigma超引數。
k最近鄰的k。
總之,模型引數是根據資料自動估算的。但模型超引數是手動設定的,並且在過程中用於幫助估計模型引數。
模型超引數通常被稱為引數,因為它們是必須手動設定和調整的機器學習的一部分。
引數和超引數
舉例說明一些機器學習演算法中的普通引數和超引數 機器學習演算法 普通引數舉例 超引數舉例 決策樹在每個節點上選擇的輸入變數 每個節點上選擇的閾值 每個葉節點所應包括的最少資料量,訓練後的剪枝 pruning 策略 隨機森林 同上決策樹的數量,輸入變數的數量 支援向量機 支援向量 support ve...
模型引數和超引數
總結個人理解 機器學習中的模型引數和模型超引數在作用 等方面都有所不同,而模型超引數常被稱為模型引數,這樣,很容易對初學者造成混淆。本文給出了模型引數和模型超引數的定義,並進行了對比,指出了二者本質上的區別 模型引數是模型內部的配置變數,可以用資料估計模型引數的值 模型超引數是模型外部的配置,必須手...
引數和超引數的區別
計算機學科裡有太多的術語,而且許多術語的使用並不一致。哪怕是相同的術語,不同學科的人理解一定有所不同。比如說 模型引數 model parameter 和 模型超引數 model hyperparameter 對於初學者來說,這些沒有明確定義的術語肯定很令人困惑。尤其是對於些來自統計學或經濟學領域的...