機器學習中模型 策略 演算法的區別和聯絡

2021-09-19 10:35:38 字數 1333 閱讀 3091

統計機器學習是關於計算機基於資料構建概率統計模型並運用模型對資料進行**與分析的一門學科。統計機器學習通過對已知資料構建模型,從而完成對未知的資料進行**和分析,**和分析這種行為可以使得計算機看起來很智慧型,這就是人工智慧的一種體現。統計機器學習的總目標就是考慮學什麼樣的模型和如何學習模型,以使得模型能夠對未知資料進行準確的**和分析。統計機器學習方法的三要素就是:模型、策略和演算法。

機器學習+統計=資料科學

模型統計學習首要考慮的問題是學習什麼樣的模型。在監督學習過程中,模型就是所要學習的條件概率分布或決策函式。

資料構成假設空間,在這個假設空間中包含所有可能的條件概率分布或者決策函式,每乙個條件概率分布或者決策函式對應乙個模型,那麼這個樣本空間中的模型個數有無數個。

怎樣理解模型呢?簡單來說就是使用什麼對映函式來表示特徵x和y標籤之間的關係f,f有兩種形式:f=或者f=

f=為決策函式,它表示的模型為非概率模型。f=是條件概率表示,它的模型為概率模型。

模型策略

策略即從假設空間中挑選出引數最優的模型的準則。模型的分類或**結果與實際情況的誤差(損失函式)越小,模型就越好。

我們前面已經知道在樣本空間中有無數的模型,但模型有好有壞,現在的問題考慮的是按照什麼樣的準則學習或者選擇最優模型,而策略就是通過引入損失函式的方式來度量模型的好壞。

設定損失函式,這樣監督學習問題就變成了最小化損失函式,那麼按照這樣的策略,就可以求解出最優化的模型了。

風險損失

演算法演算法是指學習模型的具體計算方法,也就是如何求解全域性最優解,並使得這個過程高效而且準確,本質上就是計算機演算法,怎麼去求數學問題的最優化解。

前面我們知道了模型有無數種,獲取最好模型的方法就是最小化損失函式,那麼此時的模型就是最好的,現在的問題就是如何才能獲取到這個最優化的解呢?是正規方程還是梯度下降等等。

梯度下降演算法

總結統計機器學習基於訓練資料集,根據學習策略,從假設空間中選擇最優模型、最後需要考慮用什麼樣的計算方法求解最優模型,所以我們可以認為統計機器學習都是由模型、策略和演算法構成的。統計學習方法之間的不同,主要來自其模型、策略、演算法的不同。確定了模型、策略、演算法,統計學習的方法也就確定了。

機器學習演算法 模型 總章

2.分類和回歸 有監督學習 3.聚類 無監督學習 4.降維 無監督學習 5.整合學習 6.階段性總結 7.機器學習介紹 機器學習介紹 高階 我們根據模型訓練方式的不同,可以將機器學習的模型分為有監督學習和無監督學習兩大類。而根據學習目標的不同,有監督的學習可以分為分類和回歸兩類方法。機器學習演算法 ...

機器學習中的線性模型

所謂線性模型就是用於 的模型是線性的,可以寫成以下的形式 y w,x w1 x1 wdx d b 其中w w1 w 2 wd 在有的地方也有另一種形式,比如 y w,x w0 w1x 1 wdxd 就是相當於把代表斜率的w 和 b寫在了一起,x 1,x 1,x2 x d 最後可得y w b 基本的最...

機器學習中線性模型和非線性的區別

1 線性和非線性的區別是是否可以用直線將樣本劃分開 這個觀點是對的 2 線性模型可以是用曲線擬合樣本,但是分類的決策邊界一定是直線的,例如logistics模型 3 區分是否為線性模型,主要是看乙個乘法式子中自變數x前的係數w,如果w只影響乙個x,那麼此模型為線性模型。或者判斷決策邊界是否是線性的線...