在機器學習方法中,泛化能力通俗來講就是指學習到的模型對未知資料的**能力。在實際情況中,我們通常通過測試誤差來評價學習方法的泛化能力。
泛化能力(generalization ability)是指乙個機器學習演算法對於沒有見過的樣本的識別能力。我們也叫做舉一反三的能力,或者叫做學以致用的能力。
舉個例子,通過學習,小學生就可以熟練的掌握加減法,那麼他們是怎麼做到的呢?第一步學生們先感性的知道了在有乙個蘋果的基礎上再拿來乙個蘋果的話就是一種加法,第二步知道個數可以用阿拉伯數字抽象的表示,到了0到9這十個數字和他們的抽象含義,第三步學習十以內的加減法,第四步推廣到了多位數的加減法。
我們訓練乙個機器學習演算法也是如此,通過感性的告訴機器乙個加上乙個等於兩個,之後演算法通過自己的學習,推廣計算多位數的加減法,多位數的加減法是無窮多個的,如果機器在不斷的測試中都能夠算對,那麼我們認為機器已經總結出了加法的內部規律並且能夠學以致用,如果說機器只會計算你給機器看過的比如3+3=6,而不會計算沒有教過的8+9=17,那麼我們認為機器只是死記硬背,並沒有學以致用的能力,也就是說泛化能力非常的低,同時我們也把這種現象叫做這個演算法過擬合(over-fitting)了。(過擬合是一種分類器會發生的現象,而泛化能力可以理解為對分類器的一種效能的評價)
過擬合通常可以理解為,模型的複雜度要高於實際的問題,所以就會導致模型死記硬背的記住,而沒有理解背後的規律。就比如說人腦要比唐詩複雜得多,即使不理解內容,我們也能背下來,但是理解了內容和寫法對於我們理解記憶其他唐詩有好處,如果死記硬背那麼就僅僅記住了而已。
欠擬合(under-fitting)是和過擬合相對的現象,可以說是模型的複雜度較低,沒法很好的學習到資料背後的規律。就好像克卜勒在總結天體執行規律之前,他的老師第谷記錄了很多的執行資料,但是都沒法用資料去解釋天體執行的規律並**,這就是在天體執行資料上,人們一直處於欠擬合的狀態,只知道記錄過的過去是這樣執行的,但是不知道道理是什麼。
不收斂一般是形容一些基於梯度下降演算法的模型,收斂是指這個演算法有能力找到區域性的或者全域性的最小值,(比如找到使得**的標籤和真實的標籤最相近的值,也就是二者距離的最小值),從而得到乙個問題的最優解。如果說乙個機器學習演算法的效果和瞎矇的差不多那麼基本就可以說這個演算法沒有收斂,也就是根本沒有去學習。
機器學習中常見的專業術語
模型 model 計算機層面的認知 學習演算法 learning algorithm 從資料中產生模型的方法 資料集 data set 一組記錄的合集 示例 instance 對於某個物件的描述 樣本 sample 也叫示例 屬性 attribute 物件的某方面表現或特徵 特徵 feature 同...
NLP專業術語
hyper parameters 在訓練模型時,有些引數是需要手動設定的,每個引數有乙個可選的範圍或者列表可供訓練,可以呼叫sklearn的gridsearchcv函式來自動統計搜尋。development set 在 中也簡寫成dev。一般在訓練模型時需要用到交叉驗證,這部分用來交叉驗證訓練的樣本...
oracle專業術語
entity實體 data 資料 attribute屬性 attribute set實體集 database資料庫 database management system,dbsm資料庫管理系統 information system 資訊系統 relational database managemen...