機器學習作為人工智慧的核心學科,倍受大家的關注,所以對於機器學習的知識掌握的要求是比較嚴格的,只有紮實的基礎知識我們才能夠學好機器學習。雖然說機器學習知識是十分廣泛的,但我們還是要一步一步慢慢了解其中的內容,這樣我們才能夠做好機器學習知識的儲備。好了,我們現在就進入正題。
(1)測試資料就是有意不用於訓練的樣本。驗證資料集和測試資料集是測試資料的兩個例子。測試資料幫助評估模型泛化到除了訓練資料之外的資料的能力。測試集的損失比訓練集的損失提供了對未知資料集的損失更好的估計。
(2)超引數就是連續訓練模型的過程中可以擰動的旋鈕。
(3)隱藏就是神經網路中位於輸入層和輸出層之間的合成層。乙個神經網路包含乙個或多個隱藏層。
(4)評分者間一致性是用來衡量一項任務中人類評分者意見一致的指標。如果意見不一致,則任務說明可能需要改進。有時也叫標註者間信度或評分者間信度。
(5)kernel 支援向量機是一種分類演算法,旨在通過將輸入資料向量對映到更高維度的空間使正類和負類之間的邊際最大化。當我們考慮乙個輸入資料集包含一百個特徵的分類問題。為了使正類和負類之間的間隔最大化,ksvm 從內部將特徵對映到百萬維度的空間。ksvm 使用的損失函式叫作 hinge 損失。
(6)推斷就是在機器學習中,通常指將訓練模型應用到無標註樣本來進行**的過程。在統計學中,推斷指在觀察到的資料的基礎上擬合分布引數的過程。
(7)輸入層就是神經網路的第一層(接收輸入資料)。
(8)l1損失函式,損失函式基於模型對標籤的**值和真實值的差的絕對值而定義。l1損失函式比起 l2損失函式對異常值的敏感度更小。
(9)l1正則化就是一種正則化,按照權重絕對值總和的比例進行懲罰。在依賴稀疏特徵的模型中,l1 正則化幫助促使不相關的特徵的權重趨近於0,從而從模型中移除這些特徵。
(10)l2 正則化是一種正則化,按照權重平方的總和的比例進行懲罰。l2正則化幫助促使異常值權重更接近0而不趨近於 0。l2正則化通常改善線性模型的泛化效果。
機器學習基礎知識
machine learning的主要兩個應用方面 人工智慧 資料科學。什麼是人工智慧 artificial intelligence ai是不確定性管理 uncertainty management 的體現 ai what to do when you don t know what to do ...
機器學習基礎知識
機器學習基礎知識 1 誤差 學習器實際 輸出與樣本的真實輸出之間的差異稱為 誤差 有經驗誤差 也成訓練誤差 和泛化誤差。我們實際需要的是泛化誤差較小的學習器。2 過擬合與欠擬合 過擬合 學習能力太過強大,把訓練樣本中的特殊特性當作一般特性導致泛化效能下降。欠擬合 學習能力低下,不能很好的 輸出。3 ...
機器學習基礎知識
為了解決任務t,設計一段程式,從經驗e中學習,達到效能度量值p,當且僅當有了經驗e後,經過p評判,程式在處理t時的效能得到提公升1.特徵表示 2.選擇模型 3.訓練模型 4.模型評估 1.模型 2.策略 3.演算法 1.有監督學習 1.1 分類 樣本標籤屬於離散變數 判別模型 1.2 回歸 樣本標籤...