總結自 《機器學習》 周志華基本術語:
資料:類似日常生活中的經驗,記錄關於乙個事件或物件的描述
屬性或特徵:反映事件或物件在某方面的表現或性質的事項,eg:顏色、根蒂
屬性值:屬性上的取值,eg:烏黑、青綠
屬性空間(樣本空間、輸入空間):屬性構成的空間,eg:用顏色、根蒂構成乙個關於西瓜的二維空間系,可以粗略的描述每乙個西瓜。
模型:泛指從資料中學得的結果
學習或訓練:從資料中產生模型的過程
訓練資料:訓練過程中使用的資料
學習演算法:從資料中產生模型的演算法
樣本:包含屬性的具體事例
示例:訓練過程中使用的樣本
標記:關於示例結果的資訊
樣例:擁有標記資訊的示例
測試:學得模型後對樣本進行**的過程
分類:**的是離散值(需要標記資訊)
回歸:**的是連續值(需要標記資訊)
聚類:將訓練集中的物件自動分成若干組(聚類前不知道標記資訊)
監督學習:訓練資料有標記資訊
無監督學習:訓練資料無標記資訊
版本空間:滿足訓練集測試的「假設」的集合
歸納偏好:機器學習演算法在學習過程中對某種型別假設的偏好
nft定理(沒有免費的午餐 no free lunch theorem):在所有問題同等重要時,學習演算法的誤差期望都是相同的
nft定理的意義:脫離具體問題討論學習演算法的優劣是沒有意義的,只有在針對具體問題時學習演算法才能體現出差異
機器學習筆記(一) 了解機器學習
1 人工智慧是我們想要達成的目標,機器學習是想要達成目標的手段,深度學習就是機器學習的其中乙個方法。2 機器學習,根據你提供的資料尋找乙個function,如下圖,輸入一段語音知道是 how are you 輸入貓的知道是 貓 怎樣找出這個function呢?第一,要有一系列的function,即模...
機器學習筆記(一)
機器學習筆記 1,2課 一.線性回歸模型 1.數學模型 對於乙個具體的問題,x1,x2 是我們所選取的特徵,h x 是我們所建立的模型,其中有n 1個引數。我們希望所建立的數學模型可以很好的刻畫實際問題,而我們所擁有的就是訓練資料集。很自然的,我們希望數學模型可以較好的表述訓練資料集的情況。雖然對訓...
機器學習筆記(一)
統計學習三要素 模型 策略和演算法。模型分類有幾種,監督非監督,引數非引數等。監督學習又分為生成方法和判別方法。生成模型有 樸素貝葉斯和隱馬爾科夫。判別模型有 k近鄰,感知機,決策樹,邏輯回歸,em,svm,boost,crf.引數模型 引數個數固定,與訓練資料無關。非引數模型 引數個數依賴於訓練資...