機器學習是通過計算的手段,利用經驗來改善系統自身的效能。在計算機的世界裡就是由計算機從資料中產生模型的演算法。
個人理解:機器學習是對某一物件提取其特徵,大量物件特徵的提取,組成乙個樣本集,找出特徵和我們關注結果之間的聯絡,該聯絡由計算機學習或訓練得到。再給乙個物件的作為輸出,我們通過該聯絡能夠得出正確的結果。
示例/樣本:記錄關於乙個事件或物件的描述
資料集:包含多條示例或樣本的集合
樣例:擁有標記資訊的示例(例如:結果)
標記空間/輸出空間:樣例的集合
1、分類(classification):資料離散
二分類(binary classification):正類(positive class)、反類(negative class)
多分類(multi-class classification)
2、回歸(regression):資料連續
3、聚類(clustering):將訓練集中的樣本分為不同的組
資料擁有標記為監督學習(supervised learning):分類、回歸
資料未有標記為無監督學習(unsupervised learning):聚類
定義:機器學習中對某種型別的假設的偏好。
任何乙個有效的機器學習演算法必有其歸納偏好。
常用的歸納偏好:奧卡姆剃刀——若多個假設與觀察者一致,則選最簡單的那個。
nfl(沒有免費的午餐)理論:f均勻分討論學習演算法則沒有意義。
機器學習領域和資料庫領域是資料探勘的兩大支撐
書中第八頁,nfl理論證明暫時沒有看懂,數學理論有待提高。
機器學習 緒論
機器學習所研究的主要內容就是從資料中產生模型,也就是學習演算法,給學習演算法提供經驗資料,基於這些資料訓練出新模型,在面對新的情況時,該模型會給我們提供相應的判斷。即從資料中產生模型,由模型作出相應的判斷和 基本術語 1 資料集 2 示例 樣本 3 屬性 4 屬性空間 樣本空間 5 特徵向量 6 維...
機器學習 緒論
1.1引言 喧鬧的教室突然變得鴉雀無聲,沒有抬頭的你第一反應就是老闆進了教室,趕緊就收起了手裡的手機。結果抬頭一看,老闆果真進來了 或者有時候抬頭一看,什麼也沒有,大家哈哈一笑。為什麼?為什麼你沒抬頭看就想到會是老闆進來了?因為你以前有過相同或者相似的經歷,也就是 經驗 所以你再一次經歷的時候,會根...
《機器學習》之 緒論
學習的定義 對於某類任務t和效能度量p,如果乙個電腦程式在t上以p衡量的效能隨著經驗e而自我完善,那麼我們稱這個電腦程式在從經驗e中學習。設計乙個學習系統 選取訓練經驗的型別,關鍵屬性是訓練經驗能否為系統的決策提供直接或間接的反饋 學習器可以在多大的程度上控制訓練樣例序列 訓練樣例的分布能多好地表示...