為了避免自己對知識遺忘過快,所以決定對自己學習機器學習的過程做一下記錄,也希望能幫到一些初學者!
1、基本術語:(非常重要)
資料集:記錄每條資料,資料由屬性和屬性值組成,這樣的集合稱為資料集合
示例、樣本、特徵向量:每條記錄是關於乙個事件或物件(這裡是乙個西瓜)的描述
屬性、特徵:反映時間或物件在某方面的表現或性質的事項
屬性空間、樣本空間、輸入空間:屬性張成的空間
維數:每個樣本由d個屬性描述(例如上面的西瓜資料使用了3個屬性),d(3)稱為該樣本的維數
學習、訓練:從資料中學的模型的過程
訓練資料:訓練過程中使用的資料
訓練樣本:每個訓練資料
訓練集:訓練樣本組成的集合
假設:學得模型對應了關於資料的某種潛在的規律
真相、真實:潛在規律自身
樣例:擁有了標記資訊的示例
標記空間、輸出空間:所有標記的集合
2、假設空間:
假設空間其實就是樣本屬性所有可能的取值組成的空間,如上圖色澤、根蒂、敲聲對應的屬性取值分別為(青綠、烏黑)、(蜷縮、硬挺、稍蜷)、(濁響、清脆、沉悶),*(星號)表示不確定值,還考慮好瓜不存在的情況,所以總共有3x4x4+1=49種情況。
3、版本空間:
存在與訓練集一致的假設集合稱為版本空間
4、歸納偏好:
如上圖1.2所示符合訓練集的假設不止乙個,那麼就需要歸納偏好來確定最終的假設,常用的就是奧卡姆剃刀原則。
5、nfl定理(沒有免費的午餐(no free lunch throrem)):
要想理解上面的公式首先的明白每個字元代表的含義:
課後習題Chapter1
相似之處 這兩個問題都是求最短的路徑 不同之處 最短路徑問題其實是給定了情景並且不需要遍歷所有的點只需要得到乙個點到另外乙個點的最短路徑就可以了,而旅行商人問題則需要遍歷所有的點並求得最短的路程,問題的複雜度不一樣。亦可以找到乙個最短的路徑,但是你無法找到乙個選擇一條送貨車行駛距離最短的送貨順序。其...
Chapter 1 內容梳理
目錄標準輸入與標準輸出 定位符號 scope operator 換行符號 endl 如何輸入eof 類,型別,成員,物件,變數等概念間的關係 從標準輸入讀取 v1,v1 從標準輸出列印求和結果 include includeint main std cout v2 std cout 輸出標準輸入與輸...
Chapter 1 什麼是強化學習?
強化學習的具體場景 決策 人agent與所在環境environment互動,決策人想要在不確定性環境下實現目標,決策人的行為會影響未來的環境狀態,從而影響決策人以後可以採取的行動和機會。正確的選擇需要考慮到行動的延遲後果,因此可能需要具有預見性。但是決策人行動的效果無法完全 因此,必須經常監控其環境...