基本術語
定義:假設可以使用p來評估電腦程式在某類任務t上的效能,若乙個程式通過利用經驗e在t中任務上獲得效能提公升,就可以說關於t和p。該程式對e進行了學習。
資料集 data set
一條記錄就是乙個事件或物件 ------ 乙個示例 instance 樣本 sample
物件某方面表現或性質 ----屬性 attribute 特徵 feature
屬性的取值 ----屬性值
屬性張成的空間 ----屬性空間 樣本空間 輸入空間
資料集 d=\
**值是離散值 ----分類
**值是連續值 ----回歸
兩個類別的 ----二分類 正類 反類/負類
多個類別 ---- 多分類
**任務 一般是 通過訓練集 建立從輸入空間 -----> 輸出空間的對映
f: x->y
二分類 y= 或者
多分類 |y| > 2
回歸任務 y=r r是實數集
測試 測試樣本 用y=f(x)
聚類 訓練集的資料分成若干組,每個組成為簇
通常 聚類學習中, 分組的資訊是沒有標記的
是否有標記資訊 分為 監督學習 無監督學習
分類、回歸任務基本就是監督學習
聚類基本就是無監督學習
泛華能力 學得的模型適用於新樣本的能力
機器學習概念
recommendation engine 推薦引擎 dbr demographic based recommendation 基於人口統計學的推薦 cbr context basedrecommendation 基於內容的推薦 cf collaborative filtering協同過濾 ucf ...
機器學習概念
機器學習概念 機器學習是一門從資料中研究演算法的科學學科。機器學習直白來講,是根據已有的資料,進行演算法選擇,並基於演算法和資料構建模型,最終對未來進行 來看看大佬對機器學習的定義吧,美國卡內基梅隆大學 carnegie mellon university 機器學習研究領域的著名教授tommitch...
機器學習 深度學習概念
機器學習 machine learning 是一門專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能的學科。深度學習 deep learning 是機器學習研究中的乙個新的領域,其動機在於建立 模擬人腦進行分析學習的神經網路,它模仿人腦的機...