1.2 監督學習
1.統計學習的特點
1.以計算機及網路為平台,是建立在計算機及網路之上的
2.以資料為研究物件,是資料驅動的學科
3.目的是對資料進行**和分析
4.以方法為中心,構建模型並應用模型進行**與分析
5.是概率論,統計學,資訊理論,計算理論,最優化理論,及電腦科學等多個領域的交叉學科,並且在發展中逐步形成獨自的理論體系與方**
2.統計學習的物件
3.統計學習的目的
1.對資料進行**與分析,使得計算機更加智慧型化,或者讓計算機的效能得到提高,給人們帶來新的發現
4.統計學習的方法
1.三要素:模型,策略,演算法
1.21基本概念
輸入空間 特徵空間 輸出空間
輸入可能取值的集合 所有特徵向量存在的空間 輸出可能 取值的集合
表示輸入例項x的特徵向量
連續變數------回歸問題
有限個離散變數------分類問題
輸入與輸出變數均為變數序列------標註問題
1.22聯合概率分布
聯合概率是指在多元的概率分布中多個隨機變數分別滿足各自條件的概率。假設x和y都服從正態分佈,那麼p就是乙個聯合概率,表示x<4,y<0兩個條件同時成立的概率。表示兩個事件共同發生的概率。a與b的聯合概率表示為 p(ab) 或者p(a,b),或者p(a∩b)(摘抄自360百科)
1.23假設空間
監督學習(supervised learning)的任務是學習乙個模型,使模型能夠對任意給定的輸入,對其相應的輸出做出乙個好的**。模型屬於由輸入空間到輸出空間的對映的集合,這個集合就是假設空間(hypothesis space)。假設空間的確定意味著學習範圍的確定。
李航統計學習方法筆記1 統計學習方法概論
模型 由輸入到輸出的對映 假設空間 由輸入空間到輸出空間的對映多集合 模型 由條件概率分布p y x 或決策函式y f x 表示 損失函式 度量模型一次 的好壞,用乙個損失函式來度量 錯誤的程度 風險函式 度量平局意義下模型 的好壞 經驗風險 模型f x關於訓練資料集的平均損失 當模型上條件概率分布...
李航 統計學習方法 筆記 1 統計學習方法概論
統計學習由監督學習 非監督學習 半監督學習和強化學習等組成,本書主要討論監督學習。監督學習的任務是學習乙個模型,使模型能夠對任意給定的輸入,對其相應的輸出做出乙個好的 方法 模型 策略 演算法 在監督學習過程中,模型就是所要學習的條件概率分布或決策函式。策略即從假設空間中選取引數最優模型,模型的分類...
李航 統計學習方法 學習筆記 1 統計學習方法概論
1.4 模型評估與模型選擇 1.5 其他.考研終於告一段落,接下來是安心等待入學。想利用這段時間系統學習一下機器學習基礎,簡單記錄一下自己的學習過程,也算是對自己的一種監督。下面詳細介紹一下 策略 首先引入損失函式與風險函式的概念。損失函式度量模型一次 的好壞,風險函式度量平均意義下模型 的好壞。統...