模式識別的形式
回歸回歸是分類的基礎,離散的類別值由回歸值做判別決策得到。
特徵的特性
特徵向量的相關性
投影殘差向量
歐氏距離
機器學習流程圖
目標函式的作用:引數可能沒有準確解或有無數解,所以要確定近似解
機器學習的方式
無監督式學習:不給定輸出真值(更難)
半監督式學習
強化學習:機器自行探索決策、真值滯後反饋的過程
誤差泛化能力
模型不僅對訓練樣本有決策能力,也對新的模式有決策能力。
提高泛化能力:
正則化:在目標函式中加入正則項
模型評估方法
k折交叉驗證
留一驗證
效能指標
類的原型
代表這個類的乙個模式或一組量
最近鄰距離度量
標準:方式:
med分類器
最小歐氏距離分類器
決策邊界:超平面,垂直平分兩個類原型的連線
特徵正交白化
去除特徵方差不同和特徵相關性
白化:尺度變換,使各維方差相同
micd分類器
最小類內距離分類器(馬氏距離)
決策邊界:
缺陷:
會選擇方差較大的類
原因:僅考慮觀測到的訓練樣本的分布情況,沒有考慮類的分布等先驗知識
後驗概率 p(c|x)
給定模式x屬於類c的可能性
貝葉斯規則
map分類器
最大後驗概率分類器
決策邊界:
決策誤差
未選擇的類所對應的後驗概率
觀測概率
高維高斯分布
損失當前決策動作相對於其他候選類別的風險程度
假定x屬於cj,決策動作αi的損失:λ(αi|cj),簡稱λij
可以用矩陣表示
決策風險
定義:所有候選類別的期望損失
貝葉斯分類器
決策風險最小
最小化期望損失:對每個測試樣本選擇風險最小的類
樸素貝葉斯分類器
特徵是多維的,假定特徵之間是獨立的
拒絕選項
引入閾值τ,後驗概率小於τ的決策會被拒絕
τ∈(1/k,1)
第一節課上,了解了很多模式識別和機器學習領域的應用,意識到機器學習技術與人們日常生活的密切聯絡,比如無人駕駛,文字識別,人臉識別,****等等各種應用,才發現在智慧型裝置如此普及的現在,人們的生活早已離不開機器學習技術的支撐,明白了機器學習的重要性。之後,在老師深入淺出的講解下,從機器學習的基本概念和原理,到分類器的講解以及優化,我了解了越來越多的知識。
同樣的,這門課也讓我明白了基本功的重要。。由於對之前線代、高數等知識的淡忘,在一些公式推導方面,學習的有些吃力。而課本又都不在家裡,沒法隨時查閱相關知識,所以對公式這方面學習的確實不怎麼紮實,以後肯定還要回過頭來再看幾遍才能掌握。。
機器學習第二次作業
學習心得 轉眼間這門課就結課了,但是每一次上課都會比較印象深刻,因為雖然都是線上學習,但是每門課的教學方式也不同,這門課是當時第一門大家比較集中性討論的課程。這次特殊的時期 特殊的經歷也帶來了不一樣的學習方式。為了適應線上學習,我在原本大學以來的學習習慣上進行了一定的修改。自大學以來,課程種類雜多,...
機器學習第二次作業
導圖 知識點總結歸納 第二節第三節 第四節第五節 第六節課後總結 模式識別是根據已有知識的表達,針對待識別模式,判別決策其所屬的類別或者 其對應回歸值。其數學解釋可以看作為一種函式對映f x 將待識別模式x從輸入空間對映到輸出空間。模型防止過擬合,應該提高其泛化能力,選擇合適的模型 正則化,模型可用...
第二次作業
execise02 1.查詢85年以後出生的學生姓名 性別和出生日期 2.列表顯示所有可能的學生選課組合 學號 課程號 3.查詢1 2 4班中陳姓同學的資訊 4.查詢所有及格的學生姓名 所選課程名及所得分數 5.統計各門課程的及格人數 課程編號 課程名 及格人數 6.統計各門課程的總人數 及格人數和...