機器學習第二次作業

2022-05-27 12:51:13 字數 2267 閱讀 8719

模式識別的形式

回歸回歸是分類的基礎,離散的類別值由回歸值做判別決策得到。

特徵的特性

特徵向量的相關性

投影殘差向量

歐氏距離

機器學習流程圖

目標函式的作用:引數可能沒有準確解或有無數解,所以要確定近似解

機器學習的方式

無監督式學習:不給定輸出真值(更難)

半監督式學習

強化學習:機器自行探索決策、真值滯後反饋的過程

誤差泛化能力

模型不僅對訓練樣本有決策能力,也對新的模式有決策能力。

提高泛化能力:

正則化:在目標函式中加入正則項

模型評估方法

k折交叉驗證

留一驗證

效能指標

類的原型

代表這個類的乙個模式或一組量

最近鄰距離度量

標準:方式:

med分類器

最小歐氏距離分類器

決策邊界:超平面,垂直平分兩個類原型的連線

特徵正交白化

去除特徵方差不同和特徵相關性

白化:尺度變換,使各維方差相同

micd分類器

最小類內距離分類器(馬氏距離)

決策邊界:

缺陷:

會選擇方差較大的類

原因:僅考慮觀測到的訓練樣本的分布情況,沒有考慮類的分布等先驗知識

後驗概率 p(c|x)

給定模式x屬於類c的可能性

貝葉斯規則

map分類器

最大後驗概率分類器

決策邊界:

決策誤差

未選擇的類所對應的後驗概率

觀測概率

高維高斯分布

損失當前決策動作相對於其他候選類別的風險程度

假定x屬於cj,決策動作αi的損失:λ(αi|cj),簡稱λij

可以用矩陣表示

決策風險

定義:所有候選類別的期望損失

貝葉斯分類器

決策風險最小

最小化期望損失:對每個測試樣本選擇風險最小的類

樸素貝葉斯分類器

特徵是多維的,假定特徵之間是獨立的

拒絕選項

引入閾值τ,後驗概率小於τ的決策會被拒絕

τ∈(1/k,1)

第一節課上,了解了很多模式識別和機器學習領域的應用,意識到機器學習技術與人們日常生活的密切聯絡,比如無人駕駛,文字識別,人臉識別,****等等各種應用,才發現在智慧型裝置如此普及的現在,人們的生活早已離不開機器學習技術的支撐,明白了機器學習的重要性。之後,在老師深入淺出的講解下,從機器學習的基本概念和原理,到分類器的講解以及優化,我了解了越來越多的知識。

同樣的,這門課也讓我明白了基本功的重要。。由於對之前線代、高數等知識的淡忘,在一些公式推導方面,學習的有些吃力。而課本又都不在家裡,沒法隨時查閱相關知識,所以對公式這方面學習的確實不怎麼紮實,以後肯定還要回過頭來再看幾遍才能掌握。。

機器學習第二次作業

學習心得 轉眼間這門課就結課了,但是每一次上課都會比較印象深刻,因為雖然都是線上學習,但是每門課的教學方式也不同,這門課是當時第一門大家比較集中性討論的課程。這次特殊的時期 特殊的經歷也帶來了不一樣的學習方式。為了適應線上學習,我在原本大學以來的學習習慣上進行了一定的修改。自大學以來,課程種類雜多,...

機器學習第二次作業

導圖 知識點總結歸納 第二節第三節 第四節第五節 第六節課後總結 模式識別是根據已有知識的表達,針對待識別模式,判別決策其所屬的類別或者 其對應回歸值。其數學解釋可以看作為一種函式對映f x 將待識別模式x從輸入空間對映到輸出空間。模型防止過擬合,應該提高其泛化能力,選擇合適的模型 正則化,模型可用...

第二次作業

execise02 1.查詢85年以後出生的學生姓名 性別和出生日期 2.列表顯示所有可能的學生選課組合 學號 課程號 3.查詢1 2 4班中陳姓同學的資訊 4.查詢所有及格的學生姓名 所選課程名及所得分數 5.統計各門課程的及格人數 課程編號 課程名 及格人數 6.統計各門課程的總人數 及格人數和...