機器學習 理論知識

2021-10-01 14:21:10 字數 1228 閱讀 5156

一、混淆矩陣(confusion matrix)

混淆矩陣也稱誤差矩陣,是表示精度評價的一種標準格式,用n行n列的矩陣形式來表示。具體評價指標有總體精度、製圖精度、使用者精度等,這些精度指標從不同的側面反映了影象分類的精度。在人工智慧中,混淆矩陣(confusion matrix)是視覺化工具,特別用於監督學習,在無監督學習一般叫做匹配矩陣。矩陣的每一行表示**類中的例項,而每一列表示實際類中的例項(反之亦然)。這個名字源於這樣乙個事實,即很容易看出系統是否混淆了兩個類。

二、損失函式(loss function)

在數學優化,統計學,計量經濟學,決策理論,機器學習和計算神經科學等領域,損失函式或成本函式是將一或多個變數的乙個事件或值對映為可以直觀地表示某種與之相關「成本」的實數的函式。

三、先驗知識(prior knowledge)

先驗(apriori; 先天)在拉丁文中指『來自先前的東西』,或稍稍引申指『在經驗之前』。近代西方傳統中,認為先驗指無需經驗或先於經驗獲得的知識。先驗知識不依賴於經驗,比如,數學式子2+2=4;恆真命題『所有的單身漢一定沒有結婚』。

四、引數(parameter)

在數學和統計學裡,引數是使用通用變數來建立函式和變數之間關係(當這種關係很難用方程來闡述時)的乙個數量。

五、遷移學習(transfer learning)

遷移學習是一種機器學習方法,就是把為任務a開發的模型作為初始點,重新使用在為任務b開發模型的過程中。遷移學習是通過從已學習的相關任務中轉移知識來改進學習的新任務,雖然大多數機器學習演算法都是為了解決單個任務而設計的,但是促進遷移學習的演算法的開發是機器學習社群持續關注的話題。遷移學習對人類來說很常見,比如,我們可能會發現學習識別蘋果可能有助於識別梨,或者學習彈奏電子琴可能有助於學習鋼琴。

六、準確率(accuracy)

分類模型的正確**所佔的比例。在多類別分類中,準確率的定義為:正確的**數/樣本總數。在二元分類中,準確率的定義為:(真正例數+真負例數)/樣本總數。

機器學習 理論知識 實踐 KNN演算法

5knn引數說明 從訓練集合中獲取k個離待 樣本距離最近的樣本資料 根據獲取得到的k個樣本資料來 當前待 樣本的目標屬性值。在knn回歸應用中,一般採用平均值法或者加權平均值法。kd樹採用從m個樣本的n維特徵中,分別計算n個特徵取值的方差,用方差最大 的第k維特徵n kn k nk 作為根節點。對於...

機器學習高階理論知識列表

個人學習收藏,侵刪 知識列表選自貪心科技的 機器學習高階訓練營 第5期的宣傳廣告,課程內容相比往期有大幅更新,一方面新增了對前沿主題的講解如圖神經網路 gcn,gat等 另外一方面對核心部分 如凸優化 強化學習 加大了對理論層面上的深度。除此之外,也會包含科研方 元學習 解釋性 fair learn...

機器學習理論 GMM模型

李航.統計學習方法中高斯混合模型僅介紹一元高斯分布的情況,周志華.機器學習則採用多元高斯分布的寫法,但求解過程不夠突出em演算法的思想。此外,李航.統計學習方法中的一些寫法會產生誤解。因此下面過程主要根據李航.統計學習方法中的推導方法,但會有部分修正。gmm演算法主要利用em演算法來估計高斯混合模型...