常用分類器的效果對比

2021-07-06 01:44:46 字數 1005 閱讀 9956

如果把機器學習歸為兩大類,那麼主要的工作可以分為:分類聚類。而分類任務基本上佔整個機器學習或者是資料探勘領域的70%,可見我們遇到的很多問題,都可以用分類的演算法進行解決。機器學習發展到現在,許多被證實有效的分類演算法被提出,例如我們經常會用到的k-近鄰分類器、樸素貝葉斯分類器、支援向量機(svm)、決策樹演算法等。大家平時在用的時候可能並不太清楚每種分類演算法適合哪種型別的資料,因為對於不同的資料集,上述演算法的效果可能有很大的區別,所以了解每種分類器的特點對於解決實際問題有很大的幫助。下圖是我從網上找的一張典型的分類器效能對比圖,我個人覺得很醒目,有一定的參考意義。

線性判別分析(linear discriminant analysis, lda),有時也稱fisher線性判別(fisher linear discriminant ,fld), 這種演算法是ronald fisher 於 2023年發明的,是模式識別的經典演算法。在2023年由belhumeur引入模式識別和人工智慧領域的。性鑑別分析的基本思想是將高維的模式樣本投影到最佳鑑別向量空間,以達到抽取分類資訊和壓縮特徵空間維數的效果,投影後保證模式樣本在新的子空間有最大的類間距離和最小的類內距離,即模式在該空間中有最佳的可分離性。因此,它是一種有效的特徵抽取方法。使用這種方法能夠使投影後模式樣本的類間散布矩陣最大,並且同時類內散布矩陣最小。就是說,它能夠保證投影後模式樣本在新的空間中有最小的類內距離和最大的類間距離,即模式在該空間中有最佳的可分離性。

二次型判別分析(quadratic discriminant analysis ,qda),其實是lda的一種變體,lda演算法中認為每個類別的協方差矩陣∑相同,而qda去掉了這條假設,每個類別的協方差矩陣是不同的。

生成式分類器對比條件式分類器

樸素貝葉斯分類器和最大熵分類器之間的乙個重要差異是他們可以被用來回答問題的型別。樸素貝葉斯分類器是乙個生成式分類器的例子,建立乙個模型,p input,label 對的聯合概率。因此,生成式模型可以用來回答下列問題 1.乙個給定輸入的最可能的標籤是什麼?2.對於乙個給定輸入,乙個給定標籤有多大可能性...

分類器常用評價指標

為正樣本 為負樣本 標記為正樣本 tp true positive fn false negative 標記為負樣本 fp false positive tn true negative accuracy a tp tn tp fn fp tn precision p tp tp fp recall...

Fragment 實現的 分類 效果

布局檔案的資訊 activity package stu.love.game import stu.love.artical.articallistfragment import stu.love.forum.forumfragment import stu.love.utils.imagecach...