聚類和分類演算法的區別
解讀結果不同。聚類演算法的結果是將不同的資料集按照各自的典型特徵分成不同類別,不同人對聚類的結果解讀可能不同;而分類的結果卻是乙個固定值(例如高、中、低、是、否等),不存在不同解讀的情況。
模型評估指標不同
而分類模型的指標例如準確率、混淆矩陣、提公升率等都有明顯的好與壞、提公升程度等評估指標。例如準確率、混淆矩陣、提公升率等都有明顯的好與壞、提公升程度等評估指標。
假如原始資料集帶有類別標籤,那麼選擇分類或聚類演算法都可以(標籤列資料並不是一定要使用)。假如原始資料集不帶有類別標籤,那麼只能選擇使用聚類演算法。
有關分類和聚類的應用示例
聚類 分類演算法 聚類演算法和分類演算法總結
k means 是一種典型的劃分聚類演算法,它用乙個聚類的中心來代表乙個簇,即在迭代過程中選擇的聚點不一定是聚類中的乙個點,該演算法只能處理數值型資料 k modes k means演算法的擴充套件,採用簡單匹配方法來度量分型別資料的相似度 k prototypes 結合了k means和k mod...
分類和聚類的區別
分類 classification 是這樣的過程 它找出描述並區分資料類或概念的模型 或函式 以便能夠使用模型 類標記未知的物件類。分類分析在資料探勘中是一項比較重要的任務,目前在商業上應用最多。分類的目的是學會乙個分類函式或分類模型 也常常稱作分類器 該模型能把資料庫中的資料項對映到給定類別中的某...
分類和聚類的區別
1.分類 在機器學習中,分類是一種有監督的學習,每個訓練資料都已經做好標籤,打上了標記。比如 乙個人是否喜歡玩電腦遊戲的問題。給出的訓練資料的特徵值包含年齡,性別,收入等,並且每條資料都標註上是否喜歡玩電腦遊戲。然後使用構建決策樹模型的相應演算法 id3,c4.5 訓練出分類模型。此過程就是在進行分...