資料探勘聚類分析例項

在之前，我們已經學過了四大類聚類分析及其典型演算法。本文，我們將使用劃分方法中的k-均值演算法和層次聚類方法以乙個例項進行完整的聚類分析演示。

例題：為研究我國31個省、市、自治區2023年的城鎮居民生活消費的規律，根據調查資料作區域消費型別劃分。原始資料表1所示：

問題：

針對上述問題，採用k-means對其進行聚類（討論k取何值才是最優）；

採用層次聚類（討論採用歐式距離，分別用最短距離法、最長距離法、類平均法、中間距離法、重心法和ward法得出的聚類圖，哪個是最優的）。

請閱讀我的推文

源程式及資料已經上傳github

資料探勘之聚類分析學習筆記 2

聚類分析中的資料型別假設要聚類的資料集合包含 n 個資料物件，許多基於記憶體的聚類演算法選擇如下兩種有代表性的資料結構資料矩陣 data matrix 或稱為物件屬性結構它用 p 個變數也稱為屬性來表現 n 個物件，例如用年齡，身高，性別，種族等屬性來表現物件人這種資料結構是關係表的形...

資料探勘演算法之聚類分析（二）canopy演算法

canopy是聚類演算法的一種實現它是一種快速，簡單，但是不太準確的聚類演算法 canopy通過兩個人為確定的閾值t1，t2來對資料進行計算，可以達到將一堆混亂的資料分類成有一定規則的n個資料堆由於canopy演算法本身的目的只是將混亂的資料劃分成大概的幾個類別，所以它是不太準確的但是通過ca...

聚類分析（一）什麼是聚類分析

將一群物理物件或者抽象物件的劃分成相似的物件類的過程。其中類簇是資料物件的集合，在類簇中所有的物件都彼此相似，而類簇與類簇之間的物件是彼此相異。聚類除了可以用於資料分割 data segmentation 也可以用於離群點檢測 outlier detection 所謂的離群點指的是與普通點相對應...

資料探勘 聚類分析例項

資料探勘之聚類分析學習筆記 2

資料探勘演算法之聚類分析（二）canopy演算法

聚類分析（一） 什麼是聚類分析

相關推薦

資料探勘聚類分析例項

聚類分析（一）什麼是聚類分析