機器學習筆記15 聚類

2022-06-24 18:09:12 字數 1234 閱讀 9753

1.聚類的主要內容

決策樹、隨機森林、svm等演算法用於回歸和分類問題,都是給定輸入x,和對應的給定結果值y(有監督),通過訓練得到模型y=f(x),通過模型得到y的**值,比較**值與真實值。

聚類(無監督)是對輸入的(x1,x2,...xm),若x為n維,則該資料實際是m*n維的矩陣,當對m個資料進行處理,分別歸到k個簇中,則資料會轉換為m*k維矩陣,這就實現了降維。

2.聚類的定義

注意:當p=2時,就是歐式距離。

3.聚類的基本事項

k-means演算法進行聚類,初值對聚類結果是有影響的,要注意初值的選取。

4.層次聚類方法

5.密度聚類

機器學習筆記 kMeans聚類

優點 容易實現。缺點 可能收斂到區域性最小值,在大規模資料集上收斂較慢。適用資料型別 數值型資料 k 均值演算法 先隨機確定k個初始點作為質心,然後將資料集中的每個點分配到乙個簇中,具體來講為每個點找距其最近的質心,並將其分配給該質心所對應的簇。再每個簇更新質心為該簇所有點的平均值。import n...

機器學習筆記12 聚類

在 無監督學習 中,訓練樣本的標記資訊是未知的,目標是通過對無標記訓練樣本的學習來揭示資料的內在性質及規律。此類學習任務中研究最多的是聚類。此外,無監督學習還有密度估計 異常檢測等。常見的聚類包括原型聚類 密度聚類 層次聚類等。原型聚類 此類演算法假設聚類結果能通過一組原型刻畫。通常情形下,演算法先...

機器學習筆記(九) 聚類

目錄 聚類 一詞最早應該出自 戰國策 中的 方以類聚,物以群分 這句話的意思是 同類的東西常聚在一起,志同道合的人相聚成群,反之就分開 將這句話中所發現的規律應用到我們的機器學習中對無標籤的資料進行處理,也即假設相似度高的輸入資料往往屬於同一類別,便是 聚類 的核心思想。形式化地說,假定樣本集 一般...