sl是single linkage的縮寫。slc演算法屬於層次聚類的一種。
假設有n個例項,需要得到k個類。
演算法:
- 初始化:每個例項自成一類
- 計算類間距離:類間距離定義為兩類中最近的兩點之間的距離
- 合併最近的兩個類
- 重複計算及合併n-k次,得到k個類
優點:
slc演算法是確定性的,每次得到的結果都是一樣的;
如果把例項看做空間中的點,距離為點之間的邊長,那麼slc演算法其實就是最小生成樹演算法;
可以把slc演算法的融合過程表示成乙個樹,這個樹非常漂亮,因為有幾個根就有幾個類;而且可以隨意更改根數。
缺點:
機器學習之聚類演算法
聚類就是將乙個物件的集合 樣本集合 分割成幾個不想交的子集 每個子集所代表的語義需要使用者自己進行解釋 每個類內的物件之間是相似的,但與其他類的物件是不相似的.分割的類的數目可以是指定的 例如k means 也可以是有演算法生成的 dbscan 聚類是無監督學習的乙個有用工具。1原型聚類 原型聚類是...
機器學習 聚類演算法
k means演算法 聚類概念 無監督問題 我們手裡沒有標籤了 難點 如何評估,如何調參 聚類 相似的東西分到一組 k means演算法 基本概念 要得到簇的個數,需要指定k值 距離的度量 常用歐幾里得距離和余弦相似度 先標準化 優化目標 質心 均值,即向量各維取平均即可 k means演算法 工作...
機器學習 聚類演算法
在無監督學習中,我們的訓練集可以寫成只有x 1 x x 1 x 2 x x 2 一直到x m x x m 我們沒有任何標籤 yyy。我們希望有一種演算法能夠自動的把這些資料分成有緊密關係的子集或是簇。演算法步驟綜述 k 均值是乙個迭代演算法,假設我們想要將資料聚類成n個組,其方法為 首先選擇k個隨機...