從拉普拉斯到譜聚類

2021-09-28 20:39:18 字數 529 閱讀 3570

譜聚類(spectral clustering)是廣泛使用的聚類演算法,比起傳統的k-means演算法,譜聚類對資料分布的適應性更強,聚類效果也很優秀,同時聚類的計算量也小很多,更加難能可貴的是實現起來也不複雜。在處理實際的聚類問題時,個人認為譜聚類是應該首先考慮的幾種演算法之一。下面我們就對譜聚類的演算法原理做乙個總結。

譜聚類是從圖論中演化出來的演算法,後來在聚類中得到了廣泛的應用。它的主要思想是把所有的資料看做空間中的點,這些點之間可以用邊連線起來。距離較遠的兩個點之間的邊權重值較低,而距離較近的兩個點之間的邊權重值較高,通過對所有資料點組成的圖進行切圖,讓切圖後不同的子圖間邊權重和盡可能的低,而子圖內的邊權重和盡可能的高,從而達到聚類的目的。

乍一看,這個演算法原理的確簡單,但是要完全理解這個演算法的話,需要對圖論中的無向圖,線性代數和矩陣分析都有一定的了解。下面我們就從這些需要的基礎知識開始,一步步學習譜聚類。

由於譜聚類是基於圖論的,因此我們首先溫習下圖的概念。對於乙個圖gg

切成相互沒有連線的k個子圖,每個子圖點的集合為:a1

,a2,

..ak

dbscan和譜聚類 拉普拉斯降維與譜聚類

高維資料聚類 資料分布稀疏 和分布任意形狀 dbscan可以實現,但是需要指定超引數 的聚類是傳統聚類演算法比較難做的。譜聚類可以很好的解決這兩個問題,一般而言,可以概括為降維 聚類兩個過程 1 降維,保留高維空間的區域性幾何結構,將本真結構投影到低維空間中,這樣就直接解決了任意資料分布聚類的問題,...

拉普拉斯運算元 拉普拉斯方程之美

物理學有它自己的羅塞塔石碑。它們是連線宇宙間看上去不同的領域的天書,它們將任何物理學分支同純粹數學聯絡起來。拉普拉斯方程就是其中之一 它幾乎無處不在 在電磁學 在流體力學 在引力 在熱學 在肥皂泡 拉普拉斯方程是以法國數學家pierre simon laplace 皮埃爾 西蒙 拉普拉斯 的名字命名...

拉普拉斯銳化

影象銳化 提供影象的對比度從而使得影象清晰起來,在影象平滑中,為了使得影象模糊,通常採用鄰域平均的方法縮小鄰域內畫素之間的灰度差異。在影象銳化中,提高鄰域內畫素的灰度差來提高影象的對比度。影象的拉普拉斯銳化是利用拉普拉斯運算元對影象進行邊緣增強的一種方法,拉普拉斯運算元是以影象鄰域內畫素灰度查分計算...