fcm(fuzzy c-means)
模糊c均值聚類融合了模糊理論的精髓。相較於k-means的硬聚類,模糊c提供了更加靈活的聚類結果。因為大部分情況下,資料集中的物件不能劃分成為明顯分離的簇,指派乙個物件到乙個特定的簇有些生硬,也可能會出錯。故,對每個物件和每個簇賦予乙個權值,指明物件屬於該簇的程度。當然,基於概率的方法也可以給出這樣的權值,但是有時候我們很難確定乙個合適的統計模型,因此使用具有自然地、非概率特性的模糊c均值就是乙個比較好的選擇。
聚類損失函式:
n個樣本,分為c類。c是聚類的簇數;i,j是標號;
表示 樣本i 屬於 j類 的隸屬度。
xi表示第i個樣本,xi是具有d維特徵的乙個樣本。cj是j簇的中心,也具有d維度。||*||可以是任意表示距離的度量。
模糊c是乙個不斷迭代計算隸屬度和簇中心的過程,直到他們達到最優。
對於單個樣本xi,它對於每個簇的隸屬度之和為1。
迭代的終止條件為:
其中k是迭代步數,
是誤差閾值。上式含義是,繼續迭代下去,隸屬程度也不會發生較大的變化。即認為隸屬度不變了,已經達到比較優(區域性最優或全域性最優)狀態了。
該過程收斂於目標jm的區域性最小值或鞍點。
拋開複雜的算式,這個演算法的意思就是:給每個樣本賦予屬於每個簇的隸屬度函式。通過隸屬度值大小來將樣本歸類。
1、初始化
2、計算質心
fcm中的質心有別於傳統質心的地方在於,它是以隸屬度為權重做乙個加權平均。
3、更新隸屬度矩陣
b一般取2。
【**自】
fuzzy c-means(模糊c均值聚類)演算法原理詳解與python實現 - yancy的部落格 - csdn部落格
模糊c均值聚類演算法
模糊c均值聚類演算法 隨著目標數目的增加,jpda所需的運算量呈指數增加,當目標的個數多到一定數目時,將引發運算量的 不滿足實時跟蹤的要求。為了解決這個問題,提出了模糊資料關聯演算法。模糊資料關聯演算法是以模糊均值聚類演算法為基礎的。該演算法通過使目標函式最小化把測量資料分別劃分到以目標 位置為中心...
模糊C均值聚類
模糊c均值聚類 fcm 即眾所周知的模糊isodata,是用隸屬度確定每個資料點屬於某個聚類的程度的一種聚類演算法。1973年,bezdek提出了該演算法,作為早期硬c均值聚類 hcm 方法的一種改進。fcm把n個向量x i i 1,2,n 分為c個模糊組,並求每組的聚類中心,使得非相似性指標的價值...
模糊c均值聚類
fcm演算法是一種基於劃分的聚類演算法,它的思想就是使得被劃分到同一簇的物件之間相似度最大,而不同簇之間的相似度最小。模糊c均值演算法是普通c均值演算法的改進,普通c均值演算法對於資料的劃分是硬性的,而fcm則是一種柔性的模糊劃分。在介紹fcm具體演算法之前我們先介紹一些模糊集合的基本知識。6.1....