(1)聚類的簡介:
聚類是一種無監督學習方法,試圖將資料集中的樣品劃分為若干個通常不相交的子集。
(2)聚類的兩個基本問題:
①效能度量:
用於度量聚類結果的好壞,即相同簇樣本盡可能相似,不同簇樣本盡可能不同。效能度星可分為兩類,一,外部指標,將聚類結果與外部指標相比較,二,內部指標,直接考察聚類結果。
②距離計算:
我們常用基於某種形式的"距離"的概念來定義"相似度度量" ,距離越大,相似度越小,但此"距離"未必滿足距離度量的所有基本性質。
(3)原型聚類:
①原型聚類的簡介:
原型聚類假設聚類結構能通過一組原型刻畫,採用不同的原型表示,將產生不同的演算法。
②幾種著名原型聚類:
1) k均值聚類(k-means) 【這是我要用到的聚類方式】
<1>k-means聚類簡介:
k-means聚類最小化聚類所得簇劃分的平均誤差,平均誤差越小,也就是簇內樣本相似度越高。
<2>k-means聚類的演算法流程如下:
輸入樣本集對均值向量進行初始化;
樣本集中隨機選取k個樣本作為初始向量;
對簇進行劃分;
對均值向量進行迭代更新,知道迭代更新後均值向量不變,則將當前簇劃分結果輸出.
2)學習向量量化(lvq)
3)高斯混合聚類
(4) k-means聚類的halcon實現:
cluster model components:把用於建立模型元件的新引數用於訓練結果。
inspect clustered components:檢查從訓練中獲得的剛性模型部件。
class 2dim unsup:將兩幅影象以聚類分割。
class 2dim sup:利用二維空間畫素分類分割影象。
histo 2dim:計算二通道灰度影象的直方圖。
Halcon 3 畫素和亞畫素
畫素和亞畫素,聽起來視乎很厲害,但是理解起來就容易了 halcon中的 roi region of interest 感興趣的區域,這個是 畫素級別的,也就是說這個區域是沿著畫素點的邊緣行走,例如乙個圓,當你放大看的時候,其實是很多個正方形組成的,也就是乙個個畫素。halcon中的 xld exte...
聚類練習3 k means 聚類
資料任然選擇聚類分析2中資料 程式用python程式設計。準備 將maltab中將m資料檔案轉化為txt文字檔案。程式 匯入讀取資料 importnumpyasnp fi open d alsun data.txt lin fi.readlines fi.close data np.ones 100...
聚類及K mean演算法
首先什麼是聚類,和分類有什麼區別,這裡講乙個例子,比如有一群學生考完期末考試,現在要根據他們的成績把他們劃分成幾個小組,讓老師分別進行輔導,這時候,你不知道要劃分幾個小組比較好,但你可以根據他們的成績,比較成績接近的歸到乙個小組,這個過程就是聚類,另一種情況是直接給出了90分段的乙個小組,80分段的...