網格模型簡化思想之聚類思想和二次誤差測度

2021-09-27 06:08:12 字數 2495 閱讀 6509

一、模型聚類

將物理或抽象物件的集合分成由類似的物件組成的多個類的過程被稱為聚類。由聚類所生成的簇是一組資料物件的集合,這些物件與同乙個簇中的物件彼此相似,與其它簇中的物件相異,數學描述如下:

給定乙個資料樣本集合x=,可以根據資料樣本點之間的相似程度將它們劃分成k個簇:c=,其中

xi=和xj=是具有m個屬性的兩個樣本集合,那麼這兩個集合之間的距離定義如下式:

當兩個樣本集合之間的距離小於使用者給定的閾值d時,就可以認為這兩個樣本集xi,xj屬於同乙個類。

從上述可知,這個給定的閾值對聚類來說有著重要的意義,起著乙個權衡作用。如果這個閾值d取的比較小,那麼對乙個資料樣本聚類時,簇數目就會比較多。相反地如果閾值d較大,那麼會將大部分的集合元素都歸併到乙個簇中。

聚類方法包括劃分法、層次法、還分別有基於密度、網格、模型的方法。層次法又包含凝集聚類和**聚類。這兩個方式乙個自向上的,乙個自頂向下的。凝集聚類的思路是:初始化時將每個樣本都作為乙個單獨的簇,然後根據一定的法則以下歸併這些簇,這樣簇的數目越來越少,而每個簇中所包含的樣本數量則越來越多,直到所有樣本都被乙個簇包含或者所有簇無法再合併(由給定的閾值來控制)。**聚類較凝集聚類來說是個逆向的過程,在初始化時將所有的樣本歸於乙個簇中,然後逐步的**這個簇,按照一定的屬性分類將所有樣本分到不同的簇中去,使得簇的數量越來越多。直到每個樣本單獨地成為乙個簇或達到了某個終結條件。

二、基於二次誤差測度的模型分割法

首先將三角網格模型對映到對偶圖,定義三角網格模型為m=(t,v)和乙個圖g(n,c),t和v分別為三角麵片的集合和頂點的集合,n代表對偶圖中的節點,c代表它們的鏈結關係。進行m到g的轉化,圖g中的結點ni代表乙個網格片charti,這個網格片charti由模型中的乙個或者多個三角麵片組成,若節點ni和nj有連線(存在邊),那麼該網格片charti中存在某個三角形ti和charti中的某個三角形tj是相鄰的。因此網格模型m的三角麵片聚合就轉化成了g中的邊的摺疊。初始化時,每個三角麵片作為乙個單獨的簇,根據一定的規則實施簇聚類,次兩個簇的合併,即表示模型表面的兩個網格片合二為一,對應到圖里就是兩

個結點合併成乙個結點。圖 3.1 和圖 3.2 顯示了在對偶圖中,簇的合併的過程

圖 3.1 中的紅色三角形本來各屬於乙個簇(每個三角形中均有乙個 n 結點),而通過一次合併,2 個簇合併成了乙個簇,圖 3.1 中 2 個綠色的 n 結點合併成了乙個結點(圖 3.2)。

根據平面準則,需要尋找簇的最佳近似平面,然後依據該平面在判斷相鄰的三角形是否滿足平面度量準則,如果滿足則將其併入本簇,並重新計算該簇的最佳近似平面。

假設組成網格片chart的三角麵片集合和頂點集合分別為f和v。定義該網格片的最佳近似平面為 ntv+d=0。fit  error  為集合 v 中所有的點到該平面的平均距離平方和,如式 下式:

為了計算出該最佳近似平面,即要求得當efit最小時法向量n的值,由定義fit duadric

根據上式可以改寫efit為:

上述過程對應到對偶圖 g 中,則可表示成每個結點 n 都有 2 個附屬值,乙個是 fit quadric(p),乙個是最佳近似平面(n,d)(p(n,d))。每次對偶圖中邊摺疊後,生成的新頂點的最佳近似平面的方程為( )( , )i jp +p n d 。為了計算該平面方程,先構造乙個協方差矩陣式 

z中的特徵向量對乙個的最小特徵值就是最佳近似平面的法向量。因為協方差矩陣z是乙個對稱的半正定矩陣,因此它的特徵值是非負實數。將z變形成下式:

最 佳 近 似 平 面 的 法 向 n 即 為 z 的 特 徵 向 量 對 應 的 最 小 特 徵 值,

除此之外,還加入了乙個附加誤差度量:平均法向偏離誤差:

其中wi為三角面fi的面積,

其中 ρ 

為網格周長來約束網格片的形狀趨向規則,整個網格面更加緊湊。在兩個網格片合併時,假設它們的不規則性因子值為iγ ,jγ ,那麼合併後的變形代價可由下式

通過上述的過程,對應對偶圖,該演算法的完整誤差度量公式如下。其中α是給定的權重值

根據這個誤差度量就可以有效實現對偶圖的優化的聚類,對應地完成了對模型表面的分割。

本文參考自文獻《針對具有複雜屬性的網格模型簡化演算法的研究》

評估聚類模型

輪廓係數 聚類評估 輪廓係數 silhouette coefficient si接近1,則說明樣本i聚類合理。si接近 1,則說明樣本i更應該分類到另外的簇。若si近似為0,則說明樣本i在兩個簇的邊界上。silhouette score 返回的是平均輪廓係數 評估聚類模型 import numpy ...

混合高斯模型聚類

翻譯自matlab幫助。混合高斯模型簡介 混合高斯模型基於多變數正 態分布。類gmdistribution通過使用em演算法來擬合資料,它基於各觀測量計算各成分密度的後驗概率。高斯混合模型常用於聚類,通過選擇成分最大化後驗概率來完成聚類。與k means聚類相似,高斯混合模型也使用迭代演算法計算,最...

聚類之層次聚類 基於劃分的聚類(

目錄 一層次聚類 層次聚類的原理及分類 層次聚類的流程 層次聚類的優缺點 二劃分聚類法k means kmeans演算法的原理 k均值的優缺點及分類 k means與dbscan的區別 k means注意問題 三基於密度的聚類 dbscan的概念 簇的生成原理及過程 根據資料點的密度分為三類點 db...