在工作中常常會遇到這樣的情況,有 n 個由多個指標反映的客體,但是反映客體的指標個數是多少不清楚,甚至指標本身是什麼也是模糊的,更談不上直接測量或觀察它,僅僅所能知道的是這 n 個客體之間的某種距離(相異性)或者是某種相似性。我們希望僅由這種距離或者相似性給出的資訊出發,在較低維的歐氏空間把這 n 個客體(作為幾何點)的相似程度用圖形表達出來。從而可能通過相關的專業知識揭示這 n 個客體之間的真實結構關係。這就是多維尺度分析所要研究的問題。
多維尺度分析——基本原理
多維尺度分析(multidimensional scaling, mds)又譯作多為標度分析,是多元統計分析方法的乙個新分支,是主成分分析和因子分析的乙個自然延伸,是資訊科學中一項公認的統計分析方法,是一組用於資訊視覺化和降維的相關排序技術,可以把資料庫中案例的相似性進行視覺化表達。基本原理是通過某種非線性變換,把高維空間的幾何圖形轉化成低維空間的圖形,變換後的圖形仍能近似地保持原圖形的集合關係。這些點所在的空間是歐幾里得空間,可以是二維、三維或多維。
多維尺度分析處理的資料是一般是表示事物之間的接近性的觀察資料,既可以是實際距離,也可以是主觀評判的相似性,目的就是要發現決定多個事物之間距離的潛在維度,用較少的變數對事物之間的相似性作出解釋。
多維尺度分析的輸出結果是一種圖譜,表現了各元素之間的關係,越相似的元素在空間上就越接近。從圖譜中,研究者可以通過觀察圖譜的組織結構來推斷資料集的基本維度或確認先前的假設。多維尺度分析通常以二維空間定位,側重說明知識單元之問的相對關係,在邊界界定及詞類關聯上需要結合特定內容和知識基礎進行解釋。
多維尺度分析——基本步驟
1、根據資料型別,選擇合適的分析方法
在進行多維尺度分析時,首先應該判斷資料的性質,若待分析的資料是精確的描述物件特點的數值型資料,則可以選用度量型多維尺度分析,若待分析的資料僅是描述事物之間相似性或差異性的等級資料,則可以選用非度量型多維尺度分析。
另外,還要注意結合獲得資料的方式。以市場調查為例,若資料是針對不同受訪者獲得的,則每個受訪者給出的結果資料即為乙個矩陣,此時對不同受訪者的資料取均值採用一般的多維尺度分析是不合適的,這樣做會損失大量的資訊,所以應採用考慮個體差異的多維尺度分析。
2、根據評價標準,確定合適的維數
多維尺度分析的目標就是以較少的維數空間去較好的擬合獲得的資料。通常,維數越高,空間圖對資料的擬合度越高,隨著維數的減少,維度的實際意義將更容易歸納,但這是以損失部分原始資料資訊為代價的。所以,選擇合適的維數至關重要。
※ 專業知識、文獻資料或預實驗的結果和結論
※ 空間圖的解釋能力,一般來說,想要解釋三維以上的空間圖是很困難的
3、評價獲得的結果
對多維尺度分析獲得的結果進行有效性和可靠性評估,方法主要有以下三種:
※ 計算擬合劣度值或擬合優度值
※ 計算壓力(stress)值
※ 計算梯度收斂值和單調收斂值,一般要求梯度收斂標準為0.01,單調收斂標準為0.01
4、解釋結果的實際意義
主要是對座標軸進行命名,根據空間圖對物件進行分類,座標軸的命名主要依賴專業知識和統計分析結果。
1 隨機取數計算個數並排序
python篇1 摘要 隨機引入1000個數值,並且對設定範圍內的數字進行排序和計數 import random 引入隨機數random num dirc 定義乙個空字典 for i in range 100 定義取數次數為100次 num key random.randint 20,30 定義取的...
八 jQuery 拷貝物件 多庫共存
如果想要把某個物件拷貝 合併 給另外乙個物件使用,此時可以使用 extend 方法 語法 extend deep target,object,objectn 注釋示例 function var obj extend target,obj extend targetobj,obj console.lo...
jQuery中拷貝物件和多庫共存
extend deep target,object,objectn deep 如果設為true為深拷貝,預設為false淺拷貝 target 要拷貝的目標物件 object 被拷貝的物件 objectn 待拷貝到第n個物件的物件 淺拷貝目標物件引用的是被拷貝的物件位址,修改目標物件會直接影響到被拷貝...