2. 獲取所有新聞id和content,返回詞典(key, value)格式資料,key為id,value為content;
圖1 詞頻統計資料
6. 將二維陣列看作乙個mxn的矩陣,將二維陣列進行奇異值分解,得到u, sigma, vt三個陣列,u為mxr的矩陣,sigma為rxr的矩陣,vt為rxn的矩陣,奇異值分解如圖2所示,其中sigma除對角線外其他值都為0,sigma陣列對角線的值如圖3所示
圖2 奇異值分解
圖3 sigma矩陣
7. 簡化sigma矩陣,sigma矩陣變為3x3的矩陣sigma3,u矩陣變為mx3的矩陣u3,將vt矩陣變為3xn的矩陣vt3,其中u3矩陣如圖4所示
圖4 u3矩陣
8. 使用excel,將u3矩陣轉化為散點圖,散點圖如圖5所示
圖5 散點圖
(2017.7.1修改:操作失誤,這裡只統計了乙個分類,它們本來就屬於乙個分類,看不出分類效果,應該將多個分類的資料放在一起比較)
9. 使用kmeans演算法聚類,結果如圖6所示
圖6 k-means聚類結果
**和資料:
奇異值分解和k-means演算法在svd目錄
奇異值和奇異值分解
理論 假設m是乙個m n階矩陣,其中的元素全部屬於域 k,也就是 實數域或複數域。如此則存在乙個分解使得 m u v 其中u是m m階酉矩陣 是半正定m n階對角矩陣 而v 即v的共軛轉置,是n n階酉矩陣。這樣的分解就稱作m的奇異值分解。對角線上的元素 i,i即為m的奇異值。直觀的解釋 在矩陣m的...
奇異值和奇異值分解
理論 假設m是乙個m n階矩陣,其中的元素全部屬於域 k,也就是 實數域或複數域。如此則存在乙個分解使得 m u v 其中u是m m階酉矩陣 是半正定m n階對角矩陣 而v 即v的共軛轉置,是n n階酉矩陣。這樣的分解就稱作m的奇異值分解。對角線上的元素 i,i即為m的奇異值。直觀的解釋 在矩陣m的...
奇異值分解
奇異值分解 singular value decomposition 是線性代數中一種重要的 矩陣分解,是矩陣分析中正規矩陣酉對角化的推廣。在訊號處理 統計學等領域有重要應用。1基本介紹 2理論描述 3幾何意義 4範數 5應用 求偽逆 平行奇異值模型 矩陣近似值 奇異值分解在某些方面與 對稱矩陣或 ...