我在使用sklearn的affinitypropagation時看到了一些奇怪的東西。我有乙個4 x 4的數字-這基本上是親和力得分。sim[i,j]的親和力得分為[i,j]。現在,當我輸入affinitypropaction函式時,我總共得到4個標籤。在
下面是乙個矩陣較小的類似示例:in [215]: x = np.array([[1, 0.2, 0.4, 0], [0.2, 1, 0.8, 0.3], [0.4, 0.8, 1, 0.7], [0, 0.3, 0.7, 1]]
in [216]: x
out[216]:
array([[ 1. , 0.2, 0.4, 0. ],
[ 0.2, 1. , 0.8, 0.3],
[ 0.4, 0.8, 1. , 0.7],
[ 0. , 0.3, 0.7, 1. ]])
in [217]: clusterer = cluster.affinitypropagation(affinity='precomputed')
in [218]: f = clusterer.fit(x)
in [219]: f.labels_
out[219]: array([0, 1, 1, 1])
這表明(根據kevin的說法),第乙個樣本(第0個索引行)本身就是乙個簇(cluster#0),其餘樣本則在另乙個簇(cluster#1)中。但是,我仍然不理解這個輸出。這是什麼樣的樣品?成員是什麼?我想讓一組對(i,j)分配給乙個集群,另一組對分配給另乙個集群,依此類推。在
它看起來像4個樣本x 4個特徵矩陣,我不想要。這就是問題所在嗎?如果是這樣的話,如何將其轉換為乙個漂亮的4樣本x 4樣本親和力矩陣?在
謝謝!在
CPU的親和度
cpu的親和性,程序要在某個給定的 cpu 上盡量長時間地執行而不被遷移到其他處理器的傾向性,程序遷移的頻率小就意味著產生的負載小。在多核執行的機器上,每個cpu本身自己會有快取,在快取中存著程序使用的資料,而沒有繫結cpu的話,程序可能會被作業系統排程到其他cpu上,如此cpu cache 高速緩...
簡談對CPU的親和度(cpu affinity)
最 近的工作中對效能的要求比較高,就簡單的談下。cpu的親和性,就是程序要在指定的 cpu 上盡量長時間地執行而不被遷移到其他處理器,也稱為cpu關聯性 再簡單的點的描述就將制定的程序或執行緒繫結到相應的cpu上 在多核執行的機器上,每個cpu本身自己會有快取,快取著程序使用的資訊,而程序可能會被o...
python 路徑相似度
path 1 b1 path b1 path b1 c 1.輸入乙個路徑的值 path 設這個字串為st1 2.輸入乙個被比較的路徑值 path 1 b1 st2 將第乙個字串st1 進行split 將第二個字串st2 進行split path 正則1,正則2 列表1 path,1,b1 列表2 用...