sklearn KMeans 計算樣本質心

2021-10-17 02:36:58 字數 1761 閱讀 2534

乙個簇中所有資料的均值μ(j),通常被稱為這個簇的「質心(centroids)」,j表示第j個簇。在乙個二維平面中,一簇資料點的質心的橫座標就是這一簇資料點的橫座標的均值,質心的縱座標就是這一簇資料點的縱座標的均值,同理可推廣至高維空間。

返回頂部

在乙個二維平面中,一簇資料點的質心的橫座標就是這一簇資料點的橫座標的均值,質心的縱座標就是這一簇資料點的縱座標的均值,同理可推廣至高維空間。

#計算質心

defcal_cmass

(data)

:'''

input:data(ndarray):資料樣本

output:mass(ndarray):資料樣本質心

'''cmass = np.mean(data,axis=0)

return cmass

cmass = cal_cmass([[

8,8,

8],[

7,7,

7],[

9,9,

9]])

# [8. 8. 8.]

返回頂部

import numpy as np

#計算樣本間距離

defdistance

(x, y, p=2)

:'''

input:x(ndarray):第乙個樣本的座標

y(ndarray):第二個樣本的座標

p(int):等於1時為曼哈頓距離,等於2時為歐氏距離

output:distance(float):x到y的距離

'''

dis2 = np.

sum(np.

abs(x-y)

**p)

# 計算

dis = np.power(dis2,

1/p)

return dis

返回頂部

#計算每個樣本到質心的距離,並按照從小到大的順序排列

defsorted_list

(data,cmass)

:'''

input:data(ndarray):資料樣本

cmass(ndarray):資料樣本質心

output:dis_list(list):排好序的樣本到質心距離

'''dis_list =

for i in

range

(len

(data)):

# 遍歷data資料,與質心cmass求距離[:

])) dis_list =

sorted

(dis_list)

# 排序

return dis_list

list

= sorted_list([[

8,8,

8],[

7,7,

7],[

9,9,

9]],cmass)

# [0.0, 1.7320508075688772, 1.7320508075688772]

返回頂部

邊緣計算,雲計算與霧計算

邊緣計算與霧計算都是相對於雲計算而言的。通俗地講,雲,指的就是網路,網際網路,計算,就是操作執行,雲計算就是在網路上進行操作執行,它可以由許多不同地理位置的電腦組合而成乙個大型的資源庫。它的一大特點就是有乙個資料中心,特別大,使用者可以使用資料中心裡的資源,也可以把操作放在上面,只把結果提取出來,這...

計算機 計算與計算思維

計算機 計算與計算思維 1 單選題 人類應具備的三大思維能力是指 a 抽象思維 邏輯思維和形象思維 b 實驗思維 理論思維和計算思維 c 逆向思維 演繹思維和發散思維 d 計算思維 理論思維和辯證思維 2 單選題 本課程中擬學習的計算思維是指 a 計算機相關的知識 b 演算法與程式設計技巧 c 蘊含...

階乘計算 大數計算

輸入乙個正整數n,輸出n 的值。其中n 123 n。演算法描述 n 可能很大,而計算機能表示的整數範圍有限,需要使用高精度計算的方法。使用乙個陣列a來表示乙個大整數a,a 0 表示a的個位,a 1 表示a的十位,依次類推。將a乘以乙個整數k變為將陣列a的每乙個元素都乘以k,請注意處理相應的進製。首先...