第三次k均值

2022-08-31 06:21:12 字數 2773 閱讀 9345

1). 撲克牌手動演練k均值聚類過程:>30張牌,3類

2). *自主編寫k-means演算法 ,以鳶尾花花瓣長度資料做聚類,並用散點圖顯示。(加分題)

from sklearn.datasets import load_iris

import numpy as np

#1\資料準備

iris=load_iris()

data=iris['data']

m=data.shape[1]#樣本屬性個數

data.shape

n=len(data)#樣本個數

k=3#類中心個數,即最終分類

#資料初始化

dist=np.zeros([n,k+1])#距離矩陣

center=np.zeros([k,m])#初始類中心

new_center=np.zeros([k,m])#新的類中心

number=0

#選中心

center=data[:k, :]#選擇前三個樣本作為初始類中心

while true:

#求距離

for i in range(n):

for j in range(k):

dist[i,j]=np.sqrt(sum((data[i,:]-center[j,:])**2))

#歸類dist[i,k]=np.argmin(dist[i,:k])

#求新類中心

for i in range(k):

index=dist[:,k]==i

new_center[i,:]=np.mean(data[index, :])

#判定結束

if(np.all(center==new_center)):

break

else:

center=new_center

number=number+1

print('聚類分析迭代慈次數:',number )

print('最終聚類結果:',dist[:,k])

3). 用sklearn.cluster.kmeans,鳶尾花花瓣長度資料做聚類,並用散點圖顯示.

from sklearn.datasets import load_iris

from sklearn.cluster import kmeans

import matplotlib.pyplot as plt

# 獲取鳶尾花資料集

iris = load_iris()

x = iris.data[:, 1].reshape(-1, 1)  # 鳶尾特徵值,需要多少列資料訓練就進行

model = kmeans(n_clusters=3)  # 構建模型

model.fit(x)  # 訓練

y = model.predict(x)  # **樣本的聚類索引

print("**結果:", y)

k= model.cluster_centers_

print("聚類中心:", k)

4). 鳶尾花完整資料做聚類並用散點圖顯示.

from sklearn.datasets import load_iris

from sklearn.cluster import kmeans

import matplotlib.pyplot as plt

# 獲取鳶尾花資料集

iris = load_iris()

x = iris.data  # 鳶尾花花瓣長度資料

model = kmeans(n_clusters=3)  # 構建模型

model.fit(x)  # 這裡訓練所有資料

y = model.predict(x)  # **每個樣本的聚類索引

print("**結果:", y)

k = model.cluster_centers_   # 聚類中心

print("聚類中心:", k)

5).想想k均值演算法中以用來做什麼?

每一樣事物都有其屬性,世界上'' 沒有一片完全相同的葉子

'',最根本的原因是:每一樣的事物本身的屬性不是跟其它任何事物的完全相同。但是我們分析和描述客觀自然事物的時候,往往是基於對某一事物重要的、突出的和具有普遍性的屬性來進行歸門別類。通過聚類來描述物體本身最微小的差別,來進行歸類,像極了我們閱人無數,通過大量的人來進行學習,來分辨各類各樣的人,所以機器學習中通過這些微小的差別進行分辨事物。

第三次作業 K公尺評測

總結下這次的體驗 軟體使用便捷,易上手,但wifi訊號一不好,軟體就癱了。測試 2 3 無截圖 環境 手機系統miui8.0.2.0穩定版,k公尺系統版本4.3.0 結果 提示發布不成功 環境 手機系統miui8.0.2.0穩定版,k公尺系統版本4.3.0 步驟 點選直播中的彈幕框,點選動態 選擇表...

第三次作業

2 12有600 mb 兆位元組 的資料,需要從南京傳送到北京。一種方法是將資料寫到磁碟上,然後託人乘火車這 些磁碟捎去。另一種方法是用計算機通過長途 線路 設資訊傳送的速率為2.4kb s 傳送此資料。試比較這兩種方法的優劣。若資訊傳送速率為33.6kb s,其結果又如何?解 當傳送速率為2.4k...

第三次作業

1 有600mb 兆位元組 的資料,需要從南京傳送到北京 一種方法是將資料寫到磁碟上,然後託人乘火車將這些磁碟捎去。另一種方法是用計算機通過長途 線路 設資訊傳送的速率為2.4kb s 傳送此資料,試比較這兩種方法的優劣。若資訊傳送的速率為33.6kb s,其結果又如何?解 假定連續傳送且不出錯。若...