1). 撲克牌手動演練k均值聚類過程:>30張牌,3類
2). *自主編寫k-means演算法 ,以鳶尾花花瓣長度資料做聚類,並用散點圖顯示。(加分題)
from sklearn.datasets import load_iris
import numpy as np
#1\資料準備
iris=load_iris()
data=iris['data']
m=data.shape[1]#樣本屬性個數
data.shape
n=len(data)#樣本個數
k=3#類中心個數,即最終分類
#資料初始化
dist=np.zeros([n,k+1])#距離矩陣
center=np.zeros([k,m])#初始類中心
new_center=np.zeros([k,m])#新的類中心
number=0
#選中心
center=data[:k, :]#選擇前三個樣本作為初始類中心
while true:
#求距離
for i in range(n):
for j in range(k):
dist[i,j]=np.sqrt(sum((data[i,:]-center[j,:])**2))
#歸類dist[i,k]=np.argmin(dist[i,:k])
#求新類中心
for i in range(k):
index=dist[:,k]==i
new_center[i,:]=np.mean(data[index, :])
#判定結束
if(np.all(center==new_center)):
break
else:
center=new_center
number=number+1
print('聚類分析迭代慈次數:',number )
print('最終聚類結果:',dist[:,k])
3). 用sklearn.cluster.kmeans,鳶尾花花瓣長度資料做聚類,並用散點圖顯示.
from sklearn.datasets import load_iris
from sklearn.cluster import kmeans
import matplotlib.pyplot as plt
# 獲取鳶尾花資料集
iris = load_iris()
x = iris.data[:, 1].reshape(-1, 1) # 鳶尾特徵值,需要多少列資料訓練就進行
model = kmeans(n_clusters=3) # 構建模型
model.fit(x) # 訓練
y = model.predict(x) # **樣本的聚類索引
print("**結果:", y)
k= model.cluster_centers_
print("聚類中心:", k)
4). 鳶尾花完整資料做聚類並用散點圖顯示.
from sklearn.datasets import load_iris
from sklearn.cluster import kmeans
import matplotlib.pyplot as plt
# 獲取鳶尾花資料集
iris = load_iris()
x = iris.data # 鳶尾花花瓣長度資料
model = kmeans(n_clusters=3) # 構建模型
model.fit(x) # 這裡訓練所有資料
y = model.predict(x) # **每個樣本的聚類索引
print("**結果:", y)
k = model.cluster_centers_ # 聚類中心
print("聚類中心:", k)
5).想想k均值演算法中以用來做什麼?
每一樣事物都有其屬性,世界上'' 沒有一片完全相同的葉子
'',最根本的原因是:每一樣的事物本身的屬性不是跟其它任何事物的完全相同。但是我們分析和描述客觀自然事物的時候,往往是基於對某一事物重要的、突出的和具有普遍性的屬性來進行歸門別類。通過聚類來描述物體本身最微小的差別,來進行歸類,像極了我們閱人無數,通過大量的人來進行學習,來分辨各類各樣的人,所以機器學習中通過這些微小的差別進行分辨事物。
第三次作業 K公尺評測
總結下這次的體驗 軟體使用便捷,易上手,但wifi訊號一不好,軟體就癱了。測試 2 3 無截圖 環境 手機系統miui8.0.2.0穩定版,k公尺系統版本4.3.0 結果 提示發布不成功 環境 手機系統miui8.0.2.0穩定版,k公尺系統版本4.3.0 步驟 點選直播中的彈幕框,點選動態 選擇表...
第三次作業
2 12有600 mb 兆位元組 的資料,需要從南京傳送到北京。一種方法是將資料寫到磁碟上,然後託人乘火車這 些磁碟捎去。另一種方法是用計算機通過長途 線路 設資訊傳送的速率為2.4kb s 傳送此資料。試比較這兩種方法的優劣。若資訊傳送速率為33.6kb s,其結果又如何?解 當傳送速率為2.4k...
第三次作業
1 有600mb 兆位元組 的資料,需要從南京傳送到北京 一種方法是將資料寫到磁碟上,然後託人乘火車將這些磁碟捎去。另一種方法是用計算機通過長途 線路 設資訊傳送的速率為2.4kb s 傳送此資料,試比較這兩種方法的優劣。若資訊傳送的速率為33.6kb s,其結果又如何?解 假定連續傳送且不出錯。若...