實驗目的
實驗內容
假設把樣本集分為k個類別,演算法描述如下:
import sklearn
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
# randomdata.py
a = np.random.randint(0,
30,(100,2
))data = pd.dataframe(a)
writer = pd.excelwriter(
'a.xlsx'
)data.to_excel(writer,
'page_1'
, float_format=
'%.5f'
)writer.s**e(
)writer.close(
)
data = pd.read_csv(
"d:\python_file\pycharm\bigworkofclass\exp03\k_means\a.csv"
)data.dropna(inplace=
true
)data.head(
)
unnamed: 001
00261611
21022
271433
6344
185- 將資料以散點圖的形式展示出來 ```python fig = plt.figure(figsize=(12, 12)) plt.scatter(data["0"],data["1"],color='red') plt.title("random data charts") plt.show() ```
K Means聚類演算法
k means聚類演算法 intergret kmeans演算法的基本思想是初始隨機給定k個簇中心,按照最鄰近原則把待分類樣本點分到各個簇。然後按平均法重新計算各個簇的質心,從而確定新的簇心。一直迭代,直到簇心的移動距離小於某個給定的值。k means聚類演算法主要分為三個步驟 1 第一步是為待聚類...
聚類演算法 K means
演算法接受引數 k 然後將事先輸入的n個資料物件劃分為 k個聚類以便使得所獲得的聚類滿足 同一聚類中的物件相似度較高 而不同聚類中的物件相似度較小。聚類相似度是利用各聚類中物件的均值所獲得乙個 中心物件 引力中心 來進行計算的。k means演算法是最為經典的基於劃分的聚類方法,是十大經典資料探勘演...
k means聚類演算法
說到聚類,得跟分類區別開來,分類是按人為給定的標準將樣本歸到某個類別中去,在機器學習中多是監督學習,也就是訓練樣本要給標籤 正確的類別資訊 而聚類是在某種規則下自動將樣本歸類,在機器學習中是無監督學習,不需要提前給樣本打標籤。k means聚類演算法,就是在某種度量方式下,將樣本自動劃分到k個類別中...