機器學習 作業4 K均值演算法 應用

2022-02-13 13:42:49 字數 1256 閱讀 1857

1. 應用k-means演算法進行壓縮

讀取一張

觀察檔案大小,佔記憶體大小,資料結構,線性化

用kmeans對畫素顏色進行聚類

獲取每個畫素的顏色類別,每個類別的顏色

觀察壓縮的檔案大小,佔記憶體大小

2. 觀察學習與生活中可以用k均值解決的問題。

從資料-模型訓練-測試-**完整地完成乙個應用案例。

這個案例會作為課程成果之一,單獨進行評分。

1.這裡將爬取的**資訊作為原始資料(已經過預處理),並選擇其中物業型別為住宅的資料進行測試

2.k均值演算法應用

3.總結:從本次對**資訊中的建築面積以及綠化率資料進行分類測試可以看出,建築面積和綠化率大小沒有必然聯絡,但是也可以看出建築面積越大,綠化率的值的大小起伏範圍趨於穩定,即在本次測試的住宅型別**中,當建築面積很大時,各**的綠化率沒有較大區別,使用者在選擇**時可以適當忽略這一因素。

機器學習作業9 k均值聚類

k均值聚類,這次作業要求自動確定均值 k均值聚類 固定k 大致步驟 隨機選擇k個點作為初始的簇中心 計算每個點到每個簇中心的距離,選擇最小的作為該點屬於的簇類 將每個簇的點取平均獲得乙個新的簇中心 重複2 3步驟直至簇中心不再變化 輸出簇劃分 偽 表示 from書p203 因為要確定k值,所以怕是沒...

機器學習演算法(六) K 均值

一 介紹 1 k means屬於無監督學習,主要解決聚類問題。2 k means需要提前設定引數k,這個值最終要生成k個簇,也就是聚類生成的類別的數量。使用k means演算法將乙個資料歸入到k個集群中。3 k means演算法適用於數值型資料,在資料探勘領域中有廣泛的應用。二 原理 隨機確定k個初...

機器學習演算法之Kmeans演算法(K均值演算法)

kmeans演算法是典型的基於距離的聚類演算法,採用距離作為相似性的評價指標,即認為兩個物件的距離越近,其相似度就越大。該演算法認為簇是由距離靠近的物件組成的,因此把得到緊湊且獨立的簇作為最終目標。兩個樣本在歐式空間中的距離 引入新概念 cluster 表示乙個簇 centroid 表示當前簇的中心...