一文讀懂聚類

2021-09-02 20:17:42 字數 483 閱讀 6437

我們不管是做分類還是回歸,我們拿到的資料都是

但有些時候我們沒有這y,只有x的時候,我們也能不能對這個資料根據它的相似性,就是根據x自身的相似性將資料分成若干個部分呢?這樣就叫做無監督,而聚類是最重要的無監督。

而事實上呢,我們不妨這樣來想,假如說我們現在拿到了這樣一堆資料

我們再舉個很有趣的例子,大家還記得pca這麼做的嗎?我們現在有乙個m行n列的x,而

向量把它的每乙個

聚類的定義:聚類就是對大量未標註的資料集按資料的內在相似性將資料集劃分為多個類別,使類別內的資料相似度較大而類別間的資料相似度較小。

例如協同過濾,就是做推薦系統的協同過濾,協同過濾其實本質上是乙個無監督的學習方式,只有若干個使用者和若干個商品的這樣乙個矩陣,而且它還有可能是稀疏的。我們通過讓大量的使用者齊心協力共同把那個喜好的商品給過濾出來,齊心協力做乙個過濾嘛,簡稱協同過濾。

在根據相似性來做聚類的時候,第一步就是如何來度量這個相似性,相似性的最為簡單的方式就是歐式距離。

一文讀懂Nginx

問 nginx的負載均衡演算法有什麼?預設是什麼演算法?答 1 輪詢 按請求的時間輪詢查空閒的後端伺服器 2 指定輪詢機率 機率的原因是後端伺服器的效能不均勻,好的多分點,差的少分點 3 固定ip繫結固定伺服器 預設是加權輪詢,就是優先訪問權重高的伺服器 問 nginx是單執行緒的嗎?答 是單執行緒...

一文讀懂SpringMVC

主要講的是dispatcherservlet這個類 ioc其實是乙個map,工程啟動後掃瞄路徑,根據類的全限定名建立bean 問 怎麼根據路徑找到方法?map還存key為 aaa value為該controller例項 問 autowired原理?自定義註解,在載入的時候,掃瞄controller層...

堆疊 一文讀懂

堆疊 stack 是一種先進後出的 操作受限的線性表,也可以直接稱為棧。可以把棧想象成乙個桶一樣,往這個桶裡面一層一層的放東西,先放進去的在裡面,後放進去的東西依次在外面。但取東西的時候就是先取靠近外面的,再依次一層層取裡面的。這就是 後進先出 last in first out 的原則。因此 棧 ...