機器學習之 分類 聚類 回歸

2021-09-27 05:57:44 字數 754 閱讀 4214

一、分類

有監督學習的兩大應用之一,產生離散的結果。分類方法是一種對離散型隨機變數建模或**的監督學習演算法。

從機器學習的觀點,分類技術是一種有指導的學習,即每個訓練樣本的資料物件已經有類標識,通過學習可以形成表達資料物件與類標識間對應的知識。

要構造分類器,需要有乙個訓練樣本資料集作為輸入。訓練集由一組資料庫記錄或元組構成,每個元組是乙個由有關字段(又稱屬性或特徵)值組成的特徵向量,此 外,訓練樣本還有乙個類別標記。乙個具體樣本的形式可表示為:(v1,v2,…,vn; c);其中vi表示字段值,c表示類別。分類器的構造方法有統計方法、機器學習方法、神經網路方法等等。

二、聚類

無監督學習的結果。聚類的結果將產生一組集合,集合中的物件與同集合中的物件彼此相似,與其他集合中的物件相異。 聚類是一種無監督學習任務,該演算法基於資料的內部結構尋找觀察樣本的自然族群(即集群)。

在機器學習中,聚類是一種無指導學習。也就是說,聚類是在預先不知道欲劃分類的情況下,根據資訊相似度原則進行資訊聚類的一種方法。

常見的聚類演算法包括:

k-均值聚類演算法(k-mensclustering)則是最典型的聚類演算法

屬於劃分法k中心點(k-medoids)演算法、clarans演算法;

屬於層次法的birch演算法、cure演算法、chameleon演算法等;

三、回歸

3.回歸(regression)

有監督學習的兩大應用之一,產生連續的結果。 回歸方法是一種對數值型連續隨機變數進行**和建模的監督學習演算法。如線性回歸、回歸樹。

分類,聚類,回歸

聚類 所謂聚類,即根據相似性原則,將具有較高相似度的資料物件劃分至同一類簇,將具有較高相異度的資料物件劃分至不同類簇。聚類與分類最大的區別在於,聚類過程為無監督過程,即待處理資料物件沒有任何先驗知識,而分類過程為有監督過程,即存在有先驗知識的訓練資料集。聚類 clustering 是分類 class...

機器學習四大任務 回歸 分類 聚類與降維

回歸任務 回歸是對已有的資料樣本點進行擬合,再根據擬合出來的函式,對未來進行 回歸資料是連續的值,比如商品 走勢的 就是回歸任務。分類任務 分類需要先找到資料樣本點中的分界線,再根據分界線對新資料進行分類,分類資料是離散的值,比如識別 情感分析等領域會經常用到分類任務。聚類任務 聚類是根據樣本之間的...

機器學習之分類模型

iris 鳶尾花資料集是乙個經典資料集,在統計學習和機器學習領域都經常被用作示例。資料集內包含 3 類共 150 條記錄,每類各 50 個資料,每條記錄都有 4 項特徵 花萼長度 花萼寬度 花瓣長度 花瓣寬度,可以通過這4個特徵 鳶尾花卉屬於 iris setosa,iris versicolour...