回歸任務
回歸是對已有的資料樣本點進行擬合,再根據擬合出來的函式,對未來進行**。回歸資料是連續的值,比如商品**走勢的**就是回歸任務。
分類任務
分類需要先找到資料樣本點中的分界線,再根據分界線對新資料進行分類,分類資料是離散的值,比如識別、情感分析等領域會經常用到分類任務。
聚類任務
聚類是根據樣本之間的相似度,將一批資料劃分為n個組。比如使用者分組、異常值檢測等領域會用到聚類任務。
使用者分組比較好理解,那異常值檢測為什麼會用到聚類呢?因為實際場景中,如果某個樣本點,離所有分類組的距離都很遠,不屬於任何乙個組,我們則會將其看做是乙個「異常值」。
降維任務
降維是減少資料的維度,對資料進行降噪、去冗餘,方便計算和訓練;
如資料預處理,減少一些對模型準確率影響很小維度,可以提高計算效率。再如圖表視覺化,我們進行資料分析時,通常會將高維模型降為三維或二維圖表,便於直觀分析。
機器學習之 分類 聚類 回歸
一 分類 有監督學習的兩大應用之一,產生離散的結果。分類方法是一種對離散型隨機變數建模或 的監督學習演算法。從機器學習的觀點,分類技術是一種有指導的學習,即每個訓練樣本的資料物件已經有類標識,通過學習可以形成表達資料物件與類標識間對應的知識。要構造分類器,需要有乙個訓練樣本資料集作為輸入。訓練集由一...
機器學習(四) Logistic回歸分類
logistic回歸是眾多分類演算法中的一員。通常,logistic回歸用於二分類問題,例如 明天是否會下雨。當然它也可以用於多分類問題,不過為了簡單起見,本文暫先討論二分類問題。首先,讓我們來了解一下,什麼是logistic回歸。1 logistic回歸 相當於sigmoid 函式 假設現在有一些...
整合學習 上 機器學習中的三大任務
toc 整合學習 上 task1 機器學習中的三大任務 機器學習的主要的目標就是用數學模型來理解資料,發現資料中的規律,通過發現發現的規律用作資料的分析和 根據資料集是否有因變數,機器學習的任務主要是可以分為 有監督學習和無監督學習 其中有監督學習主要是分為 回歸和分類 返回乙個類似於字典的類 中通...