機器學習方法

2022-06-06 22:18:14 字數 1111 閱讀 7244

根據資料型別的不同,對乙個問題的建模有不同的方式。在機器學習或者人工智慧領域,人們首先會考慮演算法的學習方式。在機器學習領域,有幾種主要的學習方式。將演算法按照學習方式分類是乙個不錯的想法,這樣可以讓人們在建模和演算法選擇的時候考慮能根據輸入資料來選擇最合適的演算法來獲得最好的結果。

監督式學習:

在監督式學習下,輸入資料被稱為「訓練資料」,每組訓練資料有乙個明確的標識或結果,如對防垃圾郵件系統中「垃圾郵件」「非垃圾郵件」,對手寫數字識別中「1「,」2「,」3「,」4「等。在建立**模型的時候,監督式學習建立乙個學習過程,將**結果與「訓練資料」的實際結果進行比較,不斷的調整**模型,直到模型的**結果達到乙個預期的準確率。監督式學習的常見應用場景如分類問題和回歸問題。常見演算法有邏輯回歸(logistic regression)和反向傳遞神經網路(back propagation neural network)

非監督式學習:

非監督式學習中,資料並不被特別標識,學習模型是為了推斷出資料的一些內在結構。常見的應用場景包括關聯規則的學習以及聚類等。常見演算法包括 apriori演算法以及 k-means演算法、k-means++、pca、lda 等。

半監督式學習:

在此學習方式下,輸入資料部分被標識,部分沒有被標識,這種學習模型可以用來進行**,但是模型首先需要學習資料的內在結構以便合理的組織資料來進行**。應用場景包括分類和回歸,演算法包括一些對常用監督式學習演算法的延伸,這些演算法首先試圖對未標識資料進行建模,在此基礎上再對標識的資料進行**。如 圖論推理演算法(graph inference)或者 拉普拉斯支援向量機(laplacian svm.)等。

強化學習:

在這種學習模式下,輸入資料作為對模型的反饋,不像監督模型那樣,輸入資料僅僅是作為乙個檢查模型對錯的方式,在強化學習下,輸入資料直接反饋到模型,模型必須對此立刻作出調整。常見的應用場景包括動態系統以及機械人控制等。常見演算法包括 q-learning以及 時間差學習(temporal difference learning)。

在企業資料應用的場景下, 人們最常用的可能就是監督式學習和非監督式學習的模型。 在影象識別等領域,由於存在大量的非標識的資料和少量的可標識資料, 目前半監督式學習是乙個很熱的話題。 而強化學習更多的應用在機械人控制及其他需要進行系統控制的領域。

showtooltip

機器學習方法 機器學習模型評估方法

通常我們採用實驗測試的方法對模型的泛化誤差做出評估。為此我們就需要乙個測試集用來測試訓練好的模型。通常情況下,在我們拿到資料之後,在正式開始訓練模型前,就會將資料劃分為訓練集合測試集。需要注意的是 訓練集與測試集應盡可能互斥,也就是盡量不要重複。測試集要符合真實樣本的分布,也就是說在劃分時要隨機抽樣...

機器學習方法 機器學習中的優化方法

機器學習是離不開優化方法的,pedro domingos這樣概括機器學習和優化方法的關係 machine learning representation optimization evaluation 後面三項對應於三步 建立模型,求解模型,驗證模型。首先介紹一下機器學習中常見的優化問題 1.分類回...

各種機器學習方法概念

部落格 強化學習 reinforcement learning 所謂強化學習就是智慧型系統從環境到行為對映的學習,以使獎勵訊號 強 化訊號 函式值最大,強化學習不同於連線主義學習中的監督學習,強化學習中由環境提供的強化訊號是對產生動作的好壞作一種評價 通常為標量訊號 而不是告訴強化學習系統rls r...