資料探勘與機器學習的相關理解

2022-05-25 07:24:09 字數 885 閱讀 3293

加州理工學院公開課:機器學習與資料探勘:

機器學習:那些具體的演算法,得到精確模型,統行學家又稱為統計學習

資料探勘:資料庫,資料清洗,資料視覺化

深度學習:在影象,語音,富**取得較好表現,是機器學習的乙個分支,伴隨著大量的計算

學習方法:參考

1、監督式學習:

輸入資料被稱為「訓練資料」,每組訓練資料有乙個明確的標識或結果。如西瓜的品質,好吃,一般,不好吃。通過訓練建立**模型,通過**結果與「訓練資料」的實際結果比較,不斷的調整**模型,直到**結果達到乙個預期的準確率。應用場景如分類和回歸等問題。常見演算法有邏輯回歸(logistic regression)和反向傳遞神經網路(back propagation neural network)。

2、半監督式學習:

輸入資料部分被標識,部分沒被標識,這種學習模型可以用來**,但是模型首先需要學習資料的內在結構以便合理的組織資料進行**。先對未標識的資料進行建模,然後再在這個基礎上再對標識的資料進行**。如圖論推理演算法(graph inference)或者拉普拉斯支援向量機(laplacian svm.)等。

3、非監督式學習:

資料並不被特別標識,學習模型是為了推斷出資料的一些內在結構。常見的應用場景包括關聯規則的學習以及聚類等。常見演算法包括apriori演算法以及k-means演算法。

4、強化學習:

資料並不被特別標識,學習模型是為了推斷出資料的一些內在結構。常見的應用場景包括關聯規則的學習以及聚類等。常見演算法包括apriori演算法以及k-means演算法。

在企業資料應用的場景下, 人們最常用的可能就是監督式學習和非監督式學習的模型。 在影象識別等領域,由於存在大量的非標識的資料和少量的可標識資料, 目前半監督式學習是乙個很熱的話題。 而強化學習更多的應用在機械人控制及其他需要進行系統控制的領域。

機器學習與資料探勘相關演算法彙總

普通最小二乘回歸 olsr 線性回歸 linear regression 邏輯回歸 logistic regression 逐步回歸 多元自適應回歸樣條法 mars 區域性估計平滑散點圖 loess k臨近演算法 knn 學習向量量化演算法 lvq 自組織對映演算法 som 區域性加權學習法 lwl...

機器學習與資料探勘

機器學習的科學成分更重一些 資料探勘的技術成分更重一些 資料分析的角度 資料探勘並沒有機器學習探索人的學習機制這一科學發現任務 資料探勘中的資料分析是針對海量資料進行的 是一門多領域交叉學科,涉及概率論 統計學 畢竟輪 凸分析 演算法複雜度理論等多門學科,專門研究計算機是怎樣模擬或實現人類的學習行為...

資料探勘與機器學習入門

導論 機器學習演算法最適用的場景就是 不便用規則處理的場合 資料探勘 data mining 是有組織有目的地收集資料,通過分析資料使之成為資訊,從而在大量資料中尋找潛在規律以形成規則或知識的技術。機器學習 machine learning,ml 是一門多領域交叉學科,涉及概率論 統計學 逼近論 凸...