大資料中,機器學習和資料探勘的聯絡與區別

2021-08-29 04:09:44 字數 968 閱讀 5965

資料探勘是從海量資料中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程。

資料探勘中用到了大量的機器學習界提供的資料分析技術資料庫界提供的資料管理技術

從資料分析的角度來看,資料探勘與機器學習有很多相似之處但不同之處也十分明顯,例如,資料探勘並沒有機器學習探索人的學習機制這一科學發現任務,資料探勘中的資料分析是針對海量資料進行的,等等。

從某種意義上說,機器學習的科學成分更重一些而資料探勘的技術成分更重一些

學習能力是智慧型行為的乙個非常重要的特徵,不具有學習能力的系統很難稱之為乙個真正的智慧型系統,而機器學習則希望(計算機)系統能夠利用經驗來改善自身的效能,因此該領域一直是人工智慧的核心研究領域之一。

在計算機系統中,「經驗」通常是以資料的形式存在的,因此,機器學習不僅涉及對人的認知學習過程的探索,還涉及對資料的分析處理。

實際上,機器學習已經成為計算機資料分析技術的創新源頭之一。由於幾乎所有的學科都要面對資料分析任務,因此機器學習已經開始影響到電腦科學的眾多領域,甚至影響到電腦科學之外的很多學科。

機器學習是資料探勘中的一種重要工具。然而資料探勘不僅僅要研究、拓展、應用一些機器學習方法,還要通過許多非機器學習技術解決資料倉儲、大規模資料、資料雜訊等實踐問題。機器學習的涉及面也很寬,常用在資料探勘上的方法通常只是「從資料學習」

然而機器學習不僅僅可以用在資料探勘上,一些機器學習的子領域甚至與資料探勘關係不大,如增強學習與自動控制等。所以,資料探勘是從目的而言的,機器學習是從方法而言的,兩個領域有相當大的交集,但不能等同。

大資料架構簡述(四) 機器學習和資料探勘

機器學習 machine learning,ml 是一門多領域交叉學科,涉及概率論 統計學 逼近論 凸分析 演算法複雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。1 監督式學習 輸入 訓練資料 每組資料有明確的標識...

機器學習和資料探勘招聘

平台研究類 資料計算平台搭建,基礎演算法實現,當然,要求支援大樣本量 高維度資料,所以可能還需要底層開發 平行計算 分布式計算等方面的知識 演算法研究類 資料探勘類 商業智慧型,如統計報表 使用者體驗分析,流失使用者。有的應用方向比較成熟,業界有足夠的技術積累,比如搜尋 推薦,也有的方向還有很多開放...

機器學習和資料探勘的聯絡與區別

從資料分析的角度來看,資料探勘與機器學習有很多相似之處,但不同之處也十分明顯,例如,資料探勘並沒有機器學習探索人的學習機制這一科學發現任務,資料探勘中的資料分析是針對海量資料進行的,等等。從某種意義上說,機器學習的科學成分更重一些,而資料探勘的技術成分更重一些。本文選自 大資料架構詳解 從資料獲取到...