這兩個都是非常熱門的詞彙,包括資料探勘這個概念,很多人甚至將其看成是一種等價的關係,在很多報道中,會混雜使用。
事實上,這其之間既有一定的聯絡,但也有明顯的區別。
可以簡單理解為:
機器學習是人工智慧領域中的乙個重要分支;
深度學習是實現機器學習的一種重要方法;
而深度學習通常都是基於多層神經網路的。
機器學習(machine learning,ml)是人工智慧的子領域,也是人工智慧的核心。它囊括了幾乎所有對世界影響最大的方法(包括深度學習)。機器學習理論主要是設計和分析一些讓計算機可以自動學習的演算法。
舉個例子,假設要構建乙個識別貓的程式。傳統上如果我們想讓計算機進行識別,需要輸入一串指令,例如貓長著毛茸茸的毛、頂著一對三角形的的耳朵等,然後計算機根據這些指令執行下去。但是如果我們對程式展示乙隻老虎的**,程式應該如何反應呢?更何況通過傳統方式要制定全部所需的規則,而且在此過程中必然會涉及到一些困難的概念,比如對毛茸茸的定義。因此,更好的方式是讓機器自學。
我們可以為計算機提供大量的貓的**,系統將以自己特有的方式檢視這些**。隨著實驗的反覆進行,系統會不斷學習更新,最終能夠準確地判斷出哪些是貓,哪些不是貓。
深度學習(deeplearning,dl)屬於機器學習的子類。它的靈感**於人類大腦的工作方式,是利用深度神經網路來解決特徵表達的一種學習過程。深度神經網路本身並非是乙個全新的概念,可理解為包含多個隱含層的神經網路結構。為了提高深層神經網路的訓練效果,人們對神經元的連線方法以及啟用函式等方面做出了調整。其目的在於建立、模擬人腦進行分析學習的神經網路,模仿人腦的機制來解釋資料,如文字、影象、聲音。
1、應用場景
機器學習在指紋識別、特徵物體檢測等領域的應用基本達到了商業化的要求。
深度學習主要應用於文字識別、人臉技術、語義分析、智慧型監控等領域。目前在智慧型硬體、教育、醫療等行業也在快速布局。
2、所需資料量
機器學習能夠適應各種資料量,特別是資料量較小的場景。如果資料量迅速增加,那麼深度學習的效果將更加突出,這是因為深度學習演算法需要大量資料才能完美理解。
3、執行時間
執行時間是指訓練演算法所需要的時間量。一般來說,深度學習演算法需要大量時間進行訓練。這是因為該演算法包含有很多引數,因此訓練它們需要比平時更長的時間。相對而言,機器學習演算法的執行時間更少。
4、解決問題的方法
機器學習演算法遵循標準程式以解決問題。它將問題拆分成數個部分,對其進行分別解決,而後再將結果結合起來以獲得所需的答案。深度學習則以集中方式解決問題,而不必進行問題拆分。
關於資料探勘和機器學習的案例資料可以看我前一篇文章:資料探勘十大演算法
資料探勘 機器學習 深度學習常用資料集
大的資料收錄 即被交付給的原始資料集 0.2.1 離散和連續型普通資料集 0.2.2 影象資料集 影象分類 目標檢測 目標跟蹤 語義分割 影象融合 超解析度 flyingchairs 22872張影象對,2d對應的3d影象,標註ground truth為光流。celeba202599張各個尺寸的,此...
資料探勘,機器學習,人工智慧區別
有篇很好的解釋 下面是以前自己總結的。資料探勘一般是指從大量的資料中通過演算法搜尋隱藏於其中資訊的過程。機器學習專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。它是人工智慧的核心,是使計算機具有智慧型的根本途徑,其應用遍及人工智慧的各個...
資料探勘 機器學習 大資料比賽羅列
最近自己想參加一些如題型別的比賽,卻發現找不到。自己知道的比賽平台要麼已經截止報名,要麼就是快結束了,內心真是一萬匹馬在奔騰。好不容易選了個阿里 的比賽,花了兩天時間初步實現了一種方法,提交結果還不錯,至少能進二期,卻發現由於自己沒看比賽規則,需要那啥實名驗證,而被直接淘汰。想想就心酸。看來有必要整...