機器學習,一直以來都是計算機相關從業者研究的領域之一,整個行業也在欺負之中不斷地深入發展。隨著深度學習的崛起,及其徐誒再一次乘上了時代的浪潮,成為新寵!今後將在和大家一起分享我在深度學習這一塊的各種酸甜苦辣
機器學習:顧名思義是指機器學習的乙個過程。
在機器學習中,有三個基本的要素:任務t、經驗e和效能p。則機器學習=通過經驗e的改進後,機器在任務t上的效能p所度量的效能有所改進=t--(從e中學習)-->p(提高)
機器學習中常見的任務t分類:
效能度量p:
1.準確率 2.錯誤率 3.樣本概率的對數平均值
訓練集:用於訓練機器學習的資料集
測試集:用於測試機器學習效果的資料集
訓練集和測試集都是由許多的樣本點組成
經驗e:
無監督學習:資料集無標籤,如密度分布,去燥等
有監督學習:資料集有標籤,如線性回歸,部分分類問題等
p和e的關係以及機器學習的目的:
「經驗」通常是以「資料」形式存在;而機器學習的目的就是從這些資料中的經驗產生乙個模型(model),然後用這個產生出來的model去幫助我們解決新的問題,並且把模型在解決新的問題上的能力稱為泛化能力!在訓練集上產生的誤差稱為訓練誤差,而在測試集上產生的誤差稱為泛化誤差!
機器學習的五大部件:
1.任務2.模型3.效能度量4.學習演算法5.經驗
我們以乙個線性回歸任務為例說明:
那麼本次針對線性回歸的目的,則是通過學習測試集中資料的經驗,生成乙個模型,將模型產生的輸出值與樣本真實值之間的均方誤差作為效能度量標準,我們需要選擇乙個合適的學習演算法(最小二乘法、梯度下降等)使該效能度量標準達到最優!
欠擬合:模型在訓練集上的誤差過大
過擬合:模型在測試集上的誤差過大
容量:模型擬合各種函式的能力。一般來說,容量低的模型容易導致欠擬合,而容量高的模型容易導致過擬合。
不同的模型容量導致不同的效果:
在機器學習過程中,不是通過學習所獲得的引數,稱為超引數(學習率等)
機器學習基礎 機器學習基礎引入
機器學習 是人工智慧的核心研究領域之一,其最初的研究動機是為了讓計算機系統具有人的學習能力以便實現人工智慧。事實上,由於 經驗 在計算機系統中主要是以資料的形式存在的,因此機器學習需要設法對資料進行分析,這就使得它逐漸成為智慧型資料分析技術的創新源之一。機器學習是構建複雜系統的一種方法,也許依靠我們...
機器學習基礎學習筆記 機器學習基礎介紹
概念 多領域交叉學科,設計概率論 統計學 逼近論 凸分析 演算法複雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。學科定位 人工智慧 artificial intelligence,ai 的核心,是是計算機具有智慧型...
機器學習 二 機器學習基礎
機器學習基礎概念 關於資料 監督學習 機器學習的基本任務,具體可以做什麼?結果是乙個連續數字的值,而非乙個類別 回歸任務可以劃分成分類任務。給機器的訓練資料擁有 標記 或者 答案 例如 1.影象已經擁有了標定資訊 2.銀行已經積累了一定的客戶資訊和他們信用卡的信用情況 3.醫院已經積累了一定的病人資...