什麼是機器學習?乙個不是很正式的回答是:不直接通過程式設計讓計算機解決問題,而是試著讓計算機自己找到解決方式。
(一)學習過程可以分為:資料輸入,抽象化,一般化。
抽象化:由學習任務和所分析的資料型別來決定學習的模型,用這個模型來擬合資料集(稱之為訓練),然後資料就轉換為乙個彙總了原始資訊的抽象形式。
一般化:把抽象知識轉化為可以應用的行動。
(二)機器學習應用於資料的步驟
1.收集資料
2.探索資料和準備資料
3.基於資料訓練模型。
4.評價模型效能
5.改進模型
案例:分析事物最基本單位的一組資料,如診斷癌症,案例是一些病人的活檢切片。
觀察單位:用來描述被測量者的案例單位
特徵:案例的乙個屬性或特性,一般以矩陣**的形式呈現。特徵分為多種形式,如果特徵用數值衡量,那就是數值型。如果屬性通過一組類別表示,這樣的特徵被稱為分類變數或者名義變數。分類變數中一種特殊型別:有序變數,指分類變數類別落在乙個有序列表,如果衣服分為大中小等。
(三)機器學習演算法分類:監督學習和非監督學習。
監督學習:又稱為建立**模型的過程,目的是發現並建模目標特徵(需要**的特徵)和其他特徵之間的關係。具體來說,給一組資料,學習演算法嘗試最優化乙個函式模型來找出屬性值之間的組合方式,最終給出目標值。常見的任務是**案例屬於哪一型別(稱之為分類)。比如給你一堆房子的面積和**的資料,通過學習能夠再輸入新的面積,**對應的**。也就是說,先告訴你資料的「標準答案」了,讓你在此基礎上**。
非監督學習:又稱為建立描述性模型的過程。學習者沒有特定的學習任務,沒有學習目標(沒有標準答案),識別資料之間的緊密性,常用於資料探勘。例如對交易之間的購買資料進行購物籃分析,游泳褲通常和防曬霜一起買之類的。資料集按照相同型別分組的任務被稱為聚類。
摘自教程:《機器學習與r語言》
機器學習一 簡介
1 機器學習目的 教會計算機根據以往的經驗來執行指定的任務。2 決策樹 一種 模型,常用的分類方法。樹形結構。3 樸素貝葉斯 二八原則 在任何一組東西中,最重要的只佔其中一小部分,約20 其餘80 儘管是多數,卻是次要的。4 梯度下降 最優演算法 問題 過程 解決方案 最小化誤差的通用演算法是梯度下...
《機器學習基石》筆記一 機器學習簡介
人類學習是從不斷的觀察獲得經驗的技能。機器學習是從資料出發,通過數 算等方式獲得經驗增強的技能。1 存在一些內部的規則 2 程式設計無法把這個規則定義出來 3 有充足的資料 輸入樣本空間 x x x x x x輸出樣本空間 y y y y y y目標函式 要學習出的模式 f x yf x longr...
機器學習簡介
機器學習簡介 機器學習是人工智慧的乙個分支。人工智慧的研究是從以 推理 為重點到以 知識 為重點,再到以 學習 為重點,一條自然 清晰的脈絡。顯然,機器學習是實現人工智慧的乙個途徑,即以機器學習為手段解決人工智慧中的問題。機器學習在近30多年已發展為一門多領域交叉學科,涉及概率論 統計學 逼近論 凸...