買西瓜跟機器學習

2021-07-31 01:47:48 字數 421 閱讀 9342

開坑,記錄機器學習和自然語言處理閱讀的內容。

為什麼乙個色澤青綠、根蒂蜷縮、敲聲渾響的西瓜,人們能判斷是正熟的好瓜?

因為我們吃過、看過很多西瓜,所以基於色澤、根蒂、敲聲這幾個特徵我們可以做出相當好的判斷。對經驗的利用是

我們人類靠自身完成的,計算機能幫忙嗎?機器學習正是這樣一門學科,它致力於研究如何通過計算的手段,利用經驗

來改善自身的系統,在計算機系統中,「經驗」通常以「資料」形式存在,因此機器學習研究的主要內容,是關於在計算機

上從資料中產生「模型」的演算法,即「學習演算法」,有了學習演算法,我們把經驗資料提供給它,它就能基於這些資料產生模

型,在面對新的情況時,例如乙個沒剖開的西瓜,模型會給我們提供相應的判斷(例如好瓜)。如果說電腦科學是

研究關於「演算法」的學問,那麼類似的,可以說機器學習是研關於「學習演算法」的學問。

西瓜書 機器學習《一》

泛化能力 學習的模型適應新樣本的能力。奧卡姆剃刀原則 自然科學研究中常用的原則。即 若有多個假設和觀測一致,那麼就選擇最簡單的假設。連線主義 黑箱模型,例如 神經網路,不可解釋性,引數手工等調整 符號主義 決策理論的學習技術,例如決策樹學習 以資訊理論為基礎,以資訊熵的最小化為目標。統計學習 svm...

機器學習西瓜書筆記

概念 致力於通過計算的手段,利用經驗來改善系統自身的效能。其中,經驗以資料的形式存在。基本術語 資料集 記錄的集合。示例 樣本 每條記錄,關於乙個事件或物件的描述,反應事件或物件在某方面的表現或性質的事項。屬性 特徵 一條記錄 乙個樣本由多個屬性 特徵組成。屬性值 屬性或特徵的值。示例對應於乙個座標...

機器學習西瓜書 基本術語

一組記錄的集合,例如 注 d dd又稱為樣本的維數 資料集中每條記錄是關於乙個事件或物件的描述,例如 反映事件或物件在某方面的表現或性質的事項,例如 屬性上的取值,例如 屬性張成的空間,例如 假設有三種屬性 色澤 根蒂 敲聲,就可以張成乙個用於描述細化的三維空間,每個西瓜都可以在這個空間中找到自己的...