機器學習基本概念(1)

2021-10-10 10:32:49 字數 855 閱讀 5761

機器學習是研究如何通過計算的手段,利用經驗來改進系統的效能,而經驗往往是指資料。機器學習本質上是一種複雜的演算法,它通過在大量的資料中挖掘隱含的資訊,從而達到**輸出和分類的目的。

通過學習得到的模型,很好的適用於新的樣本,這種能力也叫泛化能力。

資料集:n條記錄的集合

示例(樣本、特徵向量):每條記錄關於乙個事件或者物件的描述 ,即一條記錄

屬性(特徵):反映事件或物件在某一方面的表現或者性質的事項,即乙個字段

屬性值:屬性的取值

屬性空間(樣本空間、輸入空間):屬性張成的空間

樣本的「」維數「」:即屬性的個數

樣例:擁有了標記資訊的示例

標記空間(輸出空間):所有標記的集合

監督學習和非監督學習(訓練資料是否擁有標籤)

監督學習:

分類:**離散型資料的輸出

回歸:**連續性資料的輸出

非監督學習:

聚類:對訓練集中的資料進行分組,每組為乙個簇

假設空間:乙個事物或物件所有假設組成的空間

版本空間:多個假設與訓練集一致、即存在乙個與訓練集一致的「」假設集合「」,稱為版本空間

歸納偏好:機器學習演算法在學習過程中對某種型別假設的偏好。

作用:通過學習得到多個模型,學習演算法必須對其有乙個偏好,否則會產生搖擺不定的結果

奧卡姆的剃刀(occam』s razor): 若有多個假設與觀察一致,選最簡單的。 但有時候評判最簡單需要借助其他機制

沒有免費午餐定理(nfl定理):,假設所有「問題」出現機會相同,或所有問題同等重要,那麼所有演算法的期望效能一致。 脫離具體問題談什麼演算法最好,毫無意義。

機器學習(1) 基本概念

神經網路技術起源與上世紀50年代。當時叫做感知機。擁有輸入層,輸出層和乙個隱含層。這種感知機被稱為單層感知機 1959,機器學習被定義為不直接程式設計的情況下賦予計算機學習能力。1974年哈佛大學的paul werbos發明bp演算法。bp演算法正是用來求解這種多層復合函式的所有變數的偏導數的利器。...

機器學習1 基本概念

1.機器學習定義 機器學習 arthur samuel,1959 在確定程式設計之外給予計算機學習能力的研究領域。機器學習 tom mitchell,1998 如果電腦程式對於任務t的效能度量p通過經驗e得到了提高,則認為此程式對e進行了學習。2.機器學習四個主要內容 監督學習 包括回歸 連續性問題...

機器學習1 基本概念

參考 資料集 色澤 青綠 根蒂 蜷縮 敲聲 濁響 色澤 墨綠 根蒂 稍蜷 敲聲 沉悶 色澤 淺白 根蒂 硬挺 敲聲 清脆 基本概念 1 樣本 這批資料裡的每對括號。2 資料集 樣本的集合。3 特徵 屬性 色澤 根蒂 敲聲等反映事物的本質的可觀察方面。4 屬性值 青旅 墨綠 蜷縮 濁響等,是屬性的取值...