機器學習筆記(1) 基本概念和線性回歸

2021-10-06 05:16:45 字數 631 閱讀 3114

計算機從程式經驗e中學習,解決某一任務t,進行某一效能的度量p,通過p測定在t上的表現因經驗e而提高。簡單來說就是從大量的資料學習中,得到乙個符合現實的規律模型,通過模型來**某個資料的結果。

首先給演算法乙個包含正確答案的資料集,通過訓練來調整目標函式的引數,使用目標函式獲得更多的正確答案。監督學習中包括回歸問題,即**連續的輸出;還有分類問題,即輸出離散的值。

根據類別未知的資料集,解決模式識別中的問題。即對資料及進行分類每一方便了解資料集內部的資料結構。典型的例子就是聚類分析,聚類的目的是把相似的資料聚集在一起。

回歸分析是一種**性的建模技術,它研究的是因變數(目標)和自變數(**器)之間的關係。這種技術通常用於**分析,時間序列模型以及發現變數之間的因果關係。通常使用曲線/線來擬合資料點,目標是使目標函式和資料點之間的距離最小。

線性回歸是回歸分析的一種,假設資料集與特徵之間線性相關,滿足多元一次方程(以二元函式為例):

該方程又稱為目標函式。

通過代價函式:

來計算目標函式與資料集之間的差異,差異越小越好。其中的1/m代表求均值,1/2是為了方便下一步的梯度下降法求導時新增的常數。

機器學習(1) 基本概念

神經網路技術起源與上世紀50年代。當時叫做感知機。擁有輸入層,輸出層和乙個隱含層。這種感知機被稱為單層感知機 1959,機器學習被定義為不直接程式設計的情況下賦予計算機學習能力。1974年哈佛大學的paul werbos發明bp演算法。bp演算法正是用來求解這種多層復合函式的所有變數的偏導數的利器。...

機器學習1 基本概念

1.機器學習定義 機器學習 arthur samuel,1959 在確定程式設計之外給予計算機學習能力的研究領域。機器學習 tom mitchell,1998 如果電腦程式對於任務t的效能度量p通過經驗e得到了提高,則認為此程式對e進行了學習。2.機器學習四個主要內容 監督學習 包括回歸 連續性問題...

機器學習1 基本概念

參考 資料集 色澤 青綠 根蒂 蜷縮 敲聲 濁響 色澤 墨綠 根蒂 稍蜷 敲聲 沉悶 色澤 淺白 根蒂 硬挺 敲聲 清脆 基本概念 1 樣本 這批資料裡的每對括號。2 資料集 樣本的集合。3 特徵 屬性 色澤 根蒂 敲聲等反映事物的本質的可觀察方面。4 屬性值 青旅 墨綠 蜷縮 濁響等,是屬性的取值...