機器學習筆記(一)

2021-09-26 14:46:17 字數 1529 閱讀 2825

我使用python 3.7來進行學習,沒有裝配環境的同學可以到下方鏈結檢視教程。

特徵

樣本

無標籤的樣本 :(x,

?)(x, ?)

(x,?)

模型 單個特徵的線性關係:y′=

b+w1

x1y' = b + w_1x_1

y′=b+w

1​x1

​ 多個特徵:y′=

b+w1

x1+w

2x2+

w3x3

+...

y' = b + w_1x_1 + w_2x_2 + w_3x_3 + ...

y′=b+w

1​x1

​+w2

​x2​

+w3​

x3​+

...訓練模型表示通過有標籤樣本來學習(確定)所有權重和偏差的理想值。在監督式學習中,機器學習演算法通過以下方式構建模型:檢查多個樣本並嘗試找出可最大限度地減少損失的模型;這一過程稱為經驗風險最小化

顯然,左側的模型損失更大。當然僅僅這樣是不夠的,我們需要乙個量化的標準:平方損失

平方損失是一種常見的損失函式,單個樣本的平方損失可以描述為:

均方誤差(mse):每個樣本的平均平方損失

m se

=1n∑

(x,y

)∈d(

y−pr

edic

tion

(x))

2mse = \frac \sum_ (y - prediction(x))^2

mse=n1

​(x,

y)∈d

∑​(y

−pre

dict

ion(

x))2

其中: pre

dict

ion(

x)prediction(x)

predic

tion

(x)指的是權重和偏差與特徵集x

xx結合的函式(計算出y′y'

y′)d

dd指的是包含多個有標籤樣本(即(x,

y)(x, y)

(x,y

))的資料集

n

nn指的是d

dd中樣本的數量

雖然 mse 常用於機器學習,但它既不是唯一實用的損失函式,也不是適用於所有情形的最佳損失函式。

此外,由於mse的值根據平方得來,其單位與數量級均不能很好地反映原始資料的情況,在實際操作時大多會選用rmse,即對求得的值開平方。

anaconda安裝教程

python環境裝配教程(先安裝anaconda)

google官方教程鏈結

這是第一期,上方鏈結追蹤學習進度。

機器學習筆記(一) 了解機器學習

1 人工智慧是我們想要達成的目標,機器學習是想要達成目標的手段,深度學習就是機器學習的其中乙個方法。2 機器學習,根據你提供的資料尋找乙個function,如下圖,輸入一段語音知道是 how are you 輸入貓的知道是 貓 怎樣找出這個function呢?第一,要有一系列的function,即模...

機器學習筆記(一)

機器學習筆記 1,2課 一.線性回歸模型 1.數學模型 對於乙個具體的問題,x1,x2 是我們所選取的特徵,h x 是我們所建立的模型,其中有n 1個引數。我們希望所建立的數學模型可以很好的刻畫實際問題,而我們所擁有的就是訓練資料集。很自然的,我們希望數學模型可以較好的表述訓練資料集的情況。雖然對訓...

機器學習筆記(一)

統計學習三要素 模型 策略和演算法。模型分類有幾種,監督非監督,引數非引數等。監督學習又分為生成方法和判別方法。生成模型有 樸素貝葉斯和隱馬爾科夫。判別模型有 k近鄰,感知機,決策樹,邏輯回歸,em,svm,boost,crf.引數模型 引數個數固定,與訓練資料無關。非引數模型 引數個數依賴於訓練資...