機器學習系列(一)簡介 線性回歸與成本函式

2021-10-20 22:31:07 字數 1227 閱讀 8002

二、線性回歸

三、成本函式

上面在介紹概念的時候我們已經提到了,機器學習的過程需要資料這個參考資料。所以想要開發出一套適用於某個場景的機器學習系統,我們首先要做的應當是從這個場景中收集到足夠多的資料以供機器進行學習。這裡涉及到兩個方面的問題,第一:資料收集;第二:資料預處理。這兩個問題通常也是十分困擾研究人員的問題,對實驗的好壞有著關鍵性作用。

當我們有了足夠的資料進行訓練之後,我們就可以設計一系列方程來作為機器學習的演算法,然後根據這些方程的優劣,挑選出最合適的方程,至此乙個機器學習的系統基本搭建完成。

監督學習:這是一種通常的機器學習方式,監督的意思是說用於機器學習的資料都是有標籤的(也就是說有明確的結果),因此我們可以通過不斷的比較機器計算的結果與原標籤比較從而來對整個學習過程起到監督作用。

半監督學習:對比於上面的監督學習,所謂的半監督學習其實就是由於資料量不足,僅有一部分用於機器學習的資料是有標籤的。

無監督學習:顧名思義,就是說用於訓練的資料均沒有標籤,或許你可能會感到疑惑,這樣的情況下,我們該如何訓練演算法,事實上,它有其特定的應用場景,比如找出異常點或者找出洗錢活動等等。感興趣的同學可以自己搜尋了解一下。

遷移學習:遷移學習的意思是指,當我有了乙個已經訓練的很好的機器學習模型時,我可以將這個機器學習模型直接用於類似的場景,不需要在進行訓練。

所謂回歸其實就是將輸入變數與輸出變數聯絡起來,同時可以對新的輸入變數進行**同時理解輸入對於輸出的影響。

在回歸中,資料通常是成對(xn

,yn)

(x_n,y_n)

(xn​,y

n​)組成的,其中y

ny_n

yn​是第n個結果,x

nx_n

xn​是緯度為d的輸入向量。

從剛才回歸的例子中,我們不難推測,所謂的線性回歸的意思就是說輸入與輸出之間的關係是線性的。符合這種關係的例子比比皆是,比如某一地區的房屋面積與房子的總價近似是乙個正相關的線性關係,房子越大**越貴。

簡單的線性回歸

多維的線性回歸d

>

1d>1

d>

1之所以有成本函式,就是為了評估引數值w是否合理。成本函式就是被用來評價學習到的引數是否合理,也可以說是我們這個模型的錯誤有多大。

除了mse和mae之外,還有其他損失函式。

機器學習實踐系列 一 普通線性回歸

this blog is based on sklearn dataset,i.e.diabetes.build a linear regression model.import numpy as np from sklearn.utils import shuffle import matplot...

機器學習系列之一 線性回歸模型

目錄1.線性回歸 1.1 問題轉換 1.2 衡量標準 1.3 學習方向 1.線性回歸 1.1 問題轉換 今天我們來談一下線性回歸。問題 假如我想知道乙個房屋的房價是多少,現在我們能提供的資料報含房屋的面積,房屋的朝向,房屋的地理位置等有關房子的資訊,我們該怎麼做呢?聰明的你一定已經知道了。為了方便,...

機器學習4 邏輯回歸與線性回歸

1 model 2 loss function 線性回歸損失函式由均方差來衡量 邏輯回歸由交叉熵衡量。邏輯回歸的loss function由training data來決定,模型需確保training data分類正確率最大,假設training data為 求上述概率公式最大化即可得到模型引數。這...