首先舉乙個**住房**的例子,其中使用的資料集為某市住房尺寸及對應的**。如果一間住房面積為1250平方尺,這間住房能賣多少錢?那麼,第一件事就是構建乙個模型,也許是條直線,從這個資料模型上看,大約能以220000(美元)左右的**賣掉這間房子。這就是監督學習演算法的乙個例子。
它被稱作監督學習是因為對於每個資料來說,我們給出了「正確的答案」,即告訴我們:根據我們的資料來說,房子實際的**是多少,更具體來說,這是乙個回歸問題。回歸一詞指的是,我們根據之前的資料**出乙個準確的輸出值,對於這個例子就是**。同時,還有另一種常見的監督學習方式,叫做分類問題,當我們想要**離散的輸出值,例如,我們正在尋找癌症腫瘤,並想要確定腫瘤是良性的還是惡性的,這就是0/1離散輸出的問題。更進一步來說,在監督學習中我們有乙個資料集,這個資料集被稱為訓練集。
以之前的房屋交易問題為例,假使我們回歸問題的訓練集(training set)如下表所示:
將用來描述這個回歸問題的標記如下:
m 代表訓練集中例項的數量
x 代表特徵/輸入變數
y 代表目標變數/輸出變數
(x,y) 代表訓練集中的例項
h 代表學習演算法的解決方案或函式也稱為假設(hypothesis)
這就是乙個監督學習演算法的工作方式,可以看到這裡有訓練集裡的房屋**,我們把它餵給我們的學習演算法,學習演算法工作了,然後輸出乙個函式,通常表示為小寫h。h根據輸入的x值來得出y值,因此,h是乙個從x到y 的函式對映。
那麼該如何表達h?一種可能的表達方式為:h(x)=θ₀+θ₁x,因為只含有乙個特徵/輸入變數,因此這樣的問題叫做單變數線性回歸問題。
單變數線性回歸模型
擬合函式 h x theta theta x x x x x 訓練集 h h h h 訓練集 共m個樣本 參考知乎 值與實際值差的平方和的最小值 取值才能讓這條直線最佳地擬合這些資料呢?這就是代價函式登場的時刻了 j left theta theta right frac sum left hat ...
單變數線性回歸
參考 模型表示 線性回歸 linear regression 是利用稱為線性回歸方程的最小平方函式對乙個或多個自變數和因變數之間關係進行建模的一種回歸分析。這種函式是乙個或多個稱為回歸係數的模型引數的線性組合。只有乙個自變數的情況稱為簡單回歸,大於乙個自變數情況的叫做多元回歸。詳細描述 之前的房屋交...
單變數線性回歸
線性回歸模型 linear regression model 包括線性假設 linear hypothesis 和平方差代價函式 squared error cost function 字母的含義 m number of training examples 訓練樣本的數量 x input varia...