機器學習 回歸問題(一)

2021-07-30 07:52:42 字數 1030 閱讀 9269

首先,我們來看乙個例子。

你有乙個朋友,他有一套750平方英呎的房子,他來問你能賣多少錢。

然後,你就找來了附近房子的最近買賣資訊,然後把面積跟房價畫了一條曲線出來。(注:例子與圖來自andrew ng的machine learning課程。)

如圖,我們知道的只是上面一些點,橫座標是面積,縱座標是房價。現在你要怎麼**朋友的房子賣多少錢呢?

開始,你覺得這些點像一條直線,於是就畫了一條直線去進過盡量多的點,然後在750的地方畫了一條豎線上去,得出房價為150k。

然後你又覺得這個擬合不是很好,你想到二次曲線的形狀更符合點的分布,然後又有了藍色的曲線,根據這條曲線,得出房價為200k。

可見準確的擬合資料的變化趨勢是多麼重要!

上述的問題就是乙個回歸問題,即根據已有的資料推測出一系列連續值的屬性,從而能**其他值的輸出結果。

簡單來說,回歸就是求解一些資料服從的函式或者分布。

我們來看另外乙個例子:

上圖是腫瘤大小和是否為良性的關係,惡性腫瘤標記為1,良性標記為0.

我們發現這組資料不像之前的那樣好找規律了。

於是,我們蒐集了更多的資訊,患者的年齡。

如圖,橫座標是腫瘤大小,縱座標是患者年齡,資料點中圓圈代表良性,×代表惡性。

這次,我們換一種做法,在這個資料空間裡找一條直線,但不是過這些點,二是將這些點分在直線兩側。

然後有新的患者,我們將他的特徵描到這個空間中,看他屬於哪一邊,這樣就可以大致判斷腫瘤的性質。

上面這個問題屬於分類問題,即通過已知資料推測出離散的輸出值。

這一部分我們通過兩個例子解釋了回歸和分類的區別,這兩種演算法都是屬於監督學習的範疇。

機器學習 線性回歸問題

案例分析 正規方程 梯度下降 嶺回歸 from sklearn.datasets import load boston from sklearn.linear model import linearregression,sgdregressor,ridge from sklearn.model se...

機器學習 回歸

有別於分類問題,回歸問題,主要是通過特徵來構造乙個函式,並用這個函式求得的值來近似的估計我們需要 的值。回歸的種類有很多,當然我一時之間不能夠完全的總結出所有的回歸分析方法,但是我們在以後的學習中慢慢的補充。作為乙個初學者,以下的總結可能有一些個人的誤區,所以如果出現什麼錯誤的話,我希望各個讀者能夠...

機器學習 回歸

機器學習之路 python支援向量機回歸svr 波士頓地區房價 python3 學習使用api 支援向量機的兩種核函式模型進行 原始碼 git from sklearn.datasets import load boston from sklearn.cross validation import ...