機器學習從上面的圖來看是屬於人工智慧的部分,機器學習主要分為回歸,聚類,分類
那麼機器學習的定義是什麼呢?可以參考
何謂 「機器學習」,學界尚未有統一的定義。但有兩個定義特別值得了解:乙個來自卡內基梅隆大學的tom mitchell教授,乙個來自goodfellow、bengio 和 courville合著的經典「花書」《深度學習》。
這裡給出,來自著名的計算機科學家、機器學習研究者,卡內基梅隆大學的 tom mitchell 教授的定義:
對於某類任務 t 和效能度量 p,如果乙個電腦程式在 t 上以 p 衡量的效能隨著經驗 e 而自我完善,那麼我們稱這個電腦程式在從經驗 e 中學習。機器學習演算法主要分為三類:監督學習,無監督學習,強化學習。
監督學習:通過樣本訓練模型函式,把新資料帶入模型**輸出結果
主要分為:回歸,分類
無監督學習:資料沒有標註,通過演算法找到資料間的關係。
主要分為:聚類和降維。
首先,要介紹的是監督學習裡面的回歸裡的線性回歸?對於線性回歸概念和推倒介紹可以參考
我的總結是:
第一步:確定線性回歸模型
第二步:獲取損失函式
第三步: 梯度下降迭代,引數更新
接著,介紹python 中的機器學習庫scikit-learn,支援分類,回歸,聚類,降維,資料處理等功能
sklea,sample_weight rn有很多資料集,載入資料集需要載入datasets
from sklearn import datasets;
1)內建資料集
比如datasets.load_boston() 波士頓房價,其他的可以去官網搜尋看一下
datasets.fetch_資料集名稱
3)生成本地資料集
datasets.make_資料集名稱
例如製作回歸資料集:
datasets.make_regression(n_samples = 600,n_features=100,....)
主要引數:n_samples:資料樣本,n_features:資料特徵
例如:
sklearn線性回歸
sklearn.linear_model是sklearn中子模組,包含線性回歸,邏輯回歸等演算法。
### 模型建立
from sklearn.linear_model import linearregression
linearregression主要方法:
1.fit(x,y,sample_weight = none) 訓練,x,y訓練資料,sample_weight 每條資料權重
2.predict(x) **
3.coef_ 模型係數(方程係數)
4.intercept_ 截距值
### 模型驗證
我們需要把資料分成訓練集和測試集,因此我們需要用到train_test_split方法
### 訓練模型評估
使用均方差(mse)或者均根方差(rmse)進行評估:
from sklearn import metrics
mse:metrics.mean_squarred_error(測試值,**值)
rmse:np.sqrt(metrics.mean_squarred_error())
最後我們這裡引入乙個小案例,進一步加強對線性回歸的理解,案例是對波士頓房價的**
機器學習演算法篇 一 線性回歸
以上即為引數 梯度下降特點 選擇合適的學習速率 通過不斷的迭代,找到 0 n,使得j 值最小 正規方程特點 不需要選擇學習速率 不需要n輪迭代 只需要乙個公式計算即可 但是並不是所有的線性回歸都適合用正規方程,我們知道求解乙個矩陣的逆複雜度為o n 3 因此當特徵維度n非常大的時候 x t x 1需...
學習 機器學習之線性回歸篇
2019年3月7日,學習內容 1 什麼是線性模型 變數與變數之間的關係能夠用一次模型來表示 舉例 y c ax by cz 則此為線性模型,需要注意的是直線是特殊的線性模型 因為只有兩個變數時,並且這兩個變數是一元一次方程的關係,則是直線 以前一直以為線性回歸模型就是直線模型,這是錯誤認識。2 當使...
機器學習演算法之線性回歸
有監督學習 學習樣本為 d xi,yi n i 1 輸出 的結果yi為連續值變數 需要學習對映 y 假定輸入x和輸出y之間有線性相關關係 對於給定的x,其輸出y f x wt x b 可以利用最小二乘法對w和b進行估計 根據自變數個數可以將線性回歸主要分為兩種 一元線性回歸和多元線性回歸。一元線性回...