這篇文章寫一下如何用python實現多元回歸分析
還是繼續上乙個例子:
資料如下:
把這些資料貼上到csv檔案中進行處理
##引入資料報
from numpy import genfromtxt#把匯入的資料轉化為numpy.array
import numpy as np
from sklearn import datasets,linear_model
datapath=r'c:\users\多歡喜\desktop\python小課\機器學習\機器學習01---基礎高階強化\第一階段-深度學習基礎\**與素材(1)\delivery.csv'
deliverydata=genfromtxt(datapath,encoding=
'utf-8-sig'
,delimiter=
',')
print
("data:"
,deliverydata)
#把前兩列當做乙個矩陣,作為自變數
x=deliverydata[:,
:-1]
#取前兩列
#最後一列為y,因變數
y=deliverydata[:,
-1]print
('x:'
,x)print
('y:'
,y)regr=linear_model.linearregression(
)regr.fit(x,y)
print
('coefficients:'
,regr.coef_)
#係數print
('intercept:'
,regr.intercept_)
#截距
#**xpred=[[
102,6]
]ypred=regr.predict(xpred)
print
('predicted y:'
,ypred)
再來看一下自變數中有分型別變數(categorical data)如何處理
原始資料型別:
同樣匯入csv檔案中,轉化一下格式
中間插入3列資料,0 1 2 分別代表三種車型,是哪一種車型,就在對應車型下寫1
建立新的csv檔案
**幾乎沒變,稍微改一下即可
##引入資料報
from numpy import genfromtxt#把匯入的資料轉化為numpy.array
import numpy as np
from sklearn import datasets,linear_model
datapath=r'c:\users\多歡喜\desktop\python小課\機器學習\機器學習01---基礎高階強化\第一階段-深度學習基礎\**與素材(1)\deliverydummydone.csv'
deliverydata=genfromtxt(datapath,encoding=
'utf-8-sig'
,delimiter=
',')
print
("data:"
,deliverydata)
#把前兩列當做乙個矩陣,作為自變數
x=deliverydata[:,
:-1]
#拋棄最後一列
#最後一列為y,因變數
y=deliverydata[:,
-1]print
('x:'
,x)print
('y:'
,y)regr=linear_model.linearregression()#
#regr.fit(x,y)
#print
('coefficients:'
,regr.coef_)
#係數print
('intercept:'
,regr.intercept_)
#截距
scikit learn 回歸分析 多元回歸
般線性回歸中,使用的假設函式是一元一次方程,也就是二維平面上的一條直線。但是很多時候可能會遇到直線方程無法很好的擬合資料的情況,這個時候可以嘗試使用多項式回歸。多項式回歸中,加入了特徵的更高次方 例如平方項或立方項 也相當於增加了模型的自由度,用來捕獲資料中非線性的變化。新增高階項的時候,也增加了模...
EXCEL多元回歸分析
一 多元回歸分析定義 多元回歸分析 multiple regression analysis 是指在相關變數中將乙個變數視為因變數,其他乙個或多個變數視為自變數,建立多個變數之間線性或非線性數學模型數量關係式並利用樣本資料進行分析的統計分析方法。二 不多說,上例項分析過程 1 資料整理 2 資料建模...
統計科學之多元回歸分析
前面我們講了一元線性回歸,沒看過的可以先去看看 一元線性回歸分析。這一篇我們來講講多元線性回歸。一元線性回歸就是自變數只有乙個x,而多元線性回歸就是自變數中有多個x。多元回歸的形式如下 多元回歸方程中各個引數也是需要估計的,關於為什麼要估計,其實我們在一元線性回歸裡面也講過。與一元線性回歸不同的是,...