線性回歸練習

2021-10-25 20:15:29 字數 1428 閱讀 4214

excel做回歸分析,主要分析資料意義

multiple r:x和y的相關係數r,一般在-1~1之間,絕對值越靠近1則相關性越強,越靠近0則相關性越弱

r square:x和y的相關係數r的平方,表達自變數x解釋因變數y變差的程度,以測定量y的擬合效果;

adjusted r square:調整後的r square,說明自變數能說明因變數百分比

標準誤差:用來衡量擬合程度的大小,也用於計算與回歸相關的其它統計量,此值越小,說明擬合程度越好

觀察值:用於訓練回歸方程的樣本資料有多少個

方差分析表

significance f:即p值 越小越好,代表整體回歸方程的有效性,通常認為小於0.05,f校驗通過,方程顯著有效。

第三張表

p-value:p值,用來檢驗回歸方程係數的顯著性,又叫t檢驗,t檢驗看p值,是在顯著性水平α(常用取值0.01或0.05)下f的臨界值,一般以此來衡量檢驗結果是否具有顯著性,如果p值》0.05,則結果不具有顯著的統計學意義,如果0.01具體參考:

首先準備好資料集

按照相關步驟做出回歸分析選項

結果如下:

這裡做的是母親與子女的身高關係回歸分析

由表可知,

相關係數為0.2,相關度極低

擬合優度0.04,擬合度很差

f值為1.08e-09,

p值也很小,

儘管f值和p值很小,但相關係數和擬合優度很低,故母親與子女身高關係的回歸方程不成立

資料集1

資料集2

資料集3

資料集4

由上述資料可得,四組資料做回歸分析後的相關資料都相差不多,都符合回歸方程成立的條件,但這並不表明四組資料的回歸方程都成立,可以從圖中讀出,只有資料集3符合回歸方程,其餘3個的資料或多或少與對應的回歸方程不符,即資料集3的回歸方程成立,其餘的不成立

可以看出,除資料集3,其餘的明顯不符線性回歸規律,故回歸分析無意義

線性回歸練習

1 極大似然估計原理 它是建立在極大似然原理的基礎上的乙個統計方法,極大似然原理的直觀想法是,乙個隨機試驗如有若干個可能的結果a,b,c,若在一次試驗中,結果a出現了,那麼可以認為實驗條件對a的出現有利,也即出現的概率p a 較大。極大似然原理的直觀想法我們用下面例子說明。設甲箱中有99個白球,1個...

Regularization線性回歸練習

監督機器學習問題無非就是在規則化引數的同時最小化誤差。最小化誤差是為了讓我們的模型擬合我們的訓練數 據,而規則化引數是防止我們的模型過分擬合我們的訓練資料。因為引數太多,會導致我們的模型複雜度上公升,容易 過擬合,也就是我們的訓練誤差會很小。但訓練誤差小並不是我們的最終目標,我們的目標是希望模型的測...

練習 線性回歸Linear regression

用線性回歸演算法擬合正弦函式 import numpy as np import matplotlib.pyplot as plt matplotlib inline 生成200個 2pi,2pi 之間的正弦函式上的點,並加上隨機雜訊 n dots 200x np.linspace 2 np.pi,...