機器學習 Excel對資料線性回歸分析

2021-10-25 20:13:22 字數 1874 閱讀 3892

三、anscombe四重奏

四、參考

1.線性回歸練習。「父親高則兒子高,父親矮則兒子矮」(即父親與兒子身高相關,且為正相關)、「母高高一窩,父高高乙個」(即母親的身高比父親的身高對子女的影響更大)的習俗傳說是否成立?請在「父母子女身高」資料集(高爾頓資料集)基礎上利用線性回歸做出科學分析。

2.線性回歸方法的有效性判別。 針對「anscombe四重奏」資料集,用excel對四組資料進行線性回歸分析,判斷其中哪些回歸方程是成立的,哪些不成立?不成立的應該如何解決?

在【資料】中使用【篩選】篩出兒子的身高資料。

在【資料】中使用【刪除重複值】刪去家庭編號相同的資料。

進行線性回歸

【資料】→【資料分析】→【回歸】

得到擬合圖,雙擊進行設定

右鍵圖中黃點資料,選擇新增趨勢線,並進行相關設定

觀察上方的統計

通過擬合得出y(兒子身高)對於x(父親身高)的函式:

代入父親身高x=75(英呎),求得兒子身高y=71.345(英呎)

流程同上,將x值換為母親身高

相關係數r的平方很小,說明兩者不具有相關性,即兒子身高基本不受母親身高所影響。

然而常識表明這是不可能的,所以很有可能是我的統計方法有問題。

資料集一:

測定係數=0.666542

p=0.00217

回歸方程:y=0.5x+3

資料集二:

測定係數=0.666242

p=0.002179

回歸方程:y=0.5x+3

資料集三:

測定係數=0.666324

p=0.002179

回歸方程:y=0.5x+3

資料集四:

測定係數=0.666707

p=0.002165

回歸方程:y=0.5x+3

僅僅對這四個資料集進行線性回歸分析,會發現分析得到的資訊及其接近,甚至讓人覺得是4組相同的資料,但是通過檢視圖形能發現這四個資料集的差距。

excel實現線性回歸分析——高爾頓資料集、四重奏資料集

機器學習 西瓜書 三 線性回歸 對數線性回歸

牆裂推薦閱讀 的衍生物 假設樣本x有d個屬性,線性模型 linear model 試圖學得乙個通過屬性的線性組合來進行 的函式,即f x w 1x1 w2x2 wdxd bf x w1 x1 w 2x2 w dxd b,向量形式 f x w tx b f x wt x b對離散屬性,若屬性值之間存在...

機器學習之線性回歸以及Logistic回歸

1 線性回歸 回歸的目的是 數值型資料的目標值。目標值的計算是通過乙個線性方程得到的,這個方程稱為回歸方程,各未知量 特徵 前的係數為回歸係數,求這些係數的過程就是回歸。對於普通線性回歸使用的損失函式一般為平方誤差。把其用最小二乘法進行優化得到的關於係數w求導所得到的矩陣形式的表示式求得的 w便為最...

機器學習中,為何經常要對資料歸一化?

機器學習中,為何經常要對資料歸一化?原因有二 1 歸一化後加快了梯度下降求最優解的速度 2 歸一化有可能提高精度。為什麼歸一化能提高梯度下降法求解最優解的速度?假定為 房價的例子,自變數為面積大小和房間數,因變數為房價。那麼可以得到的公式為 y 1x1 2x 2 y 1x1 2x2 其中,x1 x ...