三、anscombe四重奏
四、參考
1.線性回歸練習。「父親高則兒子高,父親矮則兒子矮」(即父親與兒子身高相關,且為正相關)、「母高高一窩,父高高乙個」(即母親的身高比父親的身高對子女的影響更大)的習俗傳說是否成立?請在「父母子女身高」資料集(高爾頓資料集)基礎上利用線性回歸做出科學分析。
2.線性回歸方法的有效性判別。 針對「anscombe四重奏」資料集,用excel對四組資料進行線性回歸分析,判斷其中哪些回歸方程是成立的,哪些不成立?不成立的應該如何解決?
在【資料】中使用【篩選】篩出兒子的身高資料。
在【資料】中使用【刪除重複值】刪去家庭編號相同的資料。
進行線性回歸
【資料】→【資料分析】→【回歸】
得到擬合圖,雙擊進行設定
右鍵圖中黃點資料,選擇新增趨勢線,並進行相關設定
觀察上方的統計
通過擬合得出y(兒子身高)對於x(父親身高)的函式:
代入父親身高x=75(英呎),求得兒子身高y=71.345(英呎)
流程同上,將x值換為母親身高
相關係數r的平方很小,說明兩者不具有相關性,即兒子身高基本不受母親身高所影響。
然而常識表明這是不可能的,所以很有可能是我的統計方法有問題。
資料集一:
測定係數=0.666542
p=0.00217
回歸方程:y=0.5x+3
資料集二:
測定係數=0.666242
p=0.002179
回歸方程:y=0.5x+3
資料集三:
測定係數=0.666324
p=0.002179
回歸方程:y=0.5x+3
資料集四:
測定係數=0.666707
p=0.002165
回歸方程:y=0.5x+3
僅僅對這四個資料集進行線性回歸分析,會發現分析得到的資訊及其接近,甚至讓人覺得是4組相同的資料,但是通過檢視圖形能發現這四個資料集的差距。
excel實現線性回歸分析——高爾頓資料集、四重奏資料集
機器學習 西瓜書 三 線性回歸 對數線性回歸
牆裂推薦閱讀 的衍生物 假設樣本x有d個屬性,線性模型 linear model 試圖學得乙個通過屬性的線性組合來進行 的函式,即f x w 1x1 w2x2 wdxd bf x w1 x1 w 2x2 w dxd b,向量形式 f x w tx b f x wt x b對離散屬性,若屬性值之間存在...
機器學習之線性回歸以及Logistic回歸
1 線性回歸 回歸的目的是 數值型資料的目標值。目標值的計算是通過乙個線性方程得到的,這個方程稱為回歸方程,各未知量 特徵 前的係數為回歸係數,求這些係數的過程就是回歸。對於普通線性回歸使用的損失函式一般為平方誤差。把其用最小二乘法進行優化得到的關於係數w求導所得到的矩陣形式的表示式求得的 w便為最...
機器學習中,為何經常要對資料歸一化?
機器學習中,為何經常要對資料歸一化?原因有二 1 歸一化後加快了梯度下降求最優解的速度 2 歸一化有可能提高精度。為什麼歸一化能提高梯度下降法求解最優解的速度?假定為 房價的例子,自變數為面積大小和房間數,因變數為房價。那麼可以得到的公式為 y 1x1 2x 2 y 1x1 2x2 其中,x1 x ...