乙個簡單的例子!
環境:centos6.5
hadoop集群、hive、r、rhive,具體安裝及除錯方法見部落格內文件。
線性回歸主要用來做**模型。
1、準備資料集:
x y0.10 42.0
0.11 43.5
0.12 45.0
0.13 45.5
0.14 45.0
0.15 47.5
0.16 49.0
0.17 53.0
0.18 50.0
0.20 55.0
0.21 55.0
0.23 60.0
> s=read.table("2、確定線性回歸函式:y = β0 + β1x + εtest-1.txt
", header = f)
其中β0 + β1x 表示y隨x的變化而線性變化的部分;ε是隨機誤差,是一切不確定因素的總和,其值不可測。
3、使用r語言中的lm()函式求解
指標1:pr(>|t|) 表示p– 值,即概率值。***說明極為顯著, **說明高度顯著, *說明顯著, .說明不太顯著,沒有記號為不顯著。
指標2:r-squared: 0.9481 的值越大越好,至少應該在0.8以上。
4、繪製圖形
5、作出**
> z=data.frame(x=0.24)**結果為:> predict(lm.sol, z)
159.89318
《R語言遊戲資料分析與挖掘》新書推薦
歡迎關注天善智慧型hellobi.com,我們是專注於商業智慧型bi,大資料,資料分析領域的垂直社群,學習 問答 求職,一站式搞定!r語言遊戲資料分析與挖掘 新書上市已經有乙個多月,各大 均有銷售。這是一部從大資料技術和遊戲業務雙重維度講解如何利用結果資料指導商業決策的實戰性著作,樂逗遊戲高階資料分...
資料分析與R語言01
prod 就是連乘,例如 x c 1 5 則prod x 1 2 3 4 5 120 seq 產生向量,例如 seq 5,20 seq 5,121,by 2 步長為2 seq 5,121,length 10 diag 矩陣的對角線,例如 diag 10,3,4 返回三行四列,且對角線是10 1 2 ...
R語言 資料分析
二 大資料分析 三 資料分析常用工具 資料分析是指用適當的統計方法對收集來的大量第一手資料和第二手資料進行分析,以求最大化地開發資料資料的功能,發揮資料的作用。資料分析是為了驗證假設的問題,需要提供必要的資料驗證。分析模型構建完成後,需要利用測試資料驗證模型的正確性。資料分析是為了挖掘更多的問題,並...