用R語言進行資料分析

2021-07-15 18:11:40 字數 3349 閱讀 9161

用美國**台網公布的全球2023年5月20日22點到24點發生的所有**的震級資料實驗。

> mag

> mag

[1] 1.6 0.9 2.1 2.2 2.3 1.7 1.3 1.6 4.7 1.2 0.9 4.7 0.6 5.3 1.1 4.8 4.0 4.2 4.6 1.3 2.1 1.5 3.0

> factor(cut(mag,5))#建立因子

[1] (1.54,2.48] (0.595,1.54] (1.54,2.48] (1.54,2.48] (1.54,2.48] (1.54,2.48] (0.595,1.54]

[8] (1.54,2.48] (4.36,5.3] (0.595,1.54] (0.595,1.54] (4.36,5.3] (0.595,1.54] (4.36,5.3]

[15] (0.595,1.54] (4.36,5.3] (3.42,4.36] (3.42,4.36] (4.36,5.3] (0.595,1.54] (1.54,2.48]

[22] (0.595,1.54] (2.48,3.42]

levels: (0.595,1.54] (1.54,2.48] (2.48,3.42] (3.42,4.36] (4.36,5.3]

> factor(cut(mag,5))->magfactor#統計因子頻率

> table(magfactor)

magfactor

(0.595,1.54] (1.54,2.48] (2.48,3.42] (3.42,4.36] (4.36,5.3]

87125

#繪製直方圖

下面讀取**檔案進行分析:

> read.table("f:/machine learning/r basic/eqweek.csv",header = true,sep = ",")->earthquake

datetime latitude longitude depth magnitude magtype nbstations

12013-05-20t23:57:12.000+00:00

63.450 -148.291

5.51.6 ml na

22013-05-20t23:52:59.000+00:00

61.337 -152.069

81.4

2.1 ml na

32013-05-20t23:49:15.100+00:00

19.990 -155.426

38.2

2.2 md na

42013-05-20t23:46:36.000+00:00

60.498 -142.974

4.22.3 ml na

52013-05-20t23:44:07.000+00:00

64.997 -147.444

na1.7 ml na

...#畫出直方圖分析

> hist(earthquake$magnitude,5)

要精確分析頻率大小需要進行因子頻率分析:

> table(factor(cut(earthquake$magnitude,5)))

(0.995,2.1] (2.1,3.2] (3.2,4.3] (4.3,5.4] (5.4,6.51]

720 178 41 126 10

下面分析一下**深度:

> attach(earthquake)

> summary(depth)

min. 1st qu. median mean 3rd qu. max. na's

0.10 5.80 12.15 30.82 38.00 630.70 39

作出magnitude和depth的散點圖分析一下:

> plot(depth,magnitude,main = "magnitude和depth的關係")

好像並沒有什麼關係,只能說當depth大於了300後magnitude在5左右,而當depth小於300時,magnitude取值不確定。

下面繪製一下有資料點的震級直方圖:

用五分位數法分析下magnitude和depth

> fivenum(magnitude)

[1] 1.0 1.3 1.7 2.5 6.5

> fivenum(depth)

[1] 0.10 5.80 12.15 38.00 630.70

學過統計學就知道,累積分布函式描述了隨機變數x的概率分布,r語言通過ecdf函式計算累積分布:

繪製一下核密度直方圖(hist()函式指定引數prob = true)和核密度曲線(用density進行核密度估計)

R語言進行資料探勘 回歸分析

1 線性回歸 線性回歸就是使用下面的 函式 未來觀測量 其中,x1,x2,xk都是 變數 影響 的因素 y是需要 的目標變數 被 變數 線性回歸模型的資料 於澳大利亞的cpi資料,選取的是2008年到2011年的季度資料。year quarter cpi cor year,cpi cor quart...

pandas進行資料分析

最近參加了一次apmcm,題目給出了很多 我們需要對資料進行分析。顯然,作為一名會python的大學生,肯定不會直接在 上進行各種變動,本文就如何使用pandas對excel 進行資料分析做一些介紹。3.1 讀取所有表中的職業 讀取所有表中的職業 pros.xlsx中有所有職業 pros path ...

sklearn進行資料分析

呼叫線性回歸函式 from sklearn.linear model import linearregression 匯入資料集 這裡將全部資料用於訓練,並沒有對資料進行劃分,上例中 將資料劃分為訓練和測試資料,後面會講到交叉驗證 loaded data datasets.load boston d...