R與資料分析

2021-09-25 14:02:09 字數 2227 閱讀 1842

r的基本賦值操作:

x <- c(1:100) #把1...100個整數向量賦值到x

sample(x,20) #從100個數中隨機不放回地抽取20個值作為樣本

x[1:10] #提取1-10號數字

y=c(1,3,7,3,4,2)

x[y] #以y為下標的z的元素值

xz = setdiff(x,z) #找出兩個變數中的差異變數

sort(union(xz,z)) #將xz和z的並集元素從小到大排序

intersect(1:10,7:50) #兩組資料的交集

在抽樣中,可以設定種子。代表的是:此後產生的隨機數序列固定,通常的使用中可能會取大量的隨機數,而一次set.seed就可以保證整段**的可重複性。不過此步驟可以使用變數賦值實現。

set.seed(0);sample(1:100,3)

#設定隨機種子再抽樣,從1-100的整數中隨機抽取3個數,且保證每次得到的三個數都是一樣的

r語言安裝安裝包與讀取資料的基本操作:
install.packages("mass")

library(mass)

#安裝mass包,library表示載入安裝包,library和require都可以載入包,但二者存在區別。

#在乙個函式中,如果乙個包不存在,執行到library將會停止執行,require則會繼續執行。

setwd("c:/users/ym-s/desktop")

mydata <- read.csv("intersectionaccident.csv")#雙引號中為檔名,如果是excel檔案,字尾名為.csv

attach (mydata)

#讀取檔案中資料,記得複製貼上路徑後要更改斜槓方向

資料的提取
x=sample (1:100,12) #在1-100的數中隨機抽取12個數
關於特殊數值π的相關計算說明
pi *10^2#pi是圓周率

pi ^(1:6)#指數表示同樣可以

pi *(1:10)^-2.3#對向量求指數冪

print(pi,digits=12)#共輸出π12位數字

資料的基礎屬性與簡單樣本描述統計量求解

floor():向下取整;

ceiling(): 向上取整;

round(): 四捨五入取整;

turnc(): 向0取整;

x <- round(runif(20,0,20),digits = 2)

#運用runif()函式用於生成從0到1區間範圍內的服從正態分佈的隨機數,每次生成的值都不一樣

#digits即是指定位數,並按照此位數進行四捨五入

基礎統計量的求解

min(x)

max(x) #變數x的極值

range(x) #求資料的邊界值,即是最大、最小值

median(x) #中位數

sum(x) #最大值

mean(x) #均值

vvar(x) #方差

sd(x) #標準差

sqrt(var(x)) #平方根

rank(x) #秩(rank)

order(x) #公升冪排列的x的下標

x[-c(1,3)] #去掉第乙個、第三個元素

矩陣的構造
x=matrix(1:20,4,5) #構造乙個4*5的矩陣①,數字從小到大按列依次排列

x=matrix(1:20,4,5,byrow=t)

#構造乙個4*5的矩陣②(為矩陣①的轉置),數字從小到大按行依次排列

t(x) #矩陣的**轉置**

z=matrix(sample(1:100,20),4,5)

#在1-100的資料中隨機抽取20個資料構造成乙個矩陣

x[c(2,1),] #提取矩陣x的第二行與第一行的所有資料,列提取同理

x[2,1] #提取第(2,1)位置的元素

diag(1:5) #以數字1-5為對角線,其他元素為0的**對角線矩陣**

x[lower.tri(x)]=0 #得到上三角陣

x[upper.tri(x)]=0 #得到下三角陣

矩陣的計算
x1=solve(x) #相當於解ax=b的方程解值,此時矩陣z必須是方陣

diff(x) #差分

diff(x,lag=2) #二階差分

資料分析與R語言01

prod 就是連乘,例如 x c 1 5 則prod x 1 2 3 4 5 120 seq 產生向量,例如 seq 5,20 seq 5,121,by 2 步長為2 seq 5,121,length 10 diag 矩陣的對角線,例如 diag 10,3,4 返回三行四列,且對角線是10 1 2 ...

R語言 資料分析

二 大資料分析 三 資料分析常用工具 資料分析是指用適當的統計方法對收集來的大量第一手資料和第二手資料進行分析,以求最大化地開發資料資料的功能,發揮資料的作用。資料分析是為了驗證假設的問題,需要提供必要的資料驗證。分析模型構建完成後,需要利用測試資料驗證模型的正確性。資料分析是為了挖掘更多的問題,並...

R資料分析 陣列,列表

建立陣列 test1 matrix sample 90 100,6,replace f nrow 2 test1 test2 matrix sample 90 100,6,replace f nrow 2 test2 test array data c test1,test2 dim c 2,3,2...