一、基本資料結構
建立向量和矩陣函式c()、length()、mode()、rbind()、cbind()
mode(x) 檢視這個是什麼型別的;length() 檢視這個向量的長度;
rbind(x1,x2) 兩個向量合成乙個矩陣
cbind(x1,x2) 兩個向量豎著合成乙個矩陣
常用統計函式;
mean()、sum()、min()、max()、var()、sd()、prod()
mean(x) 平均值
sum() 求和
min() 求最小值
max() 最大值
var() 求方差 (反應資料離散的情況)
sd() 標準差
prod() 連乘
注意:
物件的型別:
數值型 numeric 例如:100、200
字元型 character 例如:"china"
邏輯型 logical 例如:true、false
因子型 factor 表示不同類別
複數型 complex 例如2+3i
在賦值的時候後面加l 就是變成整數型別
class() 檢視資料型別
c1 & c2 是它們的交集運算 (「與」),c1 | c2 是並集運算 (「或」),!c1 是 c1 的非運算
向量寫法:
等差數列賦值函式:
seq()函式 seq(from=,to=,by=,length.out=)
引數「by」表示等差,引數「length.out」表示等差數列元素的個數
重複函式rep
rep(x,times=,each=,length.out=)
times引數表示x的重複次數,引數「each」表示每個元素重複的次數,length.out表示擷取前多少個元素
1.判斷是否為數值型向量
is.numeric(x)
其他向量轉換為數值型向量: as.numeric()
同樣判斷是否為字元、邏輯的函式: is.character()、is.logical()
轉化為字元、邏輯的函式: as.character()、as.logical()
2.增加乙個元素為6.
x[6]
3.接上,刪除向量中的缺失值。
x[is.na(x)=f] b
函式 is.na() 判斷是否為缺失值。 「x[is.na(x)=f]」表示索引出x中不是缺失值的元素。「length(x[is.na(x)])」返回x中缺失值的個數。
4.刪除最後乙個元素
x 很簡單,不解釋了,應該可以看懂的
5.更改某個元素,如第三個元素改為8
x[3]
字串向量:
letters常數
which()函式 輸出位置
rev()函式、sort()函式 倒敘;正序
matrix()函式 向量變換為矩陣
t()「矩陣轉置」、矩陣加減
矩陣相乘、函式diag() 求對角線
矩陣求逆、函式rnorm() "正態分佈隨機數"、 solve() 「求逆矩陣」
求矩陣的特徵值與特徵向量
函式eigen()
陣列:
dim(x)
矩陣是陣列的乙個特殊情況
資料框:data.frame(x1,x2) x1與x2長度必須相等
plot(x) 畫圖
外表r檔案讀取 :
> (x=read.table("abc.txt"))
>read.csv() 可以讀取csv的檔案
也可以直接將文字或exceld的資料通過剪下板讀取
header=f代表不讀取頭
python資料分析基礎1
filter 函式用於過濾序列,過濾掉不符合條件的元素,返回由符合條件元素組成的新列表 接收兩個引數,第乙個為函式,第二個為序列,序列的每個元素作為引數傳遞給函式進行判斷,返回true或false,將返回true的元素放到新列表中。def ou n if n 2 0 return true else...
R與資料分析
r的基本賦值操作 x c 1 100 把1.100個整數向量賦值到x sample x,20 從100個數中隨機不放回地抽取20個值作為樣本 x 1 10 提取1 10號數字 y c 1,3,7,3,4,2 x y 以y為下標的z的元素值 xz setdiff x,z 找出兩個變數中的差異變數 so...
R語言 資料分析
二 大資料分析 三 資料分析常用工具 資料分析是指用適當的統計方法對收集來的大量第一手資料和第二手資料進行分析,以求最大化地開發資料資料的功能,發揮資料的作用。資料分析是為了驗證假設的問題,需要提供必要的資料驗證。分析模型構建完成後,需要利用測試資料驗證模型的正確性。資料分析是為了挖掘更多的問題,並...