r語言學習日記(一)2023年3月30日
一、建立資料框
#讀入txt、csv等格式資料,自動生成資料框,資料編碼為utf-8
movie=read.csv("./電影資料.csv",fileencoding="utf-8",stringsasfactors=f)
#檢視movie的資料型別
class(movie)
二、自己手動建立資料框
> star1 = c("鄧超", "趙麗穎", "郭富城", "周潤發", "傑克布萊克", "湯唯", "白敬亭", "陳曉", "梁家輝", "姚晨", "宋茜", "黃宗澤", "黃曉明")
> birthyear = c(1979, 1987, 1965, 1955, 1969, 1979, 1993, 1987, 1958, 1979, 1987, 1980, 1977)
> gender = c("男", "女", "男", "男", "男", "女", "男", "男", "男", "女", "女", "男", "男")
> stars = data.frame(star1, birthyear, gender)
> head(stars)
star1 birthyear gender
1 鄧超 1979 男
2 趙麗穎 1987 女
3 郭富城 1965 男
4 周潤發 1955 男
5 傑克布萊克 1969 男
6 湯唯 1979 女
三、檢視彙總的資料
str(movie)
summary(movie)
四、資料框的整列以及合併
#增添一列資料prefer
prefer = 1:19
movie$pre = prefer
head(movie)
merge函式將movie資料框與stars資料框按star1進行合併,movie[1:3, ]將資料框的前兩行進行合併
(movie.star = merge(movie[1:3, ], stars,by = "star1"))
五、資料框的檢視和篩選
#檢視第三行的資料
movie[3, ]
#檢視第八列的資料
movie[, 8]
#用$符號通過列名篩選
movie$star1
#選擇資料中的動作影片
(action = movie[movie$type == "動作", ])
#篩選放映時間超過100分鐘的動作影片
(action_long = movie[movie$type == "動作" & movie$duration > 100, ])
六、資料框的內部資料排列
#按票房進行排列order()函式,decreasing = t降序排列,decreasing = f公升序排列
movie = movie[order(movie$boxoffice, decreasing = t), ]
#先按電影型別排列,再按豆瓣評分排列
movie = movie[order(movie$type, movie$doubanscore, decreasing = t), ]
R語言資料框
資料框的建立 通過data.frame函式來建立資料框,該函式包含的主要引數為 data.frame row.names null,check.rows false,check.names true,stringsasfactors default.stringsasfactors 建立乙個資料框 ...
r語言 向量轉換為資料框 R語言 資料框
資料框 概念 在r語言中,資料框 dataframe 組織資料的結構與矩陣相似,但是其各列的資料型別可以不相同。一般情況,資料框的每列是乙個變數,每行是乙個觀測樣本。雖然,資料框內不同的列可以是不同的資料模式,但是資料框內每列的長度必須相同。資料框的建立 01 基本概念 在r語言中,資料框使用dat...
R語言 4 資料框
1 綜述 資料框可以模擬matrix,資料框可以理解為每列的mode不同的matrix 這一點很像list和向量的關係 list是mode可以不同的向量。同時,資料框也可以和list類別,資料框的元件間的mode可以不同,list也是,但是資料框不同組建的長度必須相同,而list可以不同。因此就技術...