R 檔案常用讀取及儲存方式

2021-09-11 06:47:30 字數 2947 閱讀 5105

讀取csv檔案:

data <- read.csv("input.csv") #如果第一行是表頭的話,可以header=t

檢查:print(is.data.frame(data))

print(ncol(data))

print(nrow(data))

篩選:ret <- subset(data,salary>3000 & dept =="it")

print(ret)

讀取excel檔案:

install.packages("xlsx")

data <- read.xlsx("input.xlsx",sheetindex = 1)

#sheetindex:在工作簿中表示的表索引的數字 亂碼加encoding=utf-8

讀取json檔案:

install.packages("rjson")

data <- fromjson(file = "input.json")

#轉換為資料幀

json_data_frame <- as.data.frame(data)

讀取xml檔案

install.packages("xml")

data <- xmlparse(file = "input.xml")

web資料:

install.packages("rcurl")

install.packages("xml")

install.packages("stringr")

install.packages("plyr")

url <- ""

links <- gethtmllinks(url)

filenames <- links[str_detect(links, "jcmb_2015")]

filenames_list <- as.list(filenames)

downloadcsv <- function (mainurl,filename)

l_ply(filenames,downloadcsv,mainurl = "")

讀取txt檔案:

data<- read.table('input.txt',header = f,sep = ' ')

#sep:分隔符

資料庫(mysql) :

install.packages("rmysql")

mysqlconnection =dbconnect(mysql(), user = 'root', password = 'abcd123456', dbname =

'testdb', host = 'localhost')

匯出為csv檔案:

write.csv(data,file = 「mydata.csv」,row.names = f)

匯出為txt檔案:

write.table(data,file=「mydata.txt」 , sep =" ", row.names =false,col.names =true, quote =false)

#row.names指定是否輸出行號,col.names指定是否輸出列名,quote指定是否用引號將變數包括。

匯出為xlsx檔案:

write.xlsx(exceldata,file = 「mydata.xlsx」,row.names = true)

向量圖與點陣圖的區別

①解析度

指乙個影象檔案中包含的細節和資訊的大小,以及輸入、輸出、或顯示裝置能夠產生的細節程度。操作點陣圖時,解析度既會影響最後輸出的質量也會影響檔案的大小。處理點陣圖需三思而行,因為給影象選擇的解析度通常在整個過程中都伴隨著檔案。檔案總是以建立影象時所設的解析度大小印刷,除非印表機的解析度低於影象的解析度。如果希望最終輸出看起來和螢幕上顯示的一樣,就需要了解影象的解析度和不同裝置解析度之間的關係,而向量圖影象的解析度不依賴於輸出裝置。

②組成點陣圖的組成是畫素;向量圖的組成是數學向量。

③圖形質量

點陣圖的縮放和旋轉容易失真,檔案容量較大;向量**件容量較小,在進行放大、縮小或旋轉等操作時圖象不會失真。

④繪製圖形複雜度

位圖只要有足夠多的不同色彩的畫素,就可以逼真地表現自然界的景象;向量圖不易製作色彩變化太多的圖象。

⑤常用格式

位圖一般是png, jpeg,tiff, tif,bmp,jpg的檔案格式;向量圖一般是:eps,ps,pdf,wmf, emf,svg

視覺化儲存:

儲存為pdf檔案:

pdf(「output.pdf」)

plot(wt, mpg)

dev.off()

儲存為wmf檔案:

win.metafile(「output.wmf」) (僅windows系統)

plot(wt, mpg)

dev.off()

儲存為png檔案:

png(「output.png」)

plot(wt, mpg)

dev.off()

儲存為jpeg檔案:

儲存為bmp檔案:

bmp(「output.bmp」)

plot(wt, mpg)

dev.off()

儲存為ps檔案:

postscript(「output.ps」)

plot(wt, mpg)

dev.off()

R語言讀取檔案

本文的主要內容是讀取檔案內容,並且將檔案中的所有內容沒咧放在乙個物件當中,以便之後進行操作,樣本資料如下 kernel coorauthor num 鄭稱德 丁俊武 1 鄭稱德 韓玉啟 2 鄭稱德 周梅 3 丁俊武 韓玉啟 4 丁俊武 鄭稱德 4 丁俊武 周梅 4 丁俊武 仇成 43 丁俊武 馮俊文...

R讀取excel檔案

一 使用軟體包xlsreadwrite library xlsreadwrite data read.xls choose.files d r rscript mydm wang2.xls 二 使用軟體包xlconnect library xlconnectjars library xlconnec...

批量讀取 R 批量讀取檔案

檔案讀取 1 同一目錄下,多個同一型別,檔名連續的檔案資料讀取 設定工作目錄 setwd d r project 設定乙個空白的資料框 data 我的檔案是 001.csv 002.csv 003.csv 思維方式是用乙個id的向量,從1數到100,然後和 csv 拼接起來,組成檔名,函式可以用pa...