1. json檔案:
library(jsonlite)
file <- "/users/abcd/documents/diff_files/json/test.json"
json1 <- read_json(path = file)
write_json(json1, path = file)
2. yaml檔案:
library(yaml)
file <- "/users/abcd/documents/diff_files/yaml/test.yaml"
write_yaml(data.frame(a = 1:10, b = letters[1:10], c= 11:20), path = file)
read_yaml(file = file)
3. csv檔案:
path1 <- "/users/abcd/documents/diff_files/csv/test5.txt"
write.table(file = path1,
x = data.frame(id = 1:(26e4), name = rep(letters, times = 1e4)),
subset1 <- read.table(file = path1, sep = "\t", header = true)
# 讀取全部資料
subset2 <- read.table(file = path1, sep = "\t",
skip = 15, header = false)
# 從第16行開始讀取
subset3 <- read.table(file = path1, sep = "\t",
skip = 15, nrow = 26, header = false)
# 從第16行開始讀取,讀取26行
subset4 <- read.table(file = path1, sep = "\t",
skip = 16, nrows = 26,
colclasses = c("integer", "character"))
# 從第16行開始讀取,讀取26行,指定每列的型別,提高讀取速度
4. 使用readlines控制讀取行數:
path1 <- "/users/abcd/documents/diff_files/csv/test5.txt"
con1 <- file(description = path1, open = "r")
data1 <- readlines(con = con1, n = 1e5)
close(con1)
length(data1)
5. excel檔案讀寫:
library(readxl)
library(writexl)
path1 <- "/users/abcd/documents/diff_files/xlsx/test6.xlsx"
write_xlsx(path = path1,
x = data.frame(id = 1:26e4,
names = rep(letters, times = 1e4)),
col_names = true)
#讀取前1000行資料
test6_data1 <- read_xlsx(path = path1,
sheet = 1,
n_max = 1000)
#讀取a1到b53的資料
test6_data2 <- read_xlsx(path = path1, sheet = 1,
range = c("a1:b53"))
head(test6_data2)
tail(test6_data2)
R語言讀寫中文編碼方式
r語言讀寫資料的方法很多,這裡主要是我在使用read.csv read.table和write.csv write.table時遇到的一些中文格式編碼的問題。常見的中文編碼方式兩種 gbk gb2312 和utf 8。windows系統下 read.csv 和read.table 方法不指定檔案格式...
R 語言中對檔案的操作
由於最近在處理一些真實資料時涉及到巢狀的.tar.gz檔案的解壓,手動乙個乙個解壓過於麻煩。可以使用 shell 指令碼或者 bat 指令碼來做,但想嘗試使用 r 語言對其進行完全解壓,這裡就需要涉及到對檔案與資料夾的一些操作。網上已經有許多現有教程,這裡參考了很多網上的 不過會嘗試盡量寫得更加詳細...
R語言資料檔案的讀寫
1.鍵盤輸入資料 mydata data.frame age numeric 0 gender character 0 weight numeric 0 mydata edit mydata 在物件的副本上進行操作要保留改動需賦值 mydata fix mydata 會自動保留改動 2.txt檔案 ...