本文的主要內容是讀取檔案內容,並且將檔案中的所有內容沒咧放在乙個物件當中,以便之後進行操作,樣本資料如下
kernel coorauthor num
鄭稱德 丁俊武 1
鄭稱德 韓玉啟 2
鄭稱德 周梅 3
丁俊武 韓玉啟 4
丁俊武 鄭稱德 4
丁俊武 周梅 4
丁俊武 仇成 43
丁俊武 馮俊文 1
丁俊武 高常青 321
韓玉啟 丁俊武 312
韓玉啟 鄭稱德 21
韓玉啟 周梅 42
張瑞紅 檀潤華 21
張瑞紅 劉芳 21
張瑞紅 楊伯軍 213
張瑞紅 江屏 12
張瑞紅 苑彩雲 21
張瑞紅 曹東興 21
張瑞紅 馬建紅 21
張瑞紅 張換高 12
張瑞紅 曹國忠 21
張瑞紅 李樹洋 32
kernel<-0 #將檔案中的第一列的資料放在kernel物件當中
coorauthor<-0 #將檔案中的第二列資料放在coorauthor物件當中
num<-0 #將檔案中的第三列資料放在num當中
count<-0 #記錄當前讀到第count行了,同時也是以上三物件的索引值
count[1]<-0
input<-file("e:\\sample.txt","r")
line=readlines(input,n=1)
line=readlines(input,n=1) #由於第一行不是資料,所以直接跳過第一行
while(length(line)!=0)
close(input)
var_1<-0
tmp_1=setdiff(kernel,var_1)#setdiff是求得kernel集合和var_1集合當中的差集,也就是kernel當中非重複元素,然後放在tmp_1當中,其中kernel和var_1的順序無關
var_2<-0
tmp_2=setdiff(coorauthor, var_2)
var_1_len=length(tmp_1)#第乙個作者的數量
var_2_len=length(tmp_2)#第二個作者的數量
var_sum<-0#目標陣列清空
for(i in 1:var_1_len)
from=var_1_len+1#記錄下所有的var_sum陣列中下乙個元素的位置,由此開始記錄
to=var_1_len+var_2_len
for(i in from:to)
var_sum[i]=tmp_2[i-var_1_len]
var_sum=setdiff(var_sum,var_1)#到此獲得了所有的作者姓名並且無重複
R語言讀取 xlsx 和xls 檔案
前言 今天我用openxlsx包中的read.xlsx讀取xls檔案時,竟然報錯了。我記得有乙個包是可以讀取excel2003的,搜尋了一下,發現不太容易查詢,就寫一遍部落格記錄一下。畢竟,很多東西放到網上,一搜尋看到自己寫的東西,那種爆棚的感覺,好像網際網路成了我的筆記本,666 所以對自己有幫助...
R讀取excel檔案
一 使用軟體包xlsreadwrite library xlsreadwrite data read.xls choose.files d r rscript mydm wang2.xls 二 使用軟體包xlconnect library xlconnectjars library xlconnec...
批量讀取 R 批量讀取檔案
檔案讀取 1 同一目錄下,多個同一型別,檔名連續的檔案資料讀取 設定工作目錄 setwd d r project 設定乙個空白的資料框 data 我的檔案是 001.csv 002.csv 003.csv 思維方式是用乙個id的向量,從1數到100,然後和 csv 拼接起來,組成檔名,函式可以用pa...