將一張excel表的資料按照第一列元素分組,分組後按照某種規則命名,並重新讀入excel中,放入指定的資料夾中。
如上所示的excel表,將sheet1中的資料按照「地域名稱」拆分,並將資料放入相應的省份資料夾,如放入d盤的test資料夾中
d:\mydata\test
|__test
|___mydata.xlsx
|___安徽省
|___安徽省安慶市.xlsx
|___安徽省蚌埠市.xlsx
|___河北省
|__河北省蚌埠市.xlsx
|___……
假如資料最終的資料夾目錄如上所示。**可以作如下編寫:
library(readxl) # 載入readxl包,使用read_excel讀入excel檔案
library(xlsx) # 載入xlsx包,使用write.xlsx儲存檔案為excel格式
# setwd()設定路徑為d:\\mydata\\test'
setwd('d:\\mydata\\test')
# 1表示讀入第一張sheet,2表示讀入第二張sheet,也可用sheet = "sheetname",預設第一行為標題行
dt = read_excel('mydata.xlsx', 2)
# unique() 過濾重複資料,保留唯一資料
# 此處過濾掉第2列和第3列的重複行,最終只剩下3行不重複資料,預設不含標題
province_city
setwd('d:\\mydata\\test') # 設定當前路徑為省份資料夾放置的目錄
cdir
# 迴圈次數 n=province_city 的行數
for (i in c(1:nrow(province_city [,1])))else
# 設定檔名稱,即安徽省安慶市.xlsx
c_dir = paste('d:\\mydata\\test\\',province_city[i,2],sep = "")
# 設定c_dir為當前路徑
setwd(c_dir)
# write.xlsx 將所需的檔案列儲存到上述設定的檔案中,col.names=true包含標題
write.xlsx(dt1[,2:5],cfilename,col.names=true,showna=false)
# 設定路徑為cdir,進入到下一次迴圈
setwd(cdir)
}
scrapy爬取資料並儲存到文字
1.scrapy專案結構如下 2.開啟spidler目錄下的duba.py檔案,如下 這個是根據豆瓣一部分頁面獲取的熱門話題內容,有6條資料 coding utf 8 import scrapy from scrapydemo.items import scrapydemoitem from lxm...
php讀取csv資料儲存到陣列的方法
csv是常用的excel格式的替代品,很多時候我們匯出資料是都會導成csv格式的,這樣和excel沒什麼區別,下面的程式是要讀取csv資料儲存到陣列我們要對資料進行操作,所以儲存到資料,如下 複製 如下 info csvtoarray open teste.csv echo print r info...
Python爬取網路資料,並儲存到資料庫
import pymysql from bs4 import beautifulsoup from selenium import webdriver 這是防止頻繁請求網頁而被斷開連線 driver webdriver.phantomjs 這是煎蛋網的 那個page煎蛋網上是不固定的,所以,隨便取就...