R語言對爬取的天氣資料進行整理

2021-08-04 08:29:59 字數 1130 閱讀 2569

1.批量輸出每個省的每個月份出現頻次最多的天氣情況;

2.批量輸出每個省每個月的氣溫狀況(包括對類似5℃/10℃資料的處理)。

**:

###########################天氣情況彙總###############################

> rm(list=ls(all=true))

> gc()

> library(readxl)

> library(lubridate)

> library(data.table)

> library(sqldf)

> pro_capital <- read_excel("省份及省會.xlsx")

> for(i in

1:34)

>

###########################氣溫情況彙總#################################

> rm(list=ls(all=true))

> gc()

> library(readxl)

> library(lubridate)

> library(data.table)

> library(stringr)

> pro_capital <- read_excel("省份及省會.xlsx")

> for(i in

1:34)

data0 <- cbind(data0,month=months(data0$日期),temperature=temperature)

data0 <- as.data.table(data0)

data0$temperature <- as.numeric(data0$temperature)

bydata <- data0[,.(temperature=round(mean(temperature))),by='month']

bydata$temperature <- paste0(bydata$temperature,"℃")

write.csv(bydata,paste0('d:\\working directory\\氣溫結果\\',pro_capital[i,1],'.csv'))

}>

python爬取歷史天氣資料

import requests from requests.exceptions import requestexception from bs4 import beautifulsoup import os import csv import time def get one page url 獲...

天氣資料爬取及分析

而每月的資料,以2020年1月為例,鏈結為 採用requests,beautifulsoup兩個工具。遍歷12個月份的鏈結,為了防止被遮蔽,每次請求前暫停3秒。誰知,可能有個簡單的反爬機制,通過偽造乙個資料報的user agent資訊,偽裝成瀏覽器請求成功。爬取後,儲存在json格式的檔案,如下為檔...

Python爬取中國天氣網天氣資料

由於一些需要,想要獲取今天的天氣資料,於是又撿起了python寫了個爬蟲用來獲取中國天氣網上的氣象資料。由於我需要的資料比較簡單,因為我只需要北京地區當天的溫度 最低溫度和最高溫度 和天氣,因此 部分比較簡單,下面就來講講這個爬取的過程。第一步 網頁分析 要進行爬蟲設計,首先得分析網頁的請求過程。首...