R語言對COVID19分析作業

2021-10-07 04:56:40 字數 3514 閱讀 9192

#a.資料獲取與基本統計分析

#安裝並引入covid19包

##install.packages(「covid19」)

library(covid19)

#提取截止至2023年5月31號資料

library(dplyr)

library(lubridate)

rawdata <- data.frame(covid19())

df <- filter(rawdata,month(date)<6)

df <- filter(df,confirmed>1000)

#對國家分組求出確診人數最大值

group<- df %>% group_by(id)

rank_country <- summarise(group,

max_confirmed=max(confirmed)

)#按照確診人數進行排序,rank_country為i的output

rank_country <- arrange(rank_country,desc(max_confirmed))

#計算各個國家的日新增

new <- mutate(rawdata,

lag_1=dplyr::lag(confirmed)

)new <- mutate(new,

diff_1=confirmed-lag_1)

new <- filter(new,month(date)<6)

new <- filter(new,confirmed>1000)

new <- mutate(new,

day_after=rank(date)

)new<- new %>% group_by(id)

#計算各個國家最大日新增(max_diff)以及所對應的日期(max_date),max_increase為ii的output

max_increase <- summarise(new,

max_diff=max(diff_1,na.rm = false),

max_date=new[which.max(diff_1),「date」])

#選取有二級單位的國家

unique(rawdata$administrative_area_level_2) #資料集中並未包含二級單位地區

area_level2 <- new[!is.na(new$administrative_area_level_2),] #二級單位地區一列(administrative_area_level_2)為空

#即iiioutput 為空

#b.各國確診人數時間累計圖

library(ggplot2)

library(reshape2)

#提取確診超過3000的國家數量為78

df2 <- filter(rawdata,month(date)<6)

df2 <- filter(df,confirmed>3000)

country_over_3000 <- unique(df2$id)

length(country_over_?000)

#plot_data為國家為列名,day_after到達1000例後的天數,值為確診數。

plot_data <- select(new,id,confirmed,day_after)

plot_data <- dcast(plot_data,day_after~id,value.var = 「confirmed」)

b <- new[which(new$id %in% country_over_3000),]

#將國家作為因子進行畫???

a <- select(b,id,confirmed,day_after)

p <- ggplot(b, aes(x = day_after, y = confirmed , colour = factor(id)))

p + geom_line()

#從上圖可知usa確認人數過多,不方便檢視,現在剔除usa,畫出p2

c <- b[which(!(b$id %in% 「usa」)),]

p2 <- ggplot(c, aes(x = day_afte?, y = confirmed , colour = factor(id)))

p2 + geom_line()

###自主分析部分

#c.資料的圖形展示

#c-1對截止至2023年5月31日,對美國的確診,**,死亡人數進行繪圖泡p3

plot_data2 <- rawdata[which((rawdata$id %in% 「usa」)),][,c(2,4:6)]

plot_data2 <- melt(data=plot_?ata2,id.vars=「date」)

p3 <- ggplot(plot_data2,aes(x=date,y=value,colour=factor(variable)))

p3 + geom_line()+labs(tittle=「usa condition」,x=「time」,y=「amount」)

#p3展現了美國確診,**,死亡隨時間變化的增長趨勢,可以看出確診人數暫無下降勢頭,

#同時確診人數曲線,**人數曲線,說明由於醫療環境,人員配合等原因,**水平較低。

#c-2#c-1對截止至2023年5月31日,對南韓,日本,新加坡三個重點亞洲國際的確診,**,死亡人數進行繪圖對比p4

asian_3=c(「jpn」,「kor」,「sgp」)

plot_data3 <- summarise(group,

max_c?nfirmed=max(confirmed),

max_recover=max(recovered),

max_deaths=max(deaths)

)#var.test()方差檢驗,檢驗雙樣本方差,p值很小

var.test(tem$max_confirmed,tem$max_deaths)

#e.最近7日或7日以上新增確診為0,判定為疫情得到有效控制

tem2 <- mutate(rawdata,

lag_1=dplyr::lag(confirmed)

)tem2<- tem2 %>% group_by(id)

tem2 <- mutate(tem2,

diff_1=confirmed-lag_1,

? max_confirm= max(confirmed))

tem3 <- tem2[which(tem2$confirmed==tem2$max_confirm),]

#計算連續0增長天數,保留連續0增長天數大於等於7的國家

tem3<- tem3 %>% group_by(id)

country_list <- summarise(tem3,

count=n()

)country_list <- country_list[which(country_lis\t$count>=7),]

#回推計算0新增開始日期,得到country_list,列date為起始時間

country_list$date <- sys.date()-country_list$count

微軟必應上線COVID 19疫苗追蹤服務

早在今年 3 月,微軟旗下必應 bing 搜尋引擎就推出了基於網路上所有可用資料,而提供的一項全www.cppcns.com球新冠病毒追蹤器服務。只需在搜尋框中輸入 covid 19 新冠病毒 等關鍵詞,必應就會返回當地和全球範圍內已確診 死亡病例等資訊。來自 bing 現程式設計客棧在,微軟已將必...

在COVID 19危機期間IT優先順序如何變化

當今的it部門面臨許多挑戰 從支援遠端工作人員到管理網路和應用程式。高達95 的企業已改變了其技術重點,將更多的精力 88 用於改善數字客戶體驗。許多數字計畫致力於創造新的工作方式。在當前的大流行時代,這已變得越來越重要,因為工人不得不承擔更大的工作量。大多數it專業人員 81 表示,covid 1...

蘋果公司即將啟動員工COVID 19疫苗接種計畫

據彭博社報道,蘋果公司正在啟動一項計畫,為在蘋果總部辦公的員工提供covid 19疫苗接種。蘋果公司正在與沃爾格林布茨程式設計客棧聯盟合作提供這些疫苗,員工將能夠在蘋果公司即將推出的乙個網頁上報名。蘋果公司在3月份承諾為需要恢復接種疫苗的員工提供休息時間,但當時表示,暫時沒有辦法提供足夠的疫苗接種。...