各国家新冠病毒序列采集数目及时间

2019nCoVR数据

rm(list=ls())
f<-read.xlsx("Released 2019-nCoV Genome Sequences.xlsx",1, encoding = "UTF-8")
table(f$序列完整度)
f_complete<-f[f$序列完整度=="Complete",]
f_complete$nation<-unlist(lapply(f_complete$采样地点,function(x) gsub(" ","",stringr::str_split(x,"/",simplify = TRUE)[,1])))
nation<-unique(f_complete$nation)
a<-f_complete[,c('采样日期','nation')]
b<-plyr::ddply(a,.(采样日期,nation),nrow)
c<-reshape2::melt(b)
group=factor((c$nation))
ggplot2::ggplot(c,aes(采样日期,nation))+geom_point(aes(colour=group,size=value*10))+theme_bw()+theme(legend.position = "none",axis.text.x = element_text(angle = 45,hjust = 1),axis.text.y = element_text(size = 14))
大小表示数目
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容