数据来源
国家统计局网站公布 的 第七次全国人口普查主要数据情况,链接是
http://www.stats.gov.cn/tjsj/zxfb/202105/t20210510_1817176.html
首先是加载需要用到的包
library(ggplot2)
library(extrafont)
library(Cairo)
fonts()
首先是人口总量以及和2010年数据的对比
选用柱形图展示,单位是 万
代码
df1<-data.frame(
year = factor(c(2020,2010)),
population = c(141178,133972)
)
options(scipen=200) #取消科学计数法
p1<-ggplot(data=df1,aes(x=year,y=population))+
geom_col(aes(fill=year))+
scale_y_continuous(expand = c(0,0),
limits = c(0,145000),
breaks = c(0,20000,40000,60000,80000,
100000,120000,140000))+
geom_label(aes(label=population))+
theme_bw()+
theme(panel.grid = element_blank())+
labs(x=NULL,y="总人口 (万)")+
scale_fill_manual(values = c("yellowgreen", "violetred1"))
ggsave(filename = "p1.pdf",
p1,
width = 4,
height = 4,
device = cairo_pdf,
family="STKaiti")
结果图

image.png
第二个是户别人口,分家庭户口和集体户口,这个是啥意思暂时没有看明白
第三个是人口地区分布
采用饼状图来展示

image.png
代码
library(scatterpie)
df2<-data.frame(
x=1,y=1,A=39.93,B=25.83,C=27.12,D=6.98
)
p2<-ggplot()+
geom_scatterpie(data=df2,aes(x=x,y=y,r=1),
cols = LETTERS[1:4])+
coord_equal()+
theme_void()+
theme(legend.position = "top")+
annotate(geom="text",x=1.5,y=1.2,label="39.93%")+
annotate(geom="text",x=1.2,y=0.5,label="25.83%")+
annotate(geom="text",x=0.5,y=0.6,label="27.12%")+
annotate(geom="text",x=0.5,y=1.5,label="6.98%")+
scale_fill_discrete(labels=c("东部地区","中部地区",
"西部地区","东北地区"),
name="")
ggsave(filename = "p2.pdf",
p2,
width = 4,
height = 4,
device = cairo_pdf,
family="STKaiti")
最后制作文章封面图

image.png
代码
library(patchwork)
p1+p2
ggsave(filename = "p3.pdf",
p1+p2,
width = 8,
height = 4,
device = cairo_pdf,
family="STKaiti")
欢迎大家关注我的公众号
小明的数据分析笔记本
小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!