这是GBD系列的第9篇推文,
今天后台有朋友反应不知道怎么做第一篇例文《The trends in incidence of primary liver cancer caused by specific etiologies: Results from the Global Burden of Disease Study 2016 and implications for liver cancer prevention》的图4。
我仔细琢磨了下这个图形,写了个适合于画这个图的代码,和大家分享交流下:
根据这个图的标题的意思,是要拿到这4种疾病的发病例数,然后得到这4种疾病的发病总例数后得到每个疾病的占所有疾病的百分比。
因此,图4作图的关键就是每个疾病的占所有疾病的百分比
根据这个思路,我们下载好GBD2019年五种肝癌(乙肝、丙肝、酒精肝、脂肪肝以及其他病因)的所有年份的发病例数。
下载好的数据格式需要有下面这部分的数据(其中一部分):
获得这个原始数据后我们就可以开始运算了
首先,设置路径,读取R包
我们首先获取2019年的5种肝癌的发病数
建立新的数据集用来存储5种肝癌占总肝癌例数的百分比
接下来我们需要构建循环语句来计算每一个地区的5种肝癌占总肝癌例数的百分比,并存储在新建立的数据集中。
我的思路是:建立2个循环,第一个循环是每循环一次,读取一个地区的5种肝癌发病数,并以此计算不同类型肝癌的发病占比,第二个循环是每循环一次,将一个地区的一个类型肝癌的发病占比赋值到LC_percent中,直至2个循环结束。我设置的代码大概是这样的,大家后期可以根据自己的疾病修改代码,并将其存储至LC_2019S数据集中
我们采用同样的方法计算1990年5种肝癌占总肝癌例数的百分比
最后合并好1990以及2019年的数据,并添加标签变量
针对合并好的数据框,将location以及cause设定变量的排列顺序
最后开始作图,采用ggplot2中的条形图进行绘图,用5种肝癌类型作为填充-fill,由于我们已经统计好各个分型的占比,因此stat采用“identity”,并将占比百分比作为说明映射到图形中即可。
最后就可以出来这个图形了~,当然了大家可以根据自己的配色来选择颜色搭配,然后在AI软件中调整图形即可。