疾病负担研究(GBD)——如何绘制疾病成分比

这是GBD系列的第9篇推文,

今天后台有朋友反应不知道怎么做第一篇例文《The trends in incidence of primary liver cancer caused by specific etiologies: Results from the Global Burden of Disease Study 2016 and implications for liver cancer prevention》的图4。


我仔细琢磨了下这个图形,写了个适合于画这个图的代码,和大家分享交流下:

根据这个图的标题的意思,是要拿到这4种疾病的发病例数,然后得到这4种疾病的发病总例数后得到每个疾病的占所有疾病的百分比。


因此,图4作图的关键就是每个疾病的占所有疾病的百分比


根据这个思路,我们下载好GBD2019年五种肝癌(乙肝、丙肝、酒精肝、脂肪肝以及其他病因)的所有年份的发病例数。


下载好的数据格式需要有下面这部分的数据(其中一部分):


获得这个原始数据后我们就可以开始运算了

首先,设置路径,读取R包


我们首先获取2019年的5种肝癌的发病数


建立新的数据集用来存储5种肝癌占总肝癌例数的百分比


接下来我们需要构建循环语句来计算每一个地区的5种肝癌占总肝癌例数的百分比,并存储在新建立的数据集中。

我的思路是:建立2个循环,第一个循环是每循环一次,读取一个地区的5种肝癌发病数,并以此计算不同类型肝癌的发病占比,第二个循环是每循环一次,将一个地区的一个类型肝癌的发病占比赋值到LC_percent中,直至2个循环结束。我设置的代码大概是这样的,大家后期可以根据自己的疾病修改代码,并将其存储至LC_2019S数据集中


我们采用同样的方法计算1990年5种肝癌占总肝癌例数的百分比


最后合并好1990以及2019年的数据,并添加标签变量


针对合并好的数据框,将location以及cause设定变量的排列顺序


最后开始作图,采用ggplot2中的条形图进行绘图,用5种肝癌类型作为填充-fill,由于我们已经统计好各个分型的占比,因此stat采用“identity”,并将占比百分比作为说明映射到图形中即可。


最后就可以出来这个图形了~,当然了大家可以根据自己的配色来选择颜色搭配,然后在AI软件中调整图形即可。


©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容