疾病负担研究(GBD)——如何使用BAPC包预测疾病负担

这次是GBD数据库的第15篇推文,

这一期,我们将介绍GBD数据库的第2个预测包——BAPC.

关于数据准备,大家可以参考第14篇推文,包括年龄结构数据以及人口数据都可以下载。

下面,我们直接进入到R语言分析过程。

首先,我们设置路径,读取R包


我们读取相应的数据,包括设定3个年龄向量用来提取

读取标准年龄结构数据


由于BAPC需要的数据结构和nordpred不同,BAPC行为年份,列为年龄,此外数据需要为整数,因此我们这里整理成0-4到95 plus的数据。考虑到不同性别发病率不同,所以这里我们分开预测男女的发病率。因此我们需要分开提取并整理男女数据,

我们首先整理男性数据


接着整理女性数据


同样的,我们读取GBD的1990-2019人口学数据


接着我们读取预测的2020-2030人口学数据


接着我们将<1以及1-4岁整合成0-4岁


接着我们整理人口学数据,变成BAPC能够识别的数据形式


由于BAPC需要将预测的行也要添加至发病数据中,因为我们预测2020-2030的情况,所以我们对其进行补充


数据准备好后,我们可以进行食管癌的发病情况预测

这里简单讲下参数设置(个人理解,不一定准确):gf值代表年龄分层与year的比值,比如我们这里年龄是5岁为一组,而year是1年为一组,所以gf=5

Npredict个人不是很理解,这里暂时给不了很好的解释,stdweight需要输入标准人口年龄结构用来计算ASR


接下来计算每个年龄层的发病数


计算每个年龄层的发病率


计算标准发病率


计算总发病人数


计算总的标准发病率


计算总发病人数


最后大家可以用R包最带的画图功能看下做的图形


我们一起来看下图形

这个是男性的标准发病率预测


这个是女性的标准发病率预测


最后大家可以将拿到的预测数据进行进一步的分析。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容