本文中我们将列举两个案例,看看作者是如何应对“数据荒”,把极其有限的数据变形成高质量的研究论文,从有限的临床数据中挖掘出无限的临床价值。希望对大家今后充分利用临床数据产生一些启发。
案例一
参考文献: 《The cold effect of ambient temperature on ischemic and hemorrhagic stroke hospital admissions: A large database study in Beijing, China between years 2013 and 2014-Utilizing a distributed lag non-linear analysis》
数据源:2013.1.1-2014.12.31期间,北京市每日中风患者的入院人数以及每日的气温数据
影响因子:IF=5.7
文章结论:
文章分解:
研究目的:气候变化对于卒中患者就诊量的影响;
分解数据:日期、卒中患者的日就诊量
统计设计:补充气候数据(公网获取每日气温数据)
模型选择:分布式滞后非线性模型,主要基于临床角度1---极寒/极热都易诱发卒中(统计学语言为---温度对于卒中就诊率的影响可能是非线性的);临床角度2---外界因素对于卒中发病不一定是即时的或者直接的影响(统计学语言---温度对于卒中就诊率的影响可能存在滞后效应或累计效应);统计角度---两个变量(病例日门诊量和气温)的共同纽带是日期。因此,应该综合临床专业和统计学专业的角度选择模型
文章亮点:从数据处理的角度看文章的亮点,利用极其有限的数据维度(卒中的日就诊量),以时间为依托和纽带(日期),充分利用公开的免费数据(气温),在数据维度极其狭窄的情况下找到恰如其分的统计模型(分布式滞后非线性模型)
统计模型拓展:
“分布式滞后非线性”模型除了用于研究环境/气候对于疾病的影响,还可用于研究某些药物、治疗方法及干预措施对于疾病的滞后效应和累计效应
参考文献:
Yanxia Luo, Haibin Li, Fangfang Huang, Nicholas Van Halm-Lutterodt, et al. 2016.The cold effect of ambient temperature on ischemic and hemorrhagic stroke hospital admissions: A large database study in Beijing, China between years 2013 and 2014dUtilizing a distributed lag non-linear analysis. Environmental Pollution 232 (2018) 90-96