评估暴露因素与结局变量间的因果关系的统计方法
进一步:利用与暴露因素强相关的遗传变异作为工具变量,来评估暴露因素与结局之间的因果关系的数据分析技巧
这里的工具变量是:遗传变异SNP
暴露因素:1,生活方式 吸烟,喝酒,饮食,运动,咖啡因摄入
2,环境因素, 空气污染,噪音污染,化学物质暴露
3,遗传因素 基因变异,多基因风险评分
4,其他因素 社会经济地位,教育程度,医疗服务利用
先跑一遍数据就好,里面肯定会有很多坑的
工具变量来自于GWAS,
这里肯定会有筛选标准:
p1 找到强相关
clump 去除连锁不平衡的工具变量
r2和KB来制定去除LD的标准
连锁不平衡是什么?物理距离太近会倾向于一起遗传,
D’ 值: D’ 值用来衡量两个 SNP 之间的连锁不平衡程度,取值范围在 0 到 1 之间。
D’ 值为 1 表示两个 SNP 处于完全连锁不平衡,它们总是以特定的组合遗传。
D’ 值为 0 表示两个 SNP 独立遗传,它们之间没有连锁不平衡。
r² 值: r² 值用来衡量两个 SNP 等位基因频率之间的关联程度,取值范围在 0 到 1 之间。
r² 值为 1 表示两个 SNP 的等位基因频率完全相关,它们总是以特定的组合遗传。
r² 值为 0 表示两个 SNP 的等位基因频率独立,它们之间没有关联。
(1)找工具 工具与暴露因素
(2)暴露因素与结局变量
(3)数据预处理
这一步处理的 是什么数据?
(4)MR分析 五种方法
选择哪一种方法?
(5)敏感性分析 异质性,留一性,水平多样性
这一步作用
(6)可视化
散点图,森林图,漏斗图
这一步作用
水平基因多效性:变异通过与暴露无关的途径影响结果的一种情况,,违反了排他性,
,还有其他因素通过暴露因素影响结局变量还是变异通过其他途径影响结局变量,,显然是后者,,有何暴露因素一样的物质
水平多效性:指的是基因 工具变量可以绕过暴露因素影响结局变量
工具变量可以通过其他混杂因素影响结局变量
异质性:指的是数据
留一性:
连锁不平衡:基础知识——连锁不平衡 Linkage disequilibrium (LD) - 简书 (jianshu.com),,D’ 值为 0 表示两个 SNP 独立遗传,它们之间没有连锁不平衡。平衡就是独立,不平衡就是不独立