评价病原微生物耐药基因与药敏实验(耐药表型)之间的相关性--Kappa系数

耐药基因 我们常将耐药基因制作成一张热图,看某一种微生物是否含有此耐药基因。总会有一种想法,我们是否完全通过基因测序就能够预测该病原的耐药性呢?(如果能实现的话一定是通过人工智能)

我们可以通过热图与表型图直观的的感觉来判断此耐药基因与耐药表型的关系,显然耐药基因越多,越耐药。但如何去评价他们之间的关联性就需要一些统计学知识。

Kappa系数Kappa系数(Kappa statistic) 是一种用于评估分类结果 一致性 的统计指标,尤其适用于比较两种方法(如基因检测 vs. 药敏试验)对同一批样本的分类是否一致,同时 校正随机因素 的影响。01 适用场景

1.耐药性研究:比较耐药基因预测(基因型)与药敏试验(表型)的一致性。

2.诊断测试:评估新检测方法与金标准的一致性。

3.其他分类问题:如病理诊断、影像学判读等。

02计算公式

Kappa系数的计算基于 混淆矩阵(Confusion Matrix),假设有以下2×2表格(以耐药性为例):

03结果解读

假设某研究对100株细菌进行基因预测和药敏试验,结果如下:

观察一致性(Po):

         Po=10045+40=0.85

期望一致性:

    Pe=0.50

Kappa系数:κ=(0.85−0.50)/(1−0.50)=0.70结论:Kappa=0.70,表明基因预测与药敏试验 高度一致。

还有哪些能评价耐药基因和耐药表型之间的关系

在评估 耐药基因(基因型) 和 耐药表型(药敏试验) 之间的关系时,除了 Kappa系数,还可以使用以下统计指标或方法,从不同角度衡量两者的关联性、预测能力或一致性:


二、统计检验方法

1. 卡方检验(Chi-square test)

  • 评价耐药基因和表型之间是否具有统计学关联。

  • 如频数较小,可用Fisher精确检验。

2. 相关性分析(Correlation analysis)

  • 对于某些连续变量(如MIC值),可以采用皮尔逊或斯皮尔曼相关系数进行分析。


三、回归分析

1. Logistic 回归

  • 用于预测某种表型耐药是否可能由特定耐药基因解释。

  • 输出OR值和显著性P值,常用于多因素分析。


四、机器学习方法

  • 用大量基因型和表型数据训练模型(如随机森林、支持向量机等),预测耐药表型。

  • 适用于大规模数据分析、可考虑多基因和复杂交互。

当然最后我觉得最靠谱的是 回归分析以及机器学习方法,当然回归分析也是机器学习方法的一种,当我们在进行耐药实验时药物种类的选择也很重要,部分菌株携带相关耐药基因但对测试的抗菌药物敏感,可能与测试的抗菌药物种类较少有,毕竟每一种类别的抗生素有很多种不同的药类,仅依赖基因检测来预测耐药性存在局限性,需结合表型检测、转录组和蛋白表达水平的研究,才能全面揭示耐药机制。如果我们能结合质谱中的蛋白成分+耐药基因,我想预测表型会更加准确!

创作不易,麻烦大家关注!!

您的关注是我不断前进的动力!!!

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容