广义估计方程(Generalized Estimating Equations, GEE)
1、适用数据:GEE适用于分析具有相关性的数据,如纵向研究中的重复测量数据或同一组内的观察数据。
2、适用数据分布类型:、
GEE可以处理多种分布类型,包括正态分布、二项分布和Poisson分布等,并且允许研究者指定适当的工作相关矩阵来反映观测值之间的依赖性。这种方法特别适用于那些难以满足传统统计分析方法(如方差分析)假设的情况。
3、GEE的主要优点包括:
灵活性:可以处理多种分布类型和链接函数。
适用性:适用于相关或重复测量数据,能够考虑组内相关性。
易用性:可以通过常见的统计软件包(如R或Python)方便地实施。
4、应用场景包括:
纵向研究:对于儿童的身高数据,多次测量得到的资料,适合采用GEE进行分析。
医学研究:在医学研究中,同一病人的多次测量或同一地理区域内的观测数据、。
社会科学:在社会科学领域,对于同一群体的调查数据,GEE可以帮助分析变量之间的关系,同时考虑到数据间的相关性。
注意:在使用GEE时,研究者需要选择合适的工作相关矩阵和相关结构,这些选择将影响模型的拟合和参数估计的准确性。一旦模型拟合完成,研究者可以解释估计的系数、标准误差、p值等统计数据,以得出关于变量之间关系的结论。
一般线性模型(general linear model,GLM)
1、定义:是基于一组自变量(预测变量)(X1、X2、X3、...)和一个连续型响应变量(因变量)(Y),利用最小二乘法进行回归分析,从而得到各个自变量与因变量之间的关系。
2、优点:相对于传统的线性模型,GLM主要具有以下三个特点:
(1)可处理不符合正态分布的数据,例如二项式分布、泊松分布等。
(2)可以实现非线性函数的变换,使得建模能够更好地拟合数据,同时可探索因素的交互影响。
(3)能够处理多重共线性数据
广义线性模型(Generalized Linear Model,GLIM)
1、定义:是一种基于广义概率分布进行建模、以预测某个连续或离散响应变量的统计学习方法。
2、优点:
(1)与传统的线性回归模型不同,GLIM可以同时处理连续型和离散型数据。
(2)GLIM扩展了线性模型的应用范围,可以将非线性模型(如指数曲线、logistic回归模型等)通过一定的变量转化变为线性模型,使其满足或近似满足线性模型分析的要求。
(3)GLIM需要满足因变量(Y)的条件分布属于指数分布族,且因变量的取值是自变量的线性函数的某个单调可微函数(称为链接函数)。
(4)在GLIM中,因变量的分布可以扩展到非连续性的资料,如二项分布,Poisson分布,负二项回归等。
线性混合效应模型(Linear Mixed Effects Model, LME)
1、定义:又称多水平模型、多层模型、混合模型效应,是一种常用的统计方法。用于处理具有多层次结构和重复测量的数据。LME可同时处理固定效应和随机效应对因变量的影响,以更准确地描述数据的变异和关联情况。
2、优点:
(1)LME结合了固定效应和随机效应的线性模型,可以提供更全面和准确的数据分析,适用于具有层级结构、重复测量或相关性的数据。
(2)LME中,因变量可以是任何类型的连续或离散变量,可适用于周期性时间序列、空间数据和多米努斯数据集的建模。