比率的标准误差是基于二项分布,因为一个比率通常是成功次数除以试验次数。二项分布的方差可以用下面的公式表示:Var(X) = np(1-p)
其中 ( n ) 是试验的总次数,( p ) 是每次试验成功的概率。如果 ( X ) 是一个二项随机变量(即,模型成功次数的分布),那么 ( X ) 的期望值和方差如下:
E(X) = np
Var(X) = np(1-p)
为了得到比率的方差,我们首先定义一个比率 p= X/n。比率的标准差(标准误)是这个比率方差的平方根:
Var(p) = Var(X/n) =Var(X) /n^2
Var(p) = =Var(X) /n^2 = np(1-p) /n^2=p(1-p) /n
上述推导使用了方差的性质,即一个随机变量乘以常数 ( a ) 时,方差乘以 ( a^2 )。
需要注意的是,这个标准误差的公式适用于比率而不直接适用于比率比或风险比。此外,这种近似在样本量足够大时有效,但是在样本量较小时,比率的分布可能不再近似于正态分布,这时可能需要使用不同的方法(如,使用正态近似的修正或者精确统计方法如Fisher确切检验)来得到更精确的置信区间或标准误差计算。