率的标准误公式推导

比率的标准误差是基于二项分布,因为一个比率通常是成功次数除以试验次数。二项分布的方差可以用下面的公式表示:Var(X) = np(1-p)

其中 ( n ) 是试验的总次数,( p ) 是每次试验成功的概率。如果 ( X ) 是一个二项随机变量(即,模型成功次数的分布),那么 ( X ) 的期望值和方差如下:

E(X) = np 

Var(X) = np(1-p) 

为了得到比率的方差,我们首先定义一个比率 p= X/n。比率的标准差(标准误)是这个比率方差的平方根:

Var(p) = Var(X/n) =Var(X) /n^2

Var(p) = =Var(X) /n^2 = np(1-p) /n^2=p(1-p) /n

上述推导使用了方差的性质,即一个随机变量乘以常数 ( a ) 时,方差乘以 ( a^2 )。

需要注意的是,这个标准误差的公式适用于比率而不直接适用于比率比或风险比。此外,这种近似在样本量足够大时有效,但是在样本量较小时,比率的分布可能不再近似于正态分布,这时可能需要使用不同的方法(如,使用正态近似的修正或者精确统计方法如Fisher确切检验)来得到更精确的置信区间或标准误差计算。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • CHAP5 离散型概率分布 5.4 二元分布,协方差和金融资产组合 1) 协方差的计算 numpy.cov():d...
    zzzzzzzeng阅读 1,239评论 0 1
  • 一、信息图形化 二、集中趋势的量度 三、分散性与变异性的量度 四、概率计算 五、离散概率的分布 六、排列与组合 七...
    bubble_Z阅读 2,084评论 0 3
  • 标准误差(Standard Error,SE)是描述统计量(例如样本均值)抽样分布标准差的度量。其中,样本均值的标...
    生物统计与SAS研究员阅读 3,050评论 0 3
  • 目录 抽样和抽样分布 区间估计 假设检验 抽样和抽样分布 抽样是为了估计总体的参数 样本比率: 样本均值的抽样分布...
    人间桑阅读 1,185评论 0 0
  • 前言 在大多数现实情况下,模型可以简化并通过模型对显式进行探索,本章可以学到的东西 数据分析中使用基础模型 使用积...
    欧呆哈哈哈阅读 4,800评论 0 2