根据样本信息来推断总体信息,比如总体分布函数的未知参数。
1. 点估计
点估计的问题定义:
设总体
的分布函数
的形式已知,
是未知参数,
是来自总体
的一个样本,
是它的样本值。点估计就是要构造一个适当的统计量
,用该统计量作为总体未知参数
的估计值。
点估计的常用方法:矩估计法和最大似然估计法
矩估计法:样本矩估计总体矩的方法
若总体中含有
个未知参数,令
从中解出
个参数
作为
的估计量,其中
是
阶样本中心距。
注:矩估计法简单易行,并不需要事先直到总体是什么分布。缺点是,当总体类型已知,没有充分利用分布提供的信息,一般场合下,矩估计量不具有唯一性。
最大(极大)似然估计:
基本原理:用使样本取值概率达到最大的参数值来估计未知参数
离散型随机变量:若
是离散型随机变量,其分布律为
,其中
为未知参数,
是来自
的一个样本,设
为对应的样本值,则事件
发生的概率为
记
为离散型的样本的似然函数。固定样本值
,取使得
达到最大的参数值
作为
的参数估计。
连续型随机变量:记
其中
为概率密度函数。
估计量的评价标准:
无偏性:若估计量
的数学期望
存在,且对于任何
,有
,则称
为
的无偏估计量,否则为有偏估计量。
有效性:有效性是衡量两个无偏估计量的优劣,方差越小越有效,前提是样本容量固定。
但方差不能无限小到0,存在罗-克拉美下界(Rao-Cramer):
凡是能够达到Rao-Cramer下界的无偏估计量称为最小方差无偏估计量。
相合性:无偏性和有效性都是在样本容量固定的前提下提出的,我们希望随着样本容量的增大,一个估计量的值稳定与待估参数真值附近。
设是参数
的一个估计量,当
时,
依概率收敛于
,则称
是
的相合估计量。
2. 区间估计
未知参数的点估计仅仅是未知参数的一个近似值,它没有反映与真实值的接近程度,亦没有给出估计的精度,使用起来把握不大。现在我们要给出一个区间,这个区间包含未知参数的可信程度是预先给定的,此区间的长度给出了估计的精度,这就是我们要讨论的区间估计。
定义:
设总体
的分布函数
,其中
是一个未知参数,对于给定的一个很小的正数
,若由来自
的样本
确定的两个统计量
,
,对于任意的
,满足
则称
是
的置信水平为
的置信区间,分别称
和
是置信水平为
双侧置信区间的置信下界和置信上界。