(数理统计基础1)基本概念

数理统计的直观理解

数理统计学存在的意义:

某工厂生产了大批的电子元件,一般来说,假定该电子元件的寿命服从指数分布,那么,有两个问题:
a. 元件的平均寿命如何?
b. 我要求平均寿命超过l=5000小时,能不能在这家工厂购买元件?

指数分布的概率密度函数与分布函数复习

指数分布的概率函数为
\begin{align} f(x)= \left\{\begin{matrix} \lambda e^{-\lambda x}, x>0 \\ 0,x\leqslant 0 \end{matrix}\right. \tag{1.1} \end{align}
指数函数的分布函数为:
\begin{align} F(x)= \left\{\begin{matrix} 1 - e^{-\lambda x}, x>0 \\ 0,x\leqslant 0 \end{matrix}\right. \tag {1.2} \end{align}

若我们知道该分布的\lambda的值,则可以很轻松的知道上述两个问题的答案,但是,通产情况下,\lambda的值是不知道的,这个时候我们只好随机抽取进行质量检测。从一大批元件中抽出若干个(n个),并测出其寿命X_1, X_2, X_3...

那么,简单来说,上面这段话总结为下列两个问题:

  1. n个元件怎么选?(随机选,保证每一件都有同等的机会被选出)
  2. 选取之后该如何做?
    有了数据X_1, X_2, X_3...,X_n之后,一个很自然的想法是用算数平均值\overline {X}去逼近其平均寿命。当然,\overline {X}不一定等于\lambda^{-1}

new question is:

  1. \overline {X}\lambda^{-1}的误差有多大?
  2. 产生指定大小误差的概率有多大?
  3. 把这个概率减少到一定程度,需要抽取的n是多少?

问题 a. 元件的平均寿命如何?
(参数估计问题)
b. 我要求平均寿命超过l=5000小时,能不能在这家工厂购买元件?
(假设检验问题)
似乎第一个问题解决了,第二个问题也就能够解决了,但是,因为\overline {X}与平均寿命存在一定误差,我们需要根据实际值进行调整,我们把接受标准定为\overline {X} > l_1, 若l_1取的大些,说明检验更加严格;l_1小一些,则检验更宽松,但是,在理论上,多出可能有两个错误:寿命达到需求,但是被拒收了;寿命未达到需求但是被接受了。这两种错误都有一定的概率,很大程度上取决于\overline {X} > l_1l_1的选择。

参数估计问题和参数检验的区别在于:参数检验不要求对分布中的未知参数进行估计,而是要在两个决定之间选一个。

基本术语:

总体

研究对象的所有集合。其实就是一种分布。当参数未知时,如上述元件的参数\lambda未知,则可以说为是概率分布族

样本

按照一定规定从总体中抽取出来的一部分个体。所得的样本表现为若干个数据,X_1, X_2, X_3...,X_n,其中n称为样本大小样本容量

统计量

完全由样本决定的量,叫做统计量(只依赖于样本,不依赖于总体分布中其他的未知参数)

样本均值与样本方差

样本均值:
\overline{X}=\frac{1}{n}\sum_{k=1}^{n}X_k \tag{3.1}
样本方差:
S^2 = \frac{\sum_{k=1}^{n}(X-\overline{X})^2}{n-1} \tag{3.2}

注意,二阶中心矩与样本方差只差一个常数因子:
\begin{align} B_2 =& \frac{\sum_{k=1}^{n}(X-\overline{X})^2}{n}\\\\ =& \frac{n-1 }{n}S^2 \tag{3.3} \end{align}

为什么说S^2分母为n-1而不是n

image.png

自由度的另一种说法
一共有n个样本,对应n个自由度,用S^2估计方差\sigma^2,自由度本来应该为n,但是总体均值\mu未知,用\overline{X}去估计,用掉了一个自由度。因此就只有n-1了。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 按照用途分类出以下统计函数: AVEDEV 用途:返回一组数据与其平均值的绝对偏差的平均值,该函数可以评测数据(例...
    四方院祭司阅读 8,057评论 0 3
  • 《R语言与统计分析》的读书笔记 本书的重点内容及感悟: 第三章 概率与分布 1、随机抽样 通过sample()来实...
    格式化_001阅读 11,792评论 1 12
  • 1. 简述相关分析和回归分析的区别和联系。 回归分析和相关分析都是研究两个或两个以上变量之间关系的方法。 广义上说...
    安也也阅读 12,921评论 0 3
  • 在明媚的春光里 感谢上苍 让我刚好遇见你 这是今年春天最大的奇迹 眼中唯有一个你 想到你在不远的地方 我的人生就充...
    不会唱歌的涤生阅读 1,855评论 0 4
  • 叶绿千层密,花黄满园香。 飘摇何踟蹰,覆地亦芬芳。 凌独终不悔,抚昔妄断肠。 仙宫凝凡愁,佳人泪几行。
    道童乙阅读 2,828评论 0 0

友情链接更多精彩内容