解密大数据课程作业-正态分布的应用

作业思路

习题1:投掷N枚硬币,正面出现57次,尝试通过计算回答,假设N=100枚,要舍弃还是接受?
tips:投掷N枚硬币的数据近似于均值为N/2,S.D.为sqrt(N)/2的正态分布。

假设95%的置信区间是可接受的,若57被包含在该区间中,则接受,否则舍弃
μ=N/2=50,σ=sqrt(N)/2=5
代入方程 1.96 ≤ (X - μ)/ σ ≤ +1.96,解方程得95%的置信区间。

习题2:随机抽样30个GRE成绩,平均分数为1082分,标准差为108分,决定下列参数的95%和99%置信区间。
1)总体均值
2)总体标准差

刚开始看到题目,我也有点发蒙,均值和标准差不是已经知道了么,还要怎么求呢?google了一会,才明白已知的均值和标准差只是局部的,基于当前抽样的,不能等同于总体的。现在是要从局部推导总体,把总体均值和总体标准差都看做是变量,求它们的95%和99%的置信区间。

我们都知道,如果X服从正态分布,则有1.96 ≤ (X - μ)/ σ ≤ +1.96 的区间概率为95%。

  • 求总体均值的置信区间
    问题转化为,求出总体均值的均值,总体均值的标准差,代入上述方程,便可获得总体均值的95%置信区间。

设μμ为该总体均值的均值,σμ为总体均值的标准差,这两个值怎么求呢?
μμ用抽样得出的均值代替。作业中的抽样均值为1082.

根据总体平均数的估计中的公式,σμ的求法分为两种情况:

  1. 当总体标准差σ已知时,σμ=σ/sqrt(N)
  2. 当总体标准差σ未知时,无偏估计:σμ=S/sqrt(N),有偏估计:σμ=S/sqrt(N-1)。S为样本的标准差。

作业中的总体标准差未知,采用有偏估计σμ=S/sqrt(N-1)=108/sqrt(30-1)

代入前面的方程

-1.96 ≤ (X - 1082)/ (108/sqrt(30-1) )≤ 1.96 ,解方程得95%置信区间

同理,求总体均值99%的置信区间,解方程
2.576 ≤ (X - 1082)/ (108/sqrt(30-1) )≤ 2.576

  • 求总体标准差的置信区间
    问题转化为,求出总体标准差的均值,总体标准差的标准差,代入上述方程
    设μσ为总体标准差的均值,σσ为总体标准差的标准差,这两个值怎么求呢?
    根据 标准差与方差的区间估计 ,当样本容量n>30时,样本标准差的分布渐近正态分布,
    由该文中的公式可知:
    μσ=抽样的标准差。作业中的抽样标准差为108。
    σσ=S/sqrt(2N),S为抽样标准差即108.

代入得方程
-1.96 ≤ (X - 108)/ (108/sqrt(2*30) )≤ 1.96 ,解方程得95%的置信区间置信区间

-2.576 ≤ (X - 108)/ (108/sqrt(2*30) )≤ 1.96,解方程得99%的置信区间置信区间为

还有一种方法是求方差的置信区间,再开平方,用的是卡方分布。具体见 标准差与方差的区间估计

1.以上解法,是基于一定的前提:若分布X服从正态分布,则其均值和标准差也服从正态分布。否则应该是不能这样做的。
2.根据标准差与方差的区间估计,在总体方差未知时,样本平均数的分布为t分布,所以应该要查t值表。
但我不知道如果已知总体分布是正态分布,是不是可以用正态表的值比如1.96?
3.两个参数为什么可以用这样的公式求得,我也不清楚,暂且理解为用一系列数学公式推导出来的,统计学还得继续看……

写完才看到石头同学的作业,推导专业多了。看了小密圈里其他同学的作业,我的总体标准差的区间和大家的出入比较大,同学们是先通过卡方分布求总体方差,再求标准差。但我看到标准差与方差的区间估计中的 例1也是这样求的,是做法的不同,还是我的理解是错误的?

用ipython 求方程的解

import sympy #导入sympy库,用于数学计算
x = sympy.Symbol('x') #将x转换成符号,才能用在后面的方程中
sympy.solve(x * 2 - 4, x) #以一个简单线性方程为例,第一个参数为要解的方程,要求右端等于0,第二个参数为要解的未知数。解为2。
[2]

习题1:求解方程1.96 ≤ (X - μ)/ σ ≤ +1.96,μ=N/2=50,σ=sqrt(N)/2=5

sympy.solve((x - 50)/5+1.96,x)
[40.2000000000000]
sympy.solve((x - 50)/5-1.96,x)
[59.8000000000000]

置信区间为[40.2,59.80],所以57是可以接受的

习题2:求总体均值的95%置信区间

sympy.solve((x - 1082)/ (108/(30-1)**0.5)+1.96,x) #求总体均值95%的置信区间
[1042.69201081468]
sympy.solve((x - 1082)/ (108/(30-1)**0.5)-1.96,x)
[1121.30798918532]

置信区间为[1042.69,1121.3]

习题2:求总体均值的99%置信区间

sympy.solve((x - 1082)/ (108/(30-1)**0.5)+2.576,x)
[1030.33807135644]
sympy.solve((x - 1082)/ (108/(30-1)**0.5)-2.576,x)
[1133.66192864356]

置信区间为[1030.33,1133.66]

习题2:求总体标准差的95%置信区间

sympy.solve((x - 108)/ (108/(2*30)**0.5)+1.96,x)
[80.6722295091604]
sympy.solve((x - 108)/ (108/(2*30)**0.5)-1.96,x)
[135.327770490839]

置信区间为[80.67,135.32]

习题2:求总体标准差的99%置信区间

sympy.solve((x - 108)/ (108/(2*30)**0.5)+2.576,x)
[72.0835016406109]
sympy.solve((x - 108)/ (108/(2*30)**0.5)-2.576,x)
[143.916498359389]

置信区间为 [72.08,143.91]


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,014评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,796评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,484评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,830评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,946评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,114评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,182评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,927评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,369评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,678评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,832评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,533评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,166评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,885评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,128评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,659评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,738评论 2 351

推荐阅读更多精彩内容