【BGM】楼下有写春联和卖年画的,有点吵,不断重复外放的传统年画相关宣传。自习室的孩子们明显少了好多,座位随处可见,估计是大家放假了吧,也可能考研er都去happy了。今天的这本《深入浅出统计学》上次看还是两周前。在这里做个简要的读书笔记吧。
卡在倒数第二章《破立之争》主要内容是假设检验,我不太懂P值的计算。
百度:
P值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值,一般以P < 0.05 为有统计学差异, P<0.01 为有显著统计学差异,P<0.001为有极其显著的统计学差异。其含义是样本间的差异由抽样误差所致的概率小于0.05 、0.01、0.001。实际上,P值不能赋予数据任何重要性,只能说明某事件发生的几率。统计结果中显示Pr > F,也可写成Pr( >F),P = P{ F0.05 > F}或P = P{ F0.01 > F}。
如果 P<0.01,说明是较强的判定结果,拒绝假定的参数取值。
如果 0.01<P值<0.05,说明较弱的判定结果,拒接假定的参数取值。
如果 P值>0.05,说明结果更倾向于接受假定的参数取值。
假设:制毒设备没坏——每瓶0.25
随机样本大小80 样本平均数0.14,样本标准差0.46
如果机器坏了,每一瓶都不到0.25,可能0.20的话,随机样本的概率大很多
如果机器没坏,每瓶都到0.25,随机样本概率小,在5%往外的位置
看0.14是不是偶然?现在P小于0.05 就是说假设有出现错误的概率,也就是说每瓶不到0.25,也就是说机器坏了。
如果平均值还是0.25,那只有3%的机会,太小了。P小于0.05,说明假设0.25的图和现实抽样的图重合率不到0.05,也就说明之前假设机器没坏这个想法存在问题。
假设世界上喜欢魔兽世界的人占0.5.随机抽取100个人,算是出来喜欢占0.3;P值大于0.05,则假设的对;P值小于0.01,则假设可能不对这个世界上喜欢魔兽的人不到0.5.
斑点飞猪比条纹飞猪到底快多少?
我们如何构建一个置信区间使我们了解到两个独立总体平均数之间的差距?
让我们随机抽取两组随机样本数据寻找答案。
【本质上一切统计问题都相似:我们只能得到样本,如何对总体做出判断?】
【我们的解决办法:利用手头数据估计出某种抽样分布,然后截取它的概率,但有时候先把这个分布推移到一个新位置更有用(P值)
【关键词】
随机抽样
样本大小
样本平均数
标准差
变量
分布
样本统计值(真实的)与总体参数(需要预测的) 平均数,样本标准差;总体平均数,总体标准差
正态分布
抽样分布
中心极限定理(n大于等于30“大样本”,定理成立)
概率
估计一个抽样分布
置信区间(剪刀)
假设检验(P值)
差值推断
小样本推断
标准差推断
相关
回归分析
方差分析(假设检验)
比例推断
预测未来