前言:最近再学一些统计知识,有一点自己的理解与各位小伙伴一起分享一下,有啥疑问,后台留言。
。
首先我们先来看一下如何分组:
随机抽取一群人,20人,随机编号从1到20号,随机分成四个组,每个组,第一个组,给予口服A,然后给予口服B;第二个组,给予口服A,然后不给予口服B;第三个组,不给予口服A,然后给予口服B;第四个组,不给予口服A,然后不给予口服B;观察四组的红细胞数。
接下来我们开始分析:首先统计一下这四组的血红细胞的数量,然后算出这二十人的人均血红蛋白均数,再算出方差,这个方差称之为总方差,他表示每个人与均数之差的平方和。可以用来评价这20人的红细胞数的差异。
接下来我们还要分析为啥会产生差异,可能有以下四种情况:
第一:用了A导致红细胞数上升。
第二:用了B导致了红细胞数上升。
第三:用了A,B导致了红细胞数上升?
第四:可能是随机抽取出来的个体导致红细胞数上升存在差异。
那么到底是哪一种呢?
先算第一种:由于我们要控制变量,通过比较以上四组数据,你会发现,算第一,二种情况时,第二组,第三组,直接与第四组比较,就可以比较出,第一,第二种情况。
具体算法:第二个组,给予口服A,然后不给予口服B;第四个组,不给予口服A,然后不给予口服B;第二组五人的红细胞均数,减去第四组五人的红细胞均数,可以得到A导致红细胞数的差异,记为a,还可以算出方差,简记为方差1。
同理:第三组五人的红细胞均数,减去第四组五人的红细胞均数,可以得到B导致红细胞数的差异,记为b,还可以算出方差,简记为方差2。
同理:第一组五人的红细胞均数,减去第四组五人的红细胞均数,可以得到A,B导致红细胞数的差异,,记为ab,还可以算出方差,简记为方差3。
然后将方差1,2,3相加,得到的方差和与总方差是否相等呢?
答案是不相等,这里没有考虑随机误差,正确的算法应该是将总方差减去上述的方差和就是随机误差。
如何确定总体中的A,B以及A,B导致的误差,也就是说该样本的A,B以及A,B导致的误差能代替总体中的A,B以及A,B导致的误差吗?
所以接下来,我们就需要将上述算到的方差1,2,3与随机误差进行比较,就能得出一个F值,该值,可以通过相关的F检查表,可以得出对应的概率区间,从而计算出存在A,B以及A,B导致的误差可不可能发生。
可能很多小伙伴会问:为啥要将其与随机误差进行对比,原因是四组都有随机误差,所以可以这么比,上述比值等于一,就可以证明方差1,2,3是由随机误差导致的哦。
对了,最后大家还要注意一下:抽出的二十人,个体差异不能太大,比如说有些人天生红细胞很高,有些人天生很低,那么通过抽样,算出来的红细胞数差异会很大,而且上述人群比较是少数,所以要解决这个问题,抽样人群必须满足正态分布,正态分布可以用方差齐来表示,方差齐可以用残差图来表示。
好了,今天的分享就到这里了,如果今天的分享对友友们有用的话,还请点赞OR关注OR收藏,最好是分享啦,如果有啥疑问,可以在后台留言,看到的话,会第一时间回复的。如果留言多的话,下期出一期视频结合SPSS实际操作一下哦。