何时应该使用非参数检验?

俗话说得好,方差有三宝:独立、正态、齐性好。什么意思呢?就是说使用方差分析需要三个前提条件:1、各样本须是相互独立的随机样本;2、各样本来自正态分布总体;3、各总体方差相等,即方差齐。

纵然方差分析的用途广泛,可以不受比较组数的限制,进行多组比较。然而在实际的数据分析中,我们辛苦收集的数据往往很难符合其使用的条件。但我们又需要从样本数据中,获得尽可能多的信息,此时使用非参数检验就再适合不过了。

非参数检验类别

按照样本数量分类,可以将非参数检验方法分为几个方面:

单样本非参数检验方法

卡方检验:用于分析定类数据与定类数据之间的关系情况,例如不同减肥治疗方式对于减肥的帮助情况(胆固醇水平)。卡方检验用于研究X和Y之间的关系,且X,Y均为定类数据。并且卡方检验需要使用卡方值和对应P值去判断X与Y之间是否有差异。通常情况下,共有三种卡方值,分别是Pearson卡方,yates校正卡方,fisher卡方;优先使用Pearson卡方,其次为yates校正卡方,最后为fisher卡方。

二项分布检验:是指在只会产生两种可能结果如阴性、阳性之一的n次独立重复试验(常常称为n重Bernoulli试验)中,每次试验的“阳性”概率保持不变时,出现“阳性”的次数X=0,1,2......n的一种概率分布。在医学研究中较为常用。

单样本K-S检验:单样本K-S检验能够利用样本数据推断样本来自的总体是否服从某一理论分布(正态分布,均匀分布,泊松分布,指数分布)。适用于探索连续型随机变量分布。

单样本Wilcoxon检验:(也称单样本wilcoxon符号秩和检验,符号秩和检验,也或者秩和检验等);其被用于检验数据是否与某数字有明显的差异性。首先需要判断数据是否呈现出正态性分析特质,如果数据呈现出正态性特质,此时应该使用单样本T检验进行检验;如果数据没有呈现出正态性特质,此时应该使用单样本Wilcoxon检验。

游程检验:游程检验用于检验数据是否具有随机性,其原始假设是数据序列不具有随机性;如果检验结果显示P值小于0.05,则说明数据不具有随机性,反之P值大于等于0.05则说明数据具有随机性。如果数据有上升或下降的趋势,或有呈周期性变化的规律等特征时,均可能表示数据与顺序是有关的,或者说序列不是随机出现的。通俗来讲,游程检验是用于分析数据是否为随机。

两独立样本非参数检验方法

MannWhitney U 检验:是用得最广泛的两独立样本秩和检验方法。用于研究定类数据与定量数据之间的关系情况。例如研究人员想知道不同性别学生的购买意愿是否有显著差异,如果购买意愿没有呈现出正态性特质,此时建议可使用MannWhitney U 检验。其原假设是:两独立样本来自的两总体的分布无显著差异。

W-W游程检验:用来检验两独立样本来自的两总体的分布是否存在显著差异。通过分析游程的大小和数量实现游程检验,从而判断两组样本在混合序列中的排列是否为随机的。若两组样本在混合序列中的排列是随机的,则两组样本之间没有显著性差异。

极端反应检验:从另一角度检验两独立样本所来自的量总体分布是否存在显著性差异。其基本思想是:将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验试验样本相对于控制样本是否出现了极端反应。如实验样本没有出现极端反应,则认为两总体分布无显著差异,相反则认为存在显著差异。

两配对样本的非参数检验方法

McNemar检验:用于两配对样本的分析,其将研究对象自身作为对照者检验其“前后”变化是否有显著差异,例如比较同一批观测对象用药前后或实验前后的结果有无差异。该检验只适用于二分变量,即只有两种可能“是”或“否”,“阳性”或“阴性”,“有反应”或“无反应”等,对于非二分变量,应在分析前进行数据变换。

符号检验:也是用来检验配对样本所来自的总体的分布是否存在显著性差异的非参数方法。符号检验法是通过两个相关样本的每对数据之差的符号进行检验,从而比较两个样本的显著性。由于这种方法只考虑符号,不考察差数的大小,因而失去样本所提供的一部分信息,准确度不高。因此除了小样本,一般不使用符号检验。

配对样本Wilcoxon检验:配对样本Wilcoxon检验用于检验配对数据是否具有显著性差异,比如实验组和对照组的成绩差异性,手术前和手术后的体重差异性。从功能上讲,配对样本Wilcoxon检验与配对样本T检验完全一致,区别仅在于数据是否正态。

多独立样本的非参数检验方法

中位数检验:用来检验多个独立样本来自的总体的中位数是否存在显著差异。其基本思路:先求取混合后数据的中位数,然后利用卡方分布统计量来计算每个样本组内中位数两侧个案数的差异性。

K-W检验:用于检验多个总体的分布是否存在显著差异。SPSSAU会自动选择MannWhitney或者Kruskal-Wallis统计量。如果X的组别为两组,比如男和女共两组,则应该使用MannWhitney统计量,如果组别超过两组,则应该使用Kruskal-Wallis统计量结果。

多个配对样本非参数检验方法

如果是多相关样本,并且目的在于研究差异性,则有Friedeman检验和CochranQ检验两项可用,但特别提示一点,CochranQ检验涉及的数据一定是二分类(即1和0这样的数据);如果是研究多相关样本的一致性情况,则可使用Kendall协调系数。

参数或非参数的正确选择

选择参数检验或非参数检验需要结合专业情况以及数据类型数据形态,综合参数检验和非参数检验的优缺点进行考量,方法的选择没有绝对意义上的标准答案。

参数检验假定总体分布服从正态或近似正态,如果数据服从正态分布,参数检验是最好的选择。如果不满足这些条件的情况下,依然使用参数检验分析,很可能让检验结果产生错误。而非参数检验不受数据分布的限制,检验条件比较宽松,对于总体未知的样本都可以适用。但非参数检验也存在不足,非参数检验对总体假定不多,因而会缺乏针对性,功效不如参数检验。

同时样本的数量也影响着选择何种方法。一般来说小样本用非参数检验,大样本采用参数检验。原因是参数检验假定了服从某种分布,当样本量过小时,无法识别数据分布状态,而非参数检验对样本量没有要求,因此可选择非参数检验。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,185评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,445评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,684评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,564评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,681评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,874评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,025评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,761评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,217评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,545评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,694评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,351评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,988评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,778评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,007评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,427评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,580评论 2 349

推荐阅读更多精彩内容

  • 什么是组间差异检验?就是组间的差异分析以及显著性检验,应用统计学上的假设检验方法,检验组间是否有差异及其差异程度。...
    周运来就是我阅读 296,939评论 5 273
  • 1. 简述相关分析和回归分析的区别和联系。 回归分析和相关分析都是研究两个或两个以上变量之间关系的方法。 广义上说...
    安也也阅读 8,672评论 0 3
  • 假设检验也叫显著性检验,是以小概率反证法的逻辑推理,判断假设是否成立的统计方法,它首先假设样本对应的总体参数(或分...
    周运来就是我阅读 1,906评论 1 8
  • 假设检验也叫显著性检验,是以小概率反证法的逻辑推理,判断假设是否成立的统计方法,它首先假设样本对应的总体参数(或分...
    井底蛙蛙呱呱呱阅读 120,014评论 4 41
  • 感恩父母身体健康,感恩父母养育之恩,感恩列祖列宗庇佑,感恩家庭和睦,感恩孩子们健康快乐成长,感恩万物滋养! 感恩早...
    马名钧楹阅读 168评论 0 0