愚蠢的显著性检验之重复检验

Silly significance tests: Tautological tests

上一篇博文已经论证:使用显著性检验去核查随机分配是否有效是毫无意义的。在本篇博文,我们在讨论另一种愚蠢的显著性检验:dividing participants into a ‘high X’ and a ‘low X’ group and then testing whether the groups differ with respect to ‘X’。

什么是“tautological tests”

我们经常会在研究论文中看到下面的表述:

根据70名被试在20分的法语测验上的成绩,分为3个水平组。高水平组包含16或更高分数的被试(n=20);中等水平组为那些分数在10-15之间的被试(n=37);低水平组为9分及9以下的被试(n=13)。经ANOVA表明,三组之间的测验得分存在显著差异 (F(2, 67) = 133.5, p < 0.001)。


这是一个虚构的例子,但在应用语言学中上述程序比较常见:研究人员对被试进行分组,使得在某个变量上各组之间没有重叠(如任务表现、年龄),然后继续通过证明组间在该变量上存在显著差异来表明这种分组是合理的。这种做法并不一定是针对被试,有时研究者对刺激的选择(如:高频词vs 低频词)也遵循类似的逻辑。由于目前找不到更好的术语,姑且先称这种实践为重复显著性检验。

存在的问题

正如其名,tautological tests之所以是愚蠢的,是因为他们不能告诉我们任何既正确又新鲜的信息。因为是我们自己创建了在某个变量上未重叠的被试或刺激分组,因而我们显然知道各组之间必定在该变量上存在差异。如果显著性检验未见有显著的p值,那么这更多告诉我们的是sample size的信息,而不是关于该变量上的组间差异的信息。

这种non-informativeness  tautological tests与之前讨论的 balance tests有一些相似之处。在balance tests例子中,我们对一个不存在的差异进行检验(我们知道它并不存在);当使用tautological tests时,我们对一个已知的差异进行检验。个人认为, tautological tests并不会对研究结果造成负面影响,但它使用无用的信息将研究报告弄得乱七八糟,并常常让人望而生畏。

更严重的问题:过度使用ANOVA

更严重的问题发生在 tautological significance tests之前:将一个连续变量离散化。将一个连续变量划分成不同组,会丢失一些有价值的信息。因此,与你在分析中使用原始变量相比,这会导致统计功效的降低。此外,分割点的选择是任意的,选择不同的分割点也会造成结果上的差异。

研究者似乎普遍认为,为了明智地分析数据,他们需要进行分组。其潜在观点可能是分组比较(i.e. ANOVAs)比涉及连续变量的分析(e.g. linear regression)更正式和客观。或者研究人员可能认为,在处理更加复杂数据时,如具有交叉依赖结构的数据(e.g. featuring both stimulus- and participant-related variables)或者数据呈现非线性,必需使用ANOVAs。想要消除这些错误观点的研究人员可以阅读 Harald Baayen 的一篇文章以及2008 special issue of the Journal of Memory and Language上的一些文章 (e.g. the Baayen et al. and Jaeger papers)。如果你的数据显示非线性,而你希望通过将一个连续变量离散化进行解决时,我建议你首先看看 Michael Clark对 generalised additive models的介绍,它可以解决非线性问题,或者你也可以尝试转换变量是否有可能使它们之间的关系近似线性。

解决办法

解决 tautological tests的方法也是非常简单。首先,我们应该扪心自问,真的有必要对连续变量进行分类吗?通常一个基于回归的分析是可行的。第二,如果出于某些原因不能执行回归分析,只需记住不要进行这种tautological tests。

A related kind of test use

一个相关的,我们正在使用的显著性检验是,当研究者试图确保刺激或被试在不同条件下是可比的时候。例如,当调查词频对单词记忆的影响时,研究者常常希望确保高频词和低频词在除了词频外的其他属性上保持相似(如,单词长度)。尽管我不会将这种显著性检验称为愚蠢的,但它也不是最理想的做法。 Imai et al. 讨论了使用显著性检验去评估一个匹配程序是否成功,并反对这种做法。关于这个问题在后期会进一步讨论。而当前的关键信息非常简单:显著性检验不适合这种目的。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,711评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,079评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,194评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,089评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,197评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,306评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,338评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,119评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,541评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,846评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,014评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,694评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,322评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,026评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,257评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,863评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,895评论 2 351