为什么说美国大选中的邮寄选票是减少无应答误差的关键?

作者  胡婧炜

无应答误差指由于受访者不作答而导致的收集到的数据值与数据真实值之间的差异。

以上个月的美国总统大选为例,那些迟到的邮寄选票起到了影响选举结果的关键作用:如果它们最终被视作无效票,获胜者可能是共和党候选人特朗普,而不是民主党候选人拜登了。

一部分人是否提交成功了选票(即等同于是否作答)起到了改变选举结果的作用,这就是无应答可能导致的误差。

很多研究者或项目管理者在调查中都追求高应答率(点击阅读如何科学计算应答率?)。一些学术期刊在评审文章时,哪怕是在概率抽样的原则上妥协,都不愿在应答率上妥协。在没有成本限制的情况下,应答率高当然不是坏事。

然而现实情况是,受访者越来越不愿意作答已经成为调查的普遍趋势。应答率的提高,尤其在接近临界值时,往往需要耗费巨大的成本。据统计,美国消费者态度调查(Surveyof Consumer Attitudes,SCA)为了维持70%的应答率,在1979年平均只需要给每个受访者拨打4次电话,而在20年后则平均需要拨打8次电话(Curtin2000)。

时至今日,绝大多数人都会拒绝接听陌生的电话,提高应答率的成本更是可想而知。

所以问题来了,提高应答率的努力是否值得?我们采集数据的一个终极目标是获得准确的估值。我们真正担忧的是无应答导致的误差,而非无应答本身。所以当我们尽一切努力提高应答率时,我们的一个基本前提假设是应答率的提高可以减少无应答误差。但这个假设是否一定成立呢?

图片来源于网络

扑朔迷离:应答率与无应答误差相关吗?

100%的应答率是最完美的状况,如果一项调查的应答率是100%,那么它的无应答误差就是0。而当无应答发生,无应答误差的产生便有了可能。

Peytchev(2013)在美国国家药物使用与健康调查(National Survey on Drug Use and Health)的数据中发现,在使用应答率作为自变量、滥用心理治疗处方药的比例作为因变量的回归分析中,因变量的70%的变动可以归因于自变量即应答率的变动。

而且,在控制了应答率的影响后,年份对于滥用心理治疗处方药的影响作用不再显著了——这意味着药物滥用随年份增加仅仅是表面现象,应答率的变化改变了应答人员的结构,从而导致实际能观察到的滥用药物的比例上升了,但这并不代表研究总体中滥用药物的比例真正随时间发生了改变。

但另一部分人的研究结果却证明了低应答率并不会对数据结果产生影响。Keeter等人(2000)比较了两种不同的调查安排对数据结果的影响:一种调查安排是5天执行期,最后达到的应答率约为37%,另一种调查安排是2个月执行期,最后达到的应答率约为61%。

两种调查安排使用的问卷内容相同,尽管应答率相差甚远,然而两种调查安排下有显著差别的变量却非常少。Curtin等人(2000)的研究也发现了类似的结果。他们使用消费者态度调查(SCA)从1970年到1996年近20年的211次调查的数据来探索应答率对调查结果的影响。消费者态度调查采用的是电访模式,每次随着电话联系次数的增加,应答率不断增加。

假设每次调查访员联系的次数减少,数据的结果会不一样吗?基于这样一种的思路,Curtin等人依次比较了将需要拒访逆转的人从数据集中排除之后(应答率降低5-10个百分点)、将需要联系5次以上才能访问成功的人从数据集中排除之后(应答率降低25个百分点)、将需要联系2次以上的人从数据集中排除之后(应答率降低50个百分点)的一些关键变量的统计结果,发现无论是排除哪一部分人,对最终的统计结果均没有太大的影响。

应答率不是决定无应答误差的唯一因素

事实上,应答率并不是决定无应答误差的唯一因素。

评估无应答误差的常用公式由两部分组成,一部分是无应答率(ms/ns),另一部分是应答者与无应答者在估测变量(通常为一项研究所关注的因变量)上的差异。

举例来说,如果一项调查的应答率是70%,应答者与无应答者在估测变量上的差异是100,那么无应答误差为30(即30%*100);另一项调查的应答率是40%,应答者与无应答者在估测变量上的差异为20,那么无应答误差为12(60%*20)。尽管后一项调查的应答率更低,但是它的无应答误差并没有更高,反而更低。

Goves和Peytcheva(2008)的研究很好的总结了应答率和无应答误差之间的关系。在对59项调查中959项变量的meta-analysis分析中,他们发现无论是高应答率还是低应答率,都可能导致高的无应答误差,也可能导致低的无应答误差。

应答率和无应答误差之间并没有必然的联系(如下图所示)。而且,无应答误差的变化大多数是变量层面的,而非调查项目层面的。

所以,仅仅凭借应答率的高低来判断数据的好坏并不合理。

举个实际的例子,如果我们希望了解全部成年人使用社交媒体的习惯和偏好,即便应答率不断提高,但如果作答的全是年轻人,那我们了解到的情况肯定还是有很大的偏差,因为年轻人和中老年人使用社交媒体的习惯和偏好肯定是不一样的。

相反,如果年轻人和中老年人在使用社交媒体的习惯和偏少上没有太大差异,那么,即便因为没有访问到老年人而导致应答率偏低,对数据结果也不会有太大影响。

总结

应答率因为简单、可操行强,经常被当作评估数据质量好坏的关键指标。然而,综合本章全部的讨论,应答率并不是影响无应答误差的唯一因素。应答者与无应答者在估测变量上的差异也会对无应答误差产生影响。

因此当我们在评估一项调查的数据的好坏时,并不能简单地仅仅靠应答率的高低来做出判断。另外,从成本的角度考虑,如果我们努力提高应答率却不能增加答题人群的多样性,这样的努力很有可能会徒劳无功。

回到文章开头关于美国总统选举的例子,为什么邮寄选票会对选举的结果产生颠覆性的影响?

因为邮寄选票的大多是支持民主党的选民,他们与那些去投票点按时完成投票的选民(支持共和党的选民更偏好去投票点投票)在选举态度上有本质区别,因此如果他们的选票没有成功提交,选举结果就会产生很大的误差。如果这些邮寄选票的选民在选举态度上是完全随机的,那么无论他们的选票是否提交或者是否计数,对选举结果都不会有影响。

【参考文献】

Curtin, Richard, Stanley Presser, and Eleanor Singer. 2000. “The effects of response rate changes on the index of consumer sentiment.” Public Opinion Quarterly 64 (4): 413–28. 

Groves, Robert M. and Emilia Peytcheva. 2008. “The impact of nonresponse rates on nonresponse bias: A meta-analysis.” Public Opinion Quarterly 72 (2): 167–89. 

Keeter, Scott, Carolyn Miller, Andrew Kohut, Robert Groves, and Stanley Presser. 2000. “Consequences of Reducing Nonresponse in a Large National Telephone Survey.” Public Opinion Quarterly 64:125–48. 

Peytchev, Andy. 2013. “Consequences of Survey Nonresponse.” The ANNALS of the American Academy of Political and Social Science 645: 88-111. 

欢迎访问调研家官网,申请免费试用:www.surveyplus.cn

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,576评论 6 515
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,515评论 3 399
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 168,017评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,626评论 1 296
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,625评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,255评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,825评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,729评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,271评论 1 320
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,363评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,498评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,183评论 5 350
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,867评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,338评论 0 24
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,458评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,906评论 3 376
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,507评论 2 359

推荐阅读更多精彩内容

  • 1936年美国正从经济大恐慌中复苏,全国仍有九百万人失业。当年的美国总统大选,由民主党员罗斯福与共和党员兰登进行角...
    LDDYWE阅读 6,811评论 0 0
  • 渐变的面目拼图要我怎么拼? 我是疲乏了还是投降了? 不是不允许自己坠落, 我没有滴水不进的保护膜。 就是害怕变得面...
    闷热当乘凉阅读 4,249评论 0 13
  • 夜莺2517阅读 127,724评论 1 9
  • 版本:ios 1.2.1 亮点: 1.app角标可以实时更新天气温度或选择空气质量,建议处女座就不要选了,不然老想...
    我就是沉沉阅读 6,899评论 1 6
  • 我是一名过去式的高三狗,很可悲,在这三年里我没有恋爱,看着同龄的小伙伴们一对儿一对儿的,我的心不好受。怎么说呢,高...
    小娘纸阅读 3,389评论 4 7