The percentage of words known in a text andreading comprehension
词汇量与阅读理解
Norbert Schmitt,University of Nottingham, UK
XIANGYING JIANG, West Virginia University, WV
Wiliam Grabe,Northern Arizona University
The Modern Language Journal 2011
This study focused on the relationshipbetween percentage of vocabulary known in a text and level of comprehension ofthe same text.本文重点研究文本中已知词汇量的百分比和同一文本的理解水平之间的关系。
核心概念
这篇文章的核心概念是percentage of words known(词汇量百分比)。即:读一篇真实文本,需要知道多少词汇?(需要多大的词汇量?)Laufer(1992)认为:需要3000个词族(词根+屈折变化+派生)。Nation(2000)认为:需要8000-9000个词族。之所以有如此大的差异,其核心概念就是阅读一篇文本所需的词汇量百分比不同。Laufer(1989)估计:95%。Nation(2000)估计:98%-99%。
研究问题
研究问题是,应该首先弄清楚词汇量(词汇覆盖率)和阅读理解之间的关系。过往研究都提出,认识的词汇越多越好。很有可能有一个阈值,超过这一值,阅读理解就很好。低于这个值,阅读理解就不好。过往研究也指出,随着词汇量的增加,阅读理解的效果也在增加,这个关系可能是线性的,也可能不是线性的。所以这篇文章就是在前人基础之上,运用了一种新的方法(加强版)在词汇覆盖率90%——100%之间,描绘这一可能存在的曲线。
文章列举了三个具体的研究问题(P30):
1)词汇量百分比percentage of vocabulary
coverage和阅读理解百分比reading comprehension之间的关系是怎样的?
2)拥有最低限度的词汇量,阅读理解可达到什么程度?
3)文本话题的背景知识熟悉度,如何影响词汇量-阅读理解之间的关系?
被试
1)661人。
(8个国家的12个地区,12种不同的母语。)(中级、高级英语二语者,大一——大四。241男生,420女生,212英语专业,449其他专业。)【最初有980人,在词汇量测试中剔除了测试不合要求者】
2)40名英语母语者(均修习了语言学课程)参与测试,作为对照组。
方法、工具
一个词汇量测试+一个阅读理解测试
1)词汇量测试。
与以往研究使用的“划出不认识的词”这一方法不同,本研究用词表测试。该词表,含120个目标词,都来源于2篇阅读文本。将2篇文本输入词频分析工具,得到2篇文本的共选词和单一文本的词,按等级(1000词频,1000-2000词频,2000以上词频)分段抽取。1000词频的简单抽取(前500词频和后500词频,各取10个词);1000以上的词频,密集抽取,选50%上的词。最终共产生一份包含120个词的测试词表,其间插入一些非词以提高测试准确性。
学习者拿到词表,check自己认识的词。
2)阅读理解测试。
与以往”多项选择MC+书面回忆WR written recall”的方法不同,本研究采用MC + GO fill-in两种测试题型。(GO要求学习者对文本结构、逻辑关系更清楚【题目首先在中国120个大学生中进行了试测,从原始的15道MC+20道GO修订为:14道MC+ 16道GO】
结论
问题一:二者关系?
1)在vocabulary coverage range 90%-100%范围内,二者是线性关系。the more vocabulary coverage, the greaterthe comprehension.
90% vocabularycoverage--- 50% comprehension
100% vocabulary coverage--- 75% comprehension
2)没有阈值一说。There was no
obvious point at which comprehension gradually increased with increasing
vocabulary coverage.除了在93%的词汇覆盖率上,阅读理解有一定的下降之外,数据显示,二者基本成线性关系。这一结论与以往研究一致。本研究表明,对词汇覆盖率的要求,取决于对阅读理解的要求。如果只要求60%的理解,那么95%的词汇覆盖率即可。如果要达到70%的理解,需要98-99%的词汇覆盖率。如果理解的要求时75%,那么学习者应该认识所有的词。当然,这个数字还要取决于阅读文本的情况。
问题二:最低词汇量时,阅读理解的程度?
即使最低词汇量,也能理解一部分。本研究中,90%的词汇覆盖率,可理解50%。Ourlearnerswere able to comprehendaconsiderable amount of information in a text,even with low levelof vocabulary coverage.In this study,at 90% vocabulary coverage,learners couldanswer
50%of the reading comprehension items correctly.
问题三:背景知识对这一关系的影响?
At anyparticular vocabulary coverage percentage, increase their comprehension.在任一词汇覆盖率上,背景知识都能提升阅读理解程度。本研究中,从94% vocabulary coverage开始,除了词汇量,background knowledge确实有助于阅读理解。】
启示
1)与过往研究相比,本研究有所扩大、增强:直接比较词汇量和阅读理解;词汇量测试方法、阅读理解测试方法、参与者人数。
2)重新认识词汇量与阅读理解的关系:线性的而非有阈值的。
3)在本研究特定的阅读任务中,从92%到100%的词汇量覆盖率范围内,词汇量每增加1%,阅读理解就增强2.3%。线性关系这一结论也是可靠的。原因:被试人数规模大;词汇量测试词汇抽取合理,排除了其他因素干扰。
阅读理解的提升,还需要综合考量其他很多因素,如阅读目的等。
4)即使达到100%的词汇覆盖率,阅读理解也不能达到100%,词汇量只是一个方面。但又是非常重要的一方面。
5)学术性阅读文本时,词汇知识很重要。要想达到60%的理解程度,就需要98%的词汇量覆盖率,这与Nation2006的研究相一致,即需要8000-9000个词族。
6)本研究还表明,两种文本的阅读理解与词汇量覆盖率关系是一致的。(94%——100%,仅在95%时有下降)
7)词汇量测量的方法更合理。阅读理解测试GO fill-in更能测量读者对文本整体结构、逻辑关系的理解。
8)下一步,可以研究更适用于教学的阅读文本所需的词汇覆盖量,例如,如果学生的初始词汇量只有85%,能否在有教学辅助的情境下,读懂一篇文章?(本研究是读者独自阅读情境。)又例如,教学文本的词汇量覆盖率目标是不是90%-95%?