【摘 要】新推出的一年两考高考英语试卷将取消短文改错题,增加读后续写题。本文阐述了读后续写题的理论基础、试题和评分标准设计,并采用定性与定量相结合的研究方法验证了读后续写试题的信度、效度、难度、区分度和可操作性,证实了该试题的可行性。
【关键词】高考英语;写作;读后续写
一、引言
作为高考综合改革试点省市,浙江和上海将启动外语科目一年两次考试,这是高考考试形式的一次重要改革。此次考试招生制度改革的另一项任务则是深化高考考试内容改革,即在实现考试形式改革的同时进一步改进高考各学科考试内容。高考英语科引进读后续写就是在这一认识的基础上进行的。读后续写试题将于2016年用于高考综合改革试点省份的高考中,之后将随着高考综合改革试点的推广在全国范围内使用。
作为高利害考试,高考考试内容和形式的任何变动都会引起社会的极大关注。在对考试进行改革前,考试研究人员势必会进行相应的实证性研究,征求各方意见,以确保考试推出后能具有必需的信度、效度和难度,圆满完成为高校选拔优秀人才和促进中学教学的任务。本文中,作者拟简述引进读后续写题过程中在理论和实践层面的思考,并就相关实证性研究结果进行讨论。
二、理论基础
基于Pickering & Garrod(2004)提出的互动协同模式(Interactive Alignment Model),王初明(2011)提出了外语学习的有效途径:互动→理解→协同→产出→习得。他认为学习者的理解能力总是超出其产出能力,两者间的不平衡会产生拉平效应,较弱的产出能力在与理解能力的互动、协同过程中会不断提高。王敏和王初明(2014)总结了针对英语专业二年级学生的实证性研究结果并指出:读后续写过程中存在协同效应,协同效应可强化或扩张学习者的语言表征,帮助他们把从阅读理解中获取的词汇、语法信息应用于续写当中,由此提高语言运用能力。王初明(2012)指出,读后续写是结合阅读理解进行写作练习的一种方法,是提高外语学习效率的好方法。
读后续写与目前语言教学和测试界倡导的综合性测试模式相吻合。Carroll(1961)及其他学者提出了综合性语言测试的概念,认为测试应关注语言的整体交际效果,而非特定的结构或词汇;Davies等(1995)将综合性语言测试定义为综合若干语言成分的测试,因为这类测试在考查说和写技能的同时考查理解和听的技能。各种模式相结合是语言活动的本来面目。在这一理论的指导下,国际上某些外语类考试开始引进一些听写或读写结合的题型,主要是边听边记录关键信息,将书信、短文作为写作的输入材料;某些考试则要求以听到和读到的材料为基础完成短文写作。然而,长期以来,人们对这种综合性试题一直存有争论,主要是质疑关于写作能力的推论,认为写作成绩较差有可能是因为没有读懂阅读材料。而读后续写可以通过控制阅读材料的类型和难度来解决这一问题,能够清楚地反映出学生的英语写作水平,而且会对英语教学产生良好的促进作用,颇有研究和应用价值。
三、读后续写题的设计
1. 测试目的和内容
读后续写是一种将阅读与写作紧密结合的考查形式,旨在考查学生的综合语言运用能力,主要聚焦在以下四个方面:
一是把握短文关键信息和语言特点的能力。学生需要了解给定短文的主要内容,清楚其关键词和语言结构的使用情况,并通过续写短文表现出来。
二是语言运用的准确性和丰富性。期望学生在词汇和语言结构的使用方面准确、恰当,能够根据内容需要使用较多、较复杂的词汇和语言结构。
三是对语篇结构的把控能力。考查学生对上下文逻辑关系的掌握情况,希望学生续写的短文语句连贯、有序。
四是创造性思维能力。这是对学生续写短文内容的要求,期望学生续写的短文具有较丰富的内容。该试题具有一定的开放性,要求学生详细和生动地描述情景、态度和感情(教育部,2003),符合课程标准的要求和学生的能力水平。
2. 语篇选择
王初明(2012)认为,读后续写中的阅读材料会影响考生的续写表现,材料选得好可直接产生良性学习效应。在设计读后续写时应注意:阅读材料要有趣,内容能延伸;难度要适当,易于理解和模仿;长度应适宜,有丰富的内容。在常见的阅读材料中,说明文和议论文难以符合有趣的原则,且往往要求学生对阅读材料的主题有一定的背景知识,能够产出内容丰富、具有一定说服力的语言材料。对于高中毕业生而言,这样的要求显然偏高。此外,英语考试主要关注学生的语言能力,而非知识面和思辨能力,因此这两种文体不宜用于高考英语的读后续写中。相比而言,记叙文话题一般更贴近生活,有一定趣味性,给学生的想象空间较大,上下文连贯性较强,语言难度较易把握,更适合用于高考英语的读后续写中。值得注意的是,用于大规模、高利害的考试中时,读后续写选取的阅读材料一定要使不同水平、背景的考生都能找到自己的切入点,有内容可写。
3. 答题要求
出于督促考生现场原创和控制评分误差的考虑,设计试题时宜对考生的答题提出一些限制性要求。比如,可以要求考生续写时运用所给短文中标有下划线的词语,或在给定段首句的基础上完成短文续写。作为高利害考试,高考必须采取措施防止事先背诵后的“套写”,同时对产出内容进行适当限制,以保障考试评卷的准确性和科学性。标有下划线的单词或词组可以是阅读材料中的关键词,也可以是原作者使用的比较地道和有特色的表达;段首句可以是原材料所省去段落的第一句话,也可以是命题人根据故事情节发展拟定的一句话。又如,可以要求考生在规定词数内完成短文续写。在教学中进行读后续写练习时,应当鼓励学生多写,写得越长越好(王初明,2012),这有利于培养学生的创造性思维能力和语言表达能力。但在考试中,由于时间有限,需要对考生产出内容的长度加以限制。
4. 评分标准设计
Weigle(2002)认为,评分标准和各档次分值描述语的制订对于写作构念的测量和确保考试效度至关重要,因为它或明确或隐含地代表着考试设计的理论基础,会充分体现考试设计者期望测量的技能或能力。Bachman(1990)强调,评分标准必须清楚、准确,能使评卷人员清楚地区分不同的等级,以保证评分的信度。读后续写为读写结合性试题,考查考生在阅读基础上的写作能力,其评分标准的制订应该充分体现这方面的特点,可以具体落实在评分要点、分数分配和评分方法的确定中。
基于读后续写题读写结合的特点和评分标准的要求,设计人员初步确定以下四项内容为读后续写的评分要点:(1)与所给短文及段落开头语的衔接程度;(2)内容的丰富性和对所标出关键词语的应用情况;(3)应用语法结构和词汇的丰富性和准确性;(4)上下文的连贯性。
试题赋分由试题在试卷中的权重决定,与考生完成试题所耗费的时间密切相关。读后续写需要考生在阅读理解的基础上创造性地写作,试题的复杂性比应用文稍高一些,要求考生投入的时间和精力自然也要稍多一些。在充分考虑这些特点以及整个试卷各个部分的分数权重后,设计人员决定赋予读后续写25分的分值(试卷总分为150分)。
写作的评分方法主要分为两种:一种是整体评分法,即阅卷人通读考生写出的材料后给出一个总体分数;另一种是分项评分法,即阅卷人从不同的视角评阅考生写出的材料,如语言的准确性、语言的丰富性、上下文的连贯性等,分别给出分数。两种评分方法各有利弊 (刘庆思,2009)。高考阅卷时间紧、任务重,读后续写的评阅宜采用整体评分法。但为确保阅卷人准确理解评分标准,保证试卷评阅的准确性,在对其进行培训时可以引入分项评分的概念。因此,既需要为读后续写制订整体评分标准,也需要制订分项的评分要求。
5. 预期的后效作用
考试设计者和研究人员日益关心考试的后效作用,Alderson在为Cheng等(2004)的书作序时指出,考试的后效和反拨作用已经成为教育测量领域的一项核心研究内容。Bachman(2010)更是将后效放在测试开发框架的首要位置,指出测试设计人员在开发一项测试之前就要先预估后效。测试领域的关注焦点从信度转到效度再到后效的变迁是社会进步的表现,也是考试发展的必然(杨惠中,2015)。
引进读后续写是期望引起对综合语言运用能力发展的关注,帮助提高外语教学和学习的效率。考试是对教学的检测,同时服务于教学。选好并用对题型是测试产生正面反拨作用的一项基本保证;读后续写是旨在加速提高学生语言运用能力的方法(王初明、亓鲁霞,2013),期望它能够促进学生写作能力的提升。
四、针对读后续写题进行的验证性研究
为检查读后续写题在实际应用中的情况,研究人员将命制好的试题编成一套试卷(包括两篇阅读理解、一篇完形填空、一篇语法填空、一道应用文写作和一道读后续写题),在四个省十所不同水平的中学中进行了试测,1180名高三学生参加了试测。学生答卷结束后填写了调查问卷,回答完成续写所需的时间、写作策略的使用、题型理解和题型检测构念等问题。32位中学教师在经过培训后,参加了试卷评阅工作,填写了教师调查问卷;评卷结束后,研究人员对其中的13位评卷教师就题型构念、题目难度、学生表现、评分情况和可能的反拨效应等方面的问题进行了访谈。研究人员对收集到的各类数据进行了定量和定性相结合的统计分析,探究读后续写试题的难度、区分度、信度、效度和可操作性。
1. 试题的难度
学生的问卷调查结果显示,77%的学生认为读后续写比他们所熟悉的应用文写作难,接受访谈的教师也普遍认为读后续写较难。原因主要有以下两个:一是题型较新,从未进行过训练,学生和教师不熟悉;二是读写结合的题型在SOLO分类法体系中属于关联结构的认知层次或者更高,学生需理解并能通过语言产出延续信息间的关系,是较高能力级别的试题。试测结果表明,读后续写的难度为0.55,明显高于应用文写作的难度(0.67)。
研究人员根据罗少茜(2009)的任务型语言测试任务难度框架中的信息、语言、能力表现条件、支持四个维度共13个难度因素对测试中使用的应用文写作和读后续写进行难度评分。最低难度为0分,最高难度为39分。评分结果显示,应用文写作的难度为9.67,而读后续写的难度为27。
2. 试题的区分度和信度
使用多面Rasch模型对学生层面进行分析后发现,学生能力值基本呈正态分布,全距为8.43 logits,跨度较大,说明试题能较好地区分不同水平学生的写作能力。学生平均能力为-0.27,标准差为2.39;标准误的平均值为0.44,标准差为0.47;分隔系数为3.62,分隔信度为0.93,说明此次分数的差异源自学生能力的差异,而非测量误差,试题测量信度较高。
3. 试题的效度
相关分析表明,读后续写与应用文写作的相关系数达到0.698,与完形填空的相关系数为0.518,与阅读理解的相关系数为0.443,均具显著性意义。但即使与应用文写作重合的方差也不足49%,说明该题所考查内容明显有别于其他试题。对学生的问卷调查显示,93%的学生认为读后续写既考查写作能力,也考查阅读理解能力和逻辑思维能力。评卷教师认为,针对读后续写题,表达能力非常重要,阅读能力是基础,发散性思维能力也起到一定的作用。
接受访谈的教师反映,进行读后续写时,学生有内容可写,非常感兴趣;此类练习容易进行,有利于培养学生关注语篇、模仿语言的能力;能够同时锻炼学生的写作、阅读和逻辑思维能力,有助于综合语言运用能力的发展,具有很好的后效作用。
4. 试题的解答与评阅
问卷调查结果显示,69.8%的学生可以在30分钟内完成读后续写,符合设计预期。使用多面Rasch模型对评分员层面和评分量表层面进行分析的结果表明,评分员的评分与模型的拟合度较好,评分可信。评分教师基本使用了评分量表上的所有分值,这一方面说明样本学生离散程度较高,另一方面也说明量表有利于教师对学生的答卷进行评判。
五、对中学英语教学的启示
《普通高中英语课程标准(实验)》(教育部,2003)在基本理念部分明确指出:“高中英语课程应……着重提高学生用英语获取信息、处理信息、分析和解决问题的能力;逐步培养学生用英语进行思维和表达的能力;为学生进一步学习和发展创造必要的条件。”读后续写呼应了课程标准提出的这一理念,并且将获取信息和处理信息与用英语思维和表达紧密结合起来,这一举措有助于促进学生综合语言运用能力的发展,为其进一步的学习和发展奠定基础。中学英语教学和评测从读后续写的研发和操作中可以得到以下几点启示:
1.将写作与阅读教学结合进行是提高学生英语写作能力的有效途径
读后续写是测试手段,也是一种学习方法,教师在日常教学中可以引导学生在阅读时认真分析文本内容和语言,并将分析结果应用于之后的续写中,帮助学生通过语言模仿和内容创新不断提高自己的写作能力。读后续写的操作简单易行,任何难度适宜、内容恰当的短文都可以作为读后续写的素材。但需要注意的是,在日常练习中不要设置段首句、关键词或续写词数等的限制,而应鼓励学生主动思考、自主表达,充分发挥和展示自己的语言运用能力。
2.应关注学生综合语言运用能力的培养
语言是一个有机的整体,现实生活中语言使用的情景也往往是多模态并存。语言教学应该适当地回归语言的本来面目,引导学生关注语言的整体性,注意听、说、读、写技能之间的内在联系,重视语言的真实性,着力培养学生多技能综合的语言运用能力。
3.进行读后续写的练习时宜鼓励学生主动、积极表达
在内容方面应允许学生大胆构想,在语言方面应鼓励学生模仿原文用词和语言结构。对学生练习中出现的语言错误可指出,但不要过分追究。
六、结论
读后续写得到了语言习得理论的支撑,呼应了外语考试对综合语言运用能力考查的诉求,并且经过了实证性研究的验证,能够有效地以考促学,对外语教学有着非常积极的后效作用,适合用于高考这样的高利害考试。
关于试题难度较高的问题,将会随着考生对题型的熟悉及适量的训练得到一定程度的缓解。此外,通过控制语篇内容,选择所需关键词和确定段首句,也可以达到降低试题难度的目的。
然而,读后续写这一题型毕竟是在世界范围内首次应用于大规模的高利害考试,还需要在实践测试中不断改革和完善。
本文作者声明:未经本人及北京师范大学中小学外语教学编辑部书面同意,任何媒体不得转载或摘编本文。
——————————
参考文献
Bachman, L. F. 1990. Fundamental Considerations in Language Testing [M]. Oxford: Oxford University Press.
Bachman, L. F. 2010. Language Assessment in Practice [M]. Oxford: Oxford University Press.
Carroll, J. B. 1961. Fundamental Considerations in Testing for English Language Proficiency of Foreign Students [M]. Washington, DC: Testing Center for Applied Linguistics.
Cheng, L., Watanabe, Y., & Curtis, A. 2004. Washback in Language Testing: Research Contexts and Methods [M]. Mahwah, NJ: Lawrence Erlbaum.
Davies, et al. 1995. Dictionary of Language Testing [M]. Cambridge: Cambridge University Press.
Pickering, M. J. & Garrod, S. 2004. Towards a mechanistic psychology of dialogue [J]. Behavioral and Brain Sciences, 27(2): 169-226.
Weigle, S. 2002. Assessing Writing [M]. Cambridge: Cambridge University Press.
教育部. 2003. 普通高中英语课程标准(实验)[M]. 北京:人民教育出版社.
刘庆思. 2009. 关于中学生英语作文评判方法的思考[J]. 中小学外语教学(中学篇), (3):1-4.
罗少茜. 2009. 任务型语言测试中的任务难度研究[M]. 上海:上海外语教育出版社.
王初明. 2011. 外语教学三大情节与语言习得有效路径[J]. 外语教学与研究,(4):540-549.
王初明. 2012. 读后续写——提高外语学习效率的一种有效方法[J]. 外语界,(5):1-7.
王初明,亓鲁霞. 2013. 读后续写题型研究[J]. 外语教学与研究,(5):707-718.
王敏,王初明. 2014. 读后续写的协同效应[J]. 现代外语,(8):501-512.
杨惠中. 2015. 有效测试、有效教学、有效使用[J]. 外国语,(1):2-26.
——————————
注:本研究得到了北京师范大学外文学院教育测量研究所的大力支持,在此表示感谢。
附作者信息:刘庆思 陈康 教育部考试中心