【摘 要】综合性测试题是考查学生综合运用英语解决问题的能力水平与核心素养成就表现的载体。本文分析了新课标理念下综合性测试题综合性、真实性、实践性和开放性的特征,提出了确定考查目标、明确任务形式、精选命题情境、设置任务问题和规划评分标准的综合性测试题的命制路径。
【关键词】综合性测试题;试题命制;评价;新课标
随着《义务教育英语课程标准(2022年版)》(教育部,2022;以下简称《新课标》)的实施,英语学科各类考试命题已经从关注知识和能力转向关注学科核心素养。《新课标》明确要求“命制的测试题目应紧密联系社会实际和学生的生活、学习经验,符合学生身心发展特点和认知水平,重点考查学生的价值观、文化意识、思维过程,以及综合运用英语解决问题的能力水平和成就表现”(教育部,2022)。《教育部关于加强初中学业水平考试命题工作的意见》 提出,“试题命制既要注重考查基础知识、基本技能,还要注重考查思维过程、创新意识和分析问题、解决问题的能力。结合不同学科特点,合理设置试题结构,减少机械记忆试题和客观性试题比例,提高探究性、开放性、综合性试题比例”(教育部,2019)。考查学生的核心素养以及综合运用英语解决问题的能力已成为测试的目标和趋势。
目前各类考试中考查学生单一技能的题型较多,如听后、读后选择正确选项似乎是各类考试的必备题型。但在真实生活中,人们很少使用单一的语言技能进行交际。“注重考查单项语言知识或语言技能的分离式试题被认为不足以考查考生的真实语言运用能力”(赵连杰,2022)。《新课标》的要求需要英语教师思考并开发与其理念一致的考查方式。
一、核心概念的理解
《新课标》明确提出“具体试题的命制,要依据学业质量标准”(教育部,2022)的试题命制要求。可见,学业质量标准是试题命制的依据。要命制好试题必须理解学业质量标准的相关要求。
1. 学业质量标准
“英语学业质量标准以学生在语言能力、文化意识、思维品质和学习能力等方面的核心素养及其学段目标为基础,结合英语课程的内容和学生英语学习的进阶情况,从学习结果的角度描述各学段学业成就的典型表现”(教育部,2022)。核心素养是学生在解决真实生活中的问题或完成真实情境中的任务时表现出来的综合素养,也就是说,由学生在解决问题或完成任务过程中的综合表现可以推测出学生的核心素养水平。通过对学业质量标准概括性和条目式描述的研读发现,学业质量标准不仅涵盖了语境和主题范围,还包括了需要使用的知识、策略以及需要完成的任务。学业质量标准各项指标的描述没有单一的技能刻画,而是呈现一定的综合性(马黎,2024)。学业质量标准描述的综合性特征从侧面体现了学业质量标准对学生学业成就表现的综合性要求,这也使考查综合性技能的试题研究成为必然。
2.综合性测试题
“选择与测评内容相适应的测评形式,使之能够考查学生综合运用英语理解和表达意义、解决问题的过程和结果,以及在此过程中所体现的语言能力、文化意识、思维品质和学习能力及其水平,确保测评能准确考查学生的价值观、必备品格和关键能力”(教育部,2022)。显然,《新课标》对学生语言测评的要求已经从综合语言运用能力转向了综合考查由语言能力、文化意识、思维品质和学习能力等多个维度组成的核心素养。这就意味着试题不仅要考查学生的综合语言运用能力,还需要显性或隐性地检测学生的文化意识、思维品质和学习能力。“试题的综合性重点考查学生能否综合运用英语的思维方法,合理调动、组织不同的知识与能力,高质量地应对真实生活实践或学习探索中较为复杂的问题情境来解决问题”(王蔷等,2024)。“综合测试(integrative test)中的综合性试题与语言使用的真实过程相似,能够统摄语言知识、语言技能、文化知识、方法策略等英语学科知识与技能”(赵连杰,2022)。从定义可以看出,综合性测试题属于综合性测试中的一种题型,综合性测试题不是简单地将多种语言知识和技能糅合在一起的拼盘式考查,而是基于测试目标和相关级别学业质量标准的要求,在真实的语言情境中设计融合听、说、读、看、写多种语言技能的综合性任务,全面考查学生在完成任务和解决真实情境问题的过程中体现出的包含语言能力、文化意识、思维品质和学习能力在内的英语学科核心素养。常见的综合性测试题形式有听说、听写、听看说、看写、读写等同时涉及听、说、读、看、写中两种或两种以上语言技能测试目标的试题。
培育学生的核心素养是英语课程的核心理念,也是课程的总目标。核心素养的基本要素包含了英语学科的知识与技能、价值观以及运用学科知识与技能解决问题的意识和能力等方面的内容。综合性测试题体现了英语课程的核心素养导向,即考查学生用所学英语解决现实生活问题的能力。这样的考查有助于引导学生借助真实情境,将学科知识和技能与真实生活相联系,将零散的知识和碎片化的技能整合,形成对问题的整体认识,从而应对真实情境的挑战并解决新问题,促进核心素养的发展。这类试题会引导教师在日常教学中从关注单一技能走向注重学生解决真实问题的综合素养,并以此有效引导教师教学方式和学生学习方式的变革,真正将《新课标》的理念在课堂教学中落地。
二、英语综合性测试题的特征
命制综合性测试题首先必须明确该类试题的基本特征,笔者认真研读了《新课标》和测试的相关理论,结合自身试题命制经验认为综合性测试题应具有以下几个特征:
1. 综合性
综合性测试题不是仅把听、说、读、看、写等技能拼在一起,而是“把指向语言运用的诸多知识和技能的考查进行交叉融合,关注学生在真实的语言运用情境中分析和解决问题的能力”(赵连杰,2022)。这类试题可以突破以往测试中听力、口语、阅读和写作固有板块的限制,以解决真实生活问题为线索,考查学生在具体语境中能否运用所学语言知识和语言技能有效解决问题,以及在解决问题的过程中体现了怎样的情感态度和价值观。综合性强调“学生将语言能力与正确价值观以及跨学科的知识、技能、素质整合融通,并用以解决实际问题的综合品质”(梅德明、王蔷,2022)。例如,学生看电影后写简短影评、读文学作品后写读书笔记是常见的看写、读写形式的综合性活动,这类需要多种技能和不同维度素养的任务在学生的真实生活中很常见,这样的综合性测试题可以引导学生意识到英语在生活实际中的作用,改变学生认为学英语就是为了考试的观念。
2. 真实性
由于综合性测试题指向学生在实际生活中解决问题的能力,因此需要将所考查的知识和技能与真实生活中的实际问题相联系,让学生感受到英语学习与生活实际密切相关。这里的真实性不仅是学生生活中已经发生的,也可以是未来可能发生的并具有一定意义的情境。例如,听写结合形式的综合性测试题通常要求学生听一段打电话的对话,并记录电话中如预订酒店、转述重要信息等真实生活中有可能发生的或很常见的真实任务。这样真实的综合性测试题使学生在解决问题的过程中调动包括情感态度、价值观、学习策略等在内的必备品格和素养,进而覆盖到评价核心素养的整体表现。
3.实践性
核心素养通俗地理解就是在用英语做事的过程中外显的语言能力、文化意识、思维品质、学习能力等综合表现,做事也就是实践。因此,综合性测试题的考查本质是指向实践,即在真实的情境中综合运用英语。解答这类试题不是靠罗列知识点或多种技能,也不是简单地重组信息或翻译中文提示,而是针对试题设计的问题或任务进行分析,并在分析的基础上通过综合已有知识和技能尝试解决问题。学生通过解决问题重新建构已有的知识和技能,形成对需要解决问题的整体认识。综合性测试题引导学生将核心素养中的语言能力、文化意识、思维品质和学习能力融会贯通,并在真实生活情境中实践,从而解决真实生活情境中的问题。例如,针对一篇有关体验式旅行的阅读材料,依据学业质量标准三级的3-7“在阅读稍长的语篇材料时,能理解主要内容,推断隐含信息,表达个人看法,提出合理疑问,分析和解决问题”(教育部,2022)的要求,可设计以下读写形式的综合性测试题:Think of an experiential trip someone can take in Nanjing. Remember to include the location of the trip and the activities visitors can do. Your answer should be in no more than 30 words. 学生要完成这个任务必须在理解阅读材料的基础上将所读内容与生活经验相结合去解决真实问题,该任务体现了语言学习的实践性。
4. 开放性
综合性测试题把对指向语言运用的不同知识、技能和素养的考查进行交叉融合,关注学生在真实情境中分析和解决问题的能力。即使在同一个真实的语言情境中,学生体验和分析问题、解决问题的方式不可能完全一样,因此,综合性测试题的答案不唯一。综合性测试题的开放性旨在培养学生在答题中独立思考、主动质疑的思辨能力,考查学生思维的多元性,特别是学生在答题中能依据自身的认知体验,从多层面和多维度给出符合题意和逻辑自洽的多样性回答。
三、新课标理念下英语综合性测试题的命制路径
试题命制的关键是要在了解题型功能的基础上,根据具体情况选择特定的题型。综合性测试题突破了对英语学科单一知识或技能的考查,以解决真实生活中的问题或完成真实生活中的任务为核心,在解决问题的过程中考查学生的素养。依据《新课标》的要求、综合性测试题的特点和自身的命题经验,笔者认为综合性测试题的命制路径有以下几个步骤:
1. 依据课标要求,确定考查目标
“所谓考查目标,就是考试希望考查的内容。不同的考试有不同的考试目标,同一份试卷的不同组成部分也有不同的考试目标”(程晓堂,2025)。测试“要依据课程目标、课程内容、教学建议和学业质量标准等命题”(教育部,2022)。综合性测试题的考查目标首先应该落实立德树人的根本任务,以发展学生核心素养为目标,体现对学生核心素养四要素融合发展的考查。其次,考查目标应该符合《新课标》中学业质量标准的相关要求,但对具体的试题来说,考查目标会因为学业质量描述的侧重点不同而有所侧重。例如,对应三级(7~9年级)学业质量标准3-1“能听懂相关主题的语篇,借助关键词句、图片等复述语篇内容”(教育部,2022)的听说或听写形式的综合性测试题,侧重考查学生听力理解及运用所听信息完成说或写的任务的能力,而对应3-6“能运用一定的阅读策略,借助表格、思维导图等工具梳理书面语篇的主要信息,理解大意”(教育部,2022)的读写形式的综合性试题,侧重考查学生阅读语篇后根据语篇信息完成写的任务的能力。原则上,学业质量标准是确定综合性测试题考查目标的重要依据,但由于学业质量标准没有细分到每个年级的要求,如三级学业质量标准覆盖的是7~9年级,因此在不同年级的学业评价中,教师不仅需要参照学业质量标准,还要综合《新课标》的课程目标、课程内容、教学建议等确定考查目标。例如,《新课标》三级(7~9年级)学业质量标准3-7的描述中提出了“分析和解决问题”(教育部,2022)的要求,而《新课标》课程内容的三级语言技能内容要求中只有在九年级理解性技能中明确提出“建立语篇与语篇、语篇与个人、语篇与世界的关联,探究和发现语篇的现实意义”(教育部,2022)的要求,这一要求与学业质量标准3-7描述中的“分析和解决问题”相契合。根据这样的分析,依据学业质量标准3-7的描述,对九年级学生开展阅读语篇材料后分析问题和解决问题能力的检测更合适。在九年级下学期的纸笔测试中,笔者将其中一个考查目标确定为阅读语篇后运用语篇信息分析和解决真实情境问题。当然,通常情况下,针对一篇阅读材料可以设计包括理解主要信息、推测隐含信息、分析解决问题等不同思维层次的试题,而分析和解决问题应该是考查学生高层次思维能力的试题。
2. 基于考查目标,明确任务形式
试题的任务是测试的考查载体,直接关系到能否实现考查目标。综合性测试题的任务是在考试中模拟语言使用的真实情况,将听、说、读、看、写等技能和不同的素养有机结合起来。任务涉及的技能或素养不止一种,可能是多种技能或素养的融合。不同的考查目标需要不同的任务形式来实现,这里的任务是学生在模拟情境中所要完成的任务,如听对话后填表格的题目要求不是简单的Listen and fill in the form,而是Listen and take notes to share with your classmates。这样的任务指令可以使学生在测试中感觉不是在做题,而是在完成生活中的真实任务。任务的形式决定试题的形式以及如何综合运用几种技能,如听讲座后整理讲座内容并在班会上与同学分享,就综合了听、写、说三种技能,但如果没有在班会上与同学分享,这个任务则综合了听和写两种技能。
在生活实际中,能体现阅读语篇后运用语篇信息解决真实情境问题这一考查目标的任务形式可能有读说或读写,但纸笔测试的形式限定了任务形式只能是读写结合。读写结合试题是英语测试中的常见题型,通常是阅读语篇后完成相关写的任务,主要考查学生对语篇的理解能力以及对语篇内容进行有选择的、整合性的输出能力。读写结合综合性测试题的呈现形式有读后回答问题、读后填写表格、读后续写、读后写摘要等。
3.根据整卷布局,精选命题情境
英语学科的语言特征使测试中“命题情境不仅包括试题的任务情境,还应包含试题素材本身创设的主题语境”(赵连杰,2021)。笔者将试题素材本身创设的主题语境理解为试题的素材情境。试题的素材情境首先需体现社会主义核心价值观、弘扬中华优秀传统文化等符合《新课标》价值取向的内容。考虑到试题素材情境在整卷中的布局,还应涉及人与自我、人与社会和人与自然三大主题范畴且涵盖多个子主题内容。在单元测试中通常会选择与单元主题一致的素材情境,以拓展学生对单元主题的探究。试题的任务情境指试题所设置的学生完成测试任务的情境。任务情境的设计应符合测试构念,符合试题涉及的学科知识、技能内容领域以及学生对试题背景材料的理解能力。综合性测试题的任务除了尽量真实外,还应为考查学生的综合能力提供可能的情境。命制试题时应根据测试的构念,思考真实生活中完成某项任务所需要的技能和应具备的素养,并结合真实生活中解决问题的方式推测学生在完成任务的过程中可能表现出的语言知识、语言技能、文化知识、学习策略、思维品质等核心素养。例如,笔者在一次测试中确定了任务形式为读写综合性试题后, 设计了真实生活中常见的学生阅读某语篇后通过海报与同学分享阅读内容的任务情境,并选取了以下测试语篇:
Ella Dove's first children's book, How to Roller-Skate with One Leg, is an inspiring and uplifting story that celebrates friendship, family and overcoming challenges. In the book we meet 12-year-old Maya Bright who has lost her leg after a road accident on her way to school. Dove is a writer and reporter who lost her right leg aged 25 following a running accident. During her recovery, Dove kept a diary about her experiences and decided that she wanted to help others through her writing, and change people's ideas about what it's like to be an amputee. Dove says, “I chose roller-skating as the activity that my character learns to do because it's one of the things where you'd be like, ‘you've got one leg, you can't do that!'”...
(因篇幅原因文章后续内容略。)
从试题的素材情境看,语篇介绍了作家Ella Dove写的How to Roller-skate with One Leg一书的主要内容、作家创造主人公Maya Bright的原因以及Maya Bright身残志坚的励志故事。语篇内容对学生的人生观和价值观,特别是遇到挫折后选择积极的人生态度具有正面的引导作用,很好地体现了英语学科的育人价值。语篇中的主人公Maya Bright与初中生年龄相仿,学生在生活中也会遇到不少困难,因此语篇所提供的素材情境比较容易迁移到学生的真实生活情境中。从测试目标看,读写结合的综合性试题可以从语篇层面综合考查学生的理解性技能和表达性技能,而不同小题的设计可以从不同层级考查学生的阅读表达能力。考虑到语篇是对书的介绍,因此将试题的任务情境设计为学生校园生活中常见的“每周一书”的介绍,即学生根据所读材料完成班级活动中“每周一书”的介绍。试题素材情境和任务情境的融合使试题可以兼顾对学生思维品质、文化意识和正确价值观念的考查。
4. 依据命题情境,设置任务和问题
“情境和问题不仅是学习的有效载体,也是考试命题过程中需要考虑的关键要素”(程晓堂,2025)。核心素养是在解决真实情境问题的过程中培养的,“将拟要学生解决的问题内嵌到具体的情境中,即试题本身要明确指出基于理解性技能和表达性技能拟要解决的问题是什么”(赵连杰,2022)。真实任务中的问题设计需与情境素材紧密联系,指向核心素养的要求,但问题不等同于试卷中的题目,试题引发的学生作答反应需指向特定语言情境下完成任务或解决问题的目标,而不是仅仅答题。在试题的呈现方式上应尽量多样化,可以是文字、表格、图画或这几种形式的有机结合。试题设计需依据测试构念思考考查综合技能和多种素养的可能,如同样是招聘广告类素材,让学生读后选择是考查学生单一的阅读技能,但如果改为阅读广告后推荐适当的人选,就成了读写综合性试题。
例如,在“每周一书”推荐任务中,可根据语篇的特点设计以下任务: Read the passage and make a “Book of the Week” for your classmates.
任务设计包含了真实的推荐“每周一书”必需的内容:作者、主人公、推荐理由(见表1)。考虑到分析和解决问题的考查目标,还设计了学生读后可以依据语篇内容迁移到真实情境中的开放性问题:Introduce someone whose qualities are similar to Maya's in at least 20 words. You should show his/her qualities with supporting details. 通过推荐任务中的多个试题体现三级(7~9年级)学业质量标准中3-5、3-6、3-7的要求,学生在理解阅读材料的同时,需要分析和解决不同思维层次的问题,特别是第9小题的表达部分要求学生做到基于语篇又超越语篇,考查了学生理解语篇后联系自身经历理性表达观点、情感和态度以及创造性地解决问题的能力。这样的试题不仅要求学生具备阅读理解能力,还鼓励学生灵活思考问题,考查他们评价、创新的高阶思维能力和分析、解决问题的能力。
表1“每周一书”的推荐

5. 分析试题答案,规划评分标准
考试的结果都需要根据一定的评分标准加以评判,评分标准是否科学、合理直接影响考试的信度、效度和可行性。评分标准的设计是考试设计的重要组成部分,特别是综合性测试题大多是非选择题,这类题目的答案通常分为两种:一种是在试题的语篇中可以找到,答案基本是固定的,评分标准就是答案。另一种是无法从语篇中找到,答案往往因考生的个体情况而异,这就需要命题者根据考试构念决定评分标准的内容和范围。
综合性测试题任务的特殊性使评分标准的制定必须考虑试题综合性的特点,既要考虑依据课标设置的赋分点的开放度,也要考虑阅卷过程的实际操作性。综合的技能不一样(如说和写、听和写、读和写),评分标准包含的项目内容就会不一样。笔者认为评分中需要把握以下几点:
第一,对单词拼写错误的评判,原则上在评分中是零容忍的;但在综合性测试题中,如果试题考查的是听写技能,如听对话或独白后完成信息表,考生拼错了个别字母,但从语音的发音规则来看是可接受的拼写,这时应该给部分分数。如对话中出现cake一词,学生听后写成kake或ckake,尽管英语中没有这个单词,但仅从发音规则上看c、ck、k都可以发/k/音,这时学生可以得部分分数。但如果这样的情况发生在读写综合题中,学生读后写出了错误的单词,无论这个单词是否在语篇信息中出现,笔者认为都不应接受,因为影响了交际。
第二,对答案是单句或语段的开放性试题,建议根据考试构念将答案的要求从内容、语言等多方面进行细化,以便评分者更好地把握评分标准,评分的结果也比较稳定,信度相对较高。如针对前文推荐“每周一书”任务中开放性问题的评分细则为:
[2分]
• 写出语篇体现出的品质,并有事实支撑,无任何语法错误,包括标点和大小写,词数不少于20。
• 写出具体事件,且能体现与语篇相关的品质,无任何语法错误,包括标点和大小写,词数不少于20。
[1分]
• 写出语篇体现出的品质,并有事实支撑,但有语法错误,包括标点和大小写。
• 写出具体事件,且能体现与语篇相关的品质,但有语法错误,包括标点和大小写。
• 写出语篇体现出的品质,并有事实支撑,但词数少于20。
• 只写出品质,无事实支撑,如:She is brave./She is a brave girl.
[0分]
• 未作答。
• 所写品质和事件与语篇主题无关。
• 所写关于语篇品质的表达不准确,达不到交际的目的。
第三,在一些非高利害测试的网络阅卷中,建议对学生不同的答题情况进行二次编码,如对得0分的情况可以设计为:编码01为答案空白,02为单词形式错误,03为单词乱写等多种情况。这样的编码可以更好地对分数结果进行有效分析。
由于学科的特点,英语学科本身的内容就会广泛涉及其他学科知识,而学生现实生活中面对的真实问题也可能涉及多门课程的知识与思想方法。对综合性测试题中的跨学科知识,“首先,命题人员要熟悉课程标准的相关要求,在准确把握课程标准的要求的基础上,设置问题情境并预设学生应具备的相关话题知识和经验。课程标准规定的主题范畴、主题群和子主题可以作为参考依据。其次,命题人员可以根据对相关学段学生的实际生活经验、认知水平来判断”(程晓堂,2025)。命题人员还需要区分哪些跨学科知识属于生活常识,哪些是学生在其他学科的学习中已经正式学过,不能因为超越学生认知的跨学科知识而影响对学生英语学科学业的评价。特别需要注意的是,试题中对跨学科知识的考查在认知深度和广度上应该是学生解决试题所涉及的真实生活情境问题所必需的跨学科知识,而不是人为地放大对跨学科知识的考查。
《新课标》理念下的综合性测试题是创设真实的试题情境,设置涉及不同素养和语言技能的任务,考查学生整合已知与新知, 通过独立思考、主动探究和分析评价等过程,将语言能力、正确的价值观和素养整合融通以分析问题、解决问题的能力。综合性测试题对试题的形式提出了更高的要求,也对英语学科创新试题的考查形式提出了新的要求,还需要更多教师积极探索新的语言测试形式,使教学与评价能够更好地培养和发展学生的核心素养。
(参考文献略,完整文章内容请见纸刊。)
————————————
注:本文系2023年度国家社科基金重点项目“基础教育英语学业质量标准研究”(项目批准号:23AYY024)的阶段性研究成果。
本文作者:马黎(江苏省南京市教学研究室)