
摘要
为克服当下义务教育学校纸笔考试存在的难度大、命题质量不高问题,研发试卷质量标准。基于引领性、导向性、通俗性和可操作性,设置了遵守学科标准、试题质量良好、试卷结构良好3个一级指标,包含内容要求合标、突出主干知识、重视学科素养、整卷难度合理、试题无错无瑕、评分标准科学、试题有区分度、试题来源结构合理、试题类型结构合理、试卷答卷排版合理等10个二级指标,包含具体的评价要素和评价方法。试卷质量标准可以引导学校构建考试质量管理机制,提高命题质量;引领一线教师树立正确的校考命题理念,提高常规命题技术。

关键词
学校考试;命题质量;试卷评价;试题评价
本文发表于《考试研究》2025年第4期



正文
一、义务教育学校试卷质量标准的必要性
2021年教育部办公厅颁布《关于加强义务教育学校考试管理的通知》,要求各地义务教育取消区县统考,全面实施学校自行考试1。要克服试题“难度较大、质量不高”的质量问题,完善现有义务教育学校纸笔考试试卷质量评价标准,引导学校构建试卷质量管理机制,保障学校考试命题质量;引领一线教师树立正确的校考命题理念,提高常规命题技术。试卷质量评价指标是衡量考试科学性和有效性的重要依据,应当完善义务教育学校考试命题质量评价标准,引领教师提高命题技能,引领学校建立命题质量评价机制,提高学校考试命题的科学性、专业性、客观性。
2021年中共中央办公厅、国务院办公厅印发《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》,要求降低考试压力,改进考试方法,不得有提前结课备考、违规统考、考题超标、考试排名等行为。同年,教育部办公厅《关于加强义务教育学校考试管理的通知》明确规定,“各地不得面向小学各年级和初中非毕业年级组织区域性或跨校际的考试;学校和班级不得组织周考、月考、单元考试等其他各类考试,也不得以测试、测验、限时练习、学情调研等各种名义变相组织考试”。随着取消统考政策的落实,校考兴起,学校必须端正教师的校考命题理念,培训教师相关命题技能,建立学校考试管理机制,保障学校考试命题质量。这些将是义务教育学校当下非常重要的新工作。
二、义务教育学校试卷质量评价标准的特殊性
国外学者对于试卷质量侧重使用项目反应理论和经典测量理论做量化评价,常见的定量评价指标包括信度、效度、难度、区分度等。国内公开发布的试卷质量评价指标体系或评价标准较少,侧重学科定性评价,常见的定性评价指标包括适纲性、科学性、适度性、导向性、规范性、结构性、公平性等。有学者基于学科定性评价和测量学定量评价提出了比较系统的中高考试卷质量评价指标体系,具有理念先进、遵守学科课标、符合测量常规、社会后效良好四个一级指标,包含重视政治方向、顺应教育改革、破解应试教育、敢于命题创新、试题无错无瑕、突出主干知识、凸显核心素养、合理控制难度、整卷信效度高、评分标准科学、排版科学美观、公平公正性强、高分段高区分、合理引导教学、社会认可度高15个二级指标。目前的国内外试卷质量评价标准比较适合大规模的区域性测试,如中考、高考、区域质量监测等,但不适合义务教育学校考试。
学校考试是指学校针对本校学生自行组织、命题、批改、诊断和评价的考试,是学校教育教学工作重要的常规环节。学生数量规模和成绩分化程度明显小于区域测评。其主要目的是获得教学过程中的连续性反馈,及时了解学生的学习效果、学习历程、学习特点、学习困难等信息,及时预测监控班级和学生个体的发展态势,作为下阶段教学改进的依据。学校考试不是选拔、评估和排名考试,而是侧重导向、诊断、激励和促进的低利害的小规模校本化考试。要通过学校考试内容的导向,引导学生重课上、作业等日常学习过程。还要通过考试数据诊断学生个体学习效果,基于成绩变化诊断学生的学习效益;提供试题和题组的得分数据,发挥考试的促进功能,提高学生自我评价、自我反思的能力,引导学生合理运用评价结果改进学习。应当预设合理的考试难度,保护学生的学习自信心、学习兴趣和学习效能感,激励学生努力学习,以利于身心健康发展。同时,还要基于考试数据诊断教师教学效果,促进教师改进教育教学行为。
义务教育学校考试试卷质量评价不能类似中高考、区域统考那样高要求、高标准。原因有四,一是学校考试的性质和功能不同于这些大规模统考;二是学校考试的命题者和评估者是一线普通教师,不是区域的命题专家和评估专家,两者专业水平相差悬殊;三是学校考试采集到测量学数据的全面性、精细性远不如区域统考;四是要考虑到一线学校的操作性和教师的接受性。
综上所述,义务教育学校考试试卷质量评价要突出四个原则。一是对教师的引领性原则,通过义务教育学校考试试卷质量的评价标准引领学校学科评价改革,提高教师学科命题评价能力;二是对学生的导向性原则,以命题评价改革引导学生改良学习,促进学生对自己学习过程的反思和改进;三是对命题者的通俗性原则,让一线普通教师、特别是新教师都能看懂指标、理解指标;四是对学校的可操性原则,有关指标要易于学校采集和计算,让学校普通管理者都可以根据本指标体系,开展试卷质量评价和管理工作。因此,基于这四个原则,在指标设计上尽量做到学科质性评价和教育测量学量化评价相结合,试题评价和整卷评价相结合,命题质量评估和命题技术指导相结合,命题专家水准和一线教师基础相结合,理想的命题理念和实践操作相结合。
三、义务教育学校考试试卷质量评价指标体系与评价方法
根据义务教育学校考试的性质和功能、评价标准的特殊性和四个原则,构建包含3个一级指标、10个二级指标的义务教育学校考试试卷质量评价体系,如表1所示。

(一)遵守学科标准
1.范围要求合标
学校考试命题要严格遵守课程方案、各学科的课程标准和学科学业质量标准,严格按规定的考试性质和考试目的、命题原则、命题规划、试题研制等规则进行,不得超标命题和随意扩大、压减考试内容范围6。
评价要素:(1)考试内容范围没有超出课标。(2)没有偏题怪题、学科竞赛试题及校外培训内容。(3)考试水平要求与课标要求一致。例如,课标上规定的教学要求是“理解”,就应考查“理解”水平,不应考查“识记”或“应用”。(4)考试内容不能超出国家课程标准规定的正常的教学进度。
评价方法:(1)(2)(3)(4)都达标,优秀;(1)(2)(3)达标,良好;(1)(2)达标,合格;其余情况,不合格。二级指标包含若干评价要素,各评价要素采取0-1赋分,也就是达标和不达标(下同)。
2.突出主干知识
一册教材涉及很多知识点,这些知识点自成体系,必有学科主干知识和重难点。考点覆盖面越大,越能够提高试卷内容效度。学校考试内容既要重视覆盖面,也要凸显学科主干知识和重难点。
评价要素:(1)各板块内容都要有考查,而且分数占比与相应的教学课时数相当。(2)各单元内容都要有考查,而且分数占比与相应的教学课时数相当。(3)考点覆盖面80%以上。(4)主干知识及重难点都要有考查,且题量和分值占70%以上。(5)适度减少总题量,让学生作答时间有富余。
评价方法:5项达标,优秀;4项达标,良好;3项达标,合格;其余情况,不合格。
3.重视学科素养
学校考试必须是基于学科课标核心素养的考试评价,强化素养导向,注重对正确价值观、必备品格和关键能力的考查。2022年版各学科新课标都提出了学科各自的核心素养和关键能力。
评价要素:(1)与学科核心素养、关键能力匹配的试题数量要占多数。(2)与学科核心素养、关键能力匹配的试题分数权重较大。(3)死记硬背等机械记忆的试题较少。
评价方法:3项都达标,优秀;2项达标,良好;(1)或(2)达标为合格;其余情况,不合格。
4.整卷难度合理
新课程新课标要求义务教育学校考试要增强日常考试评价的育人意识,“双减”新政要求给学生减负。学校考试要合理把握试卷的难度,让合适的考试成绩成为学生学习的催化剂和动力,从而发挥学校考试的激励功能和促进功能。让优等生拿不到满分,考出危机感;让中等生的分数差距缩小,考出竞争意识;让后进生拿到基本分,考出希望和自信。
试卷难度分为整卷统计学难度和学科难度。一道试题即使学科难度很大,但如果考生都会做,那么统计学难度不大。要控制的是整卷的统计学难度。学校考试是过程性考试,是基于课程标准的考试,通常要求小学考试难度范围0.9-0.95,初中0.80-0.85,尽量不出现满分现象。尽量做到高及格率,小学不及格率要低于5%,初中不及格率要低于10%。低分段和高分段两极要有较好的区分度,即小学考试对后5%和前10%左右的学生有较好的区分度,初中考试对后10%和前20%左右的学生有较好的区分度。分数标准差较小,离散程度较小。分数分布呈现狭窄高峰型,峰度系数大于3。
评价要素:整卷难度合理。
评价方法:小学难度值0.9-0.95,初中难度值0.80-0.85,优秀;小学难度值0.95以上,初中难度值0.85以上,良好;小学难度值大于等于0.80,初中难度值大于等于0.75,合格;小学难度值低于0.80,初中难度值低于0.75,不合格。
(二)试题质量良好
1.试题无错无瑕
评价要素:(1)试题描述明确、正确、准确,不缺乏必要条件、无歧义。(2)试题的情景、设问、答案、评分标准具有内在逻辑性,无学科性错误。(3)设问符合教材课标的教学要求,指向明确,不会让学生答非所问。(4)答案正确、合理、无争议。(5)试题的文字、数据、图示和表格精炼。(6)试题情境与学科内容相互融合,具有真实性、典型性、适当性和公平性。
评价方法:6项都达标,优秀;(1)(2)(3)(4)达标,(5)或(6)达标,良好;(1)(2)(3)(4)达标,合格;其余情况,不合格。
2.评分标准科学
评价要素:(1)命题者在试卷印刷前必须提供完整的评分标准。(2)各题目分值累计与总分一致。(3)各题型、板块、大题赋分合理。(4)各小题赋分合理。(5)计算题、问答题、议论题、写作题等主观题的评分标准比较规范,层级赋分符合认知程度,对综合题、开放题、探究题、项目化学习、跨学科等复杂的试题可采取SOLO评价赋分法。(6)对不同解法的评分细则有所不同。
评价方法:6项都达标,优秀;(1)(2)和其他2项达标,良好;(1)(2)达标,合格;其余情况,不合格。
3.试题有区分度
试题效度是指对于一个既定的目标,在做出推论和提供解释过程中评价的有用性程度,是高质量评价的首要条件。
根据美国测验专家艾伯尔(R.L.Ebel)的研究成果果:鉴别指数大于0.3,表明试题的区分度良好;大于0.2,区分度尚可;0.19及以下,区分度差;区分度是负值,说明优生得分情况比后进生差,属于必须淘汰的题目8。
义务教育学校考试是标准参照考试,是达标性考试,大部分试题侧重达标和不达标的区分。由于小学和初中整卷难度分别在0.90、0.85以上,预期小学和初中学校考试很多试题区分度会低于0.2。区分度低于0.2的试题,对全体学生而言,没什么区分度,但是对高分组或低分组学生依然可能有较好的区分度。
学校考试可以采用试题难度值曲线来直观反映试题的区分度。如图1,难度曲线显示本题对各个层次学生都有良好的区分度,是区分度较高的试题。图2中左边的难度曲线显示该题对低分组学生有较高的区分度,对中等生、高分段学生没有区分度;中间的难度曲线显示本题对中等生有良好的区分度,对低分组和高分组区分度较小;右边的难度曲线显示该题对高分组学生有良好的区分度,对中等生和低分组学生没有区分度。图3难度曲线呈凹型,低分组得分率高于中等生,表明该题有问题;同理,难度曲线呈凸型,表明中等生得分率高于优生,也是有问题的试题。图4难度曲线很平直,而且低分段的得分率略高于高分段,区分度是负值,也是有问题的试题。
学校也可以采用各等第学生的得分值(或得分率)来直观反映试题的效度。把学生学科成绩由高到低分成ABCDE五等,各占20%。ABCDE等第学生试题得分率依次明显下降,说明该试题对全体学生有良好的区分度;如果五个等第得分率都差不多,说明本题没有区分度;如果ABCDE五个等第的试题得分率依次明显上升,说明本题区分度是负值,属于负相关关系,是有问题的试题。
评价要素:(1)没有出现负相关、区分度为负值的试题,没有出现类似图3、图4现象。(2)没有出现区分度低于0.1的试题(3)大部分试题区分度大于0.2。
评价方法:3项都达标,优秀;(1)(2)达标,或(1)(3)达标,良好;(1)达标,合格;(1)不达标,不合格。




(三)试卷结构良好
1.试题来源结构合理
通过试题来源的导向性,引导学生重视课堂,重视课本、作业等日常性学习。
评价要素:(1)直接或改编于课文中原文、例题、作业的试题数量、分值占20%左右。(2)直接或改编作业本或官方作业的试题数量、分值约占20%分值。(3)直接或改编课堂练习,讲评过的、考过的试题数量、分值约占50%分值。(4)其他来源试题数量、分值约占10%分值。
评价方法:4项都达标,优秀;3项达标,良好;2项达标,合格;其余情况,不合格。
2.试题类型结构合理
学校考试要考查核心素养、关键能力等,既要增加综合性、开放性、应用型、探究性试题比例,减少机械记忆性试题,同时也要防止试卷难度过大。所以学校考试要增加综合性、开放性、应用型、探究性试题数量比例,同时严格控制这些题目的分值。
评价要素:(1)情景题达半数以上。(2)综合性、开放性、应用型、探究性、跨学科试题数量较多。(3)综合性、开放性、应用型、探究性、跨学科试题的分值较少。(4)选择题、填空题、计算题等题型结构合理,其中死记硬背的填空题和选择题的数量很少。(5)合理控制选择题单题难度,减少学生考试猜测性。
评价办法:5项达标。优秀;(1)和其他3项达标,良好;(1)和其他2项达标,合格;其余情况,不合格。
3.试卷答卷排版合理
试卷答卷的字体大小、行距大小、图表大小、试题排序都会影响学生的考试心理和成绩。排版要合理、易读、美观,方便学生审题和作答,同时要做到试卷和答题卡一一对应。
评价要素:(1)答题卡和试卷必须一一匹配。(2)一道试题不能分在两页,尤其正反面。(3)试题图片大小合适,印刷清晰,题图对应,图文一致,相互靠近,不容易错觉错位;不同题目的图表不能过分靠近。(4)答题区域大小满足答题需要。(5)字体大小合适、行距合适。(6)试题及其图表中的文字、数字、字母符号的字体字号统一。(7)同一组试题排序总体上要先易后难、先熟悉后陌生,利于学生考试心理平稳,思维有序展开,正常发挥水平。
评价办法:7项达标,优秀;(1)(2)(3)(4)和其他2项达标,良好;(1)(2)(3)(4)达标,合格;其余情况,不合格。
四、义务教育学校考试试卷质量评价指标赋分办法
将二级指标分为最重要指标、重要指标、一般指标三个级别,对应的分数权重也由高到低分别为20%、10%、5%。二级指标满分为100分,最重要指标、重要指标和一般指标满分值分别为20分、10分、5分。各学校可以根据本校教师的命题水平和常见试卷质量存在的问题,校本化微调二级指标分数权重大小。
试题无错无瑕和整卷难度合理这两个二级指标设为最重要指标;也特别规定,试题无错无瑕和整卷难度合理这两个指标都为一票否决指标;如果其中一个评价为不合格,全卷为不合格。
学校考试必须重点考查学科素养和主干知识,必须体现教学的重难点,这方面的试题数量和分值应该多一些,这反映了试卷的效度,所以,这两个指标设为重要指标。一线教师命题很容易忽略试题来源结构和试题类型结构,影响了教学评一致性和整卷信效度,所以,这两个指标也为重要指标。
二级指标都采用A(优秀)、B(良好)、C(合格)、D(不合格)四个等第赋分方法,四个等第得分权重分别为满分值的1、0.8、0.6、0.4以下。5分指标对应得分分别为5、4、3、2-0,10分的指标对应得分分别为10、8、6、4-0,20分的指标对应得分分别为20、16、12.8-0.这种等第评价介于精准评价和模糊评价之间,是督导评估评价量表常用的方法,具有通用性和习惯性;这也是一线教师普遍采用的日常评价方法,具有较大的适宜性和操作性。四等第赋分法,既能提高评价的区分度,又能提高不同专家评价分数的横向可比性。
命题评价能力是一线教师最薄弱的专业能力之一,提高教师的命题评价能力是当务之急。学校要组织教师解读新课程新课标,理解学校考试的性质和功能定位,树立正确的校考理念,摒弃传统的选拔性考试的思想;每次考试后都应依据开展学科试卷质量评价和优秀试卷评选活动,把优秀试卷认定为重要的教科研成果,把不合格的试卷认定为教学事故,以此发挥评价标准的导向功能和指导功能,从而提升学校考试试卷的质量。


参考
[1]教育部办公厅。教基厅函〔2021〕34号教育部办公厅关于加强义务教育学校考试管理的通知[A/OL].http://www.moe.gov.cn/
sresite/A06/s3321/202108/t20210830_555640.html.
[2]教育部。中共中央、国务院印发《深化新时代教育评价改革总体方案[EB/OL].[2025-05-14].http://www.moe.gov.cn/jyb_xxgk/moe_1777/moe_1778/202010/t20201013_494381.htm.
[3]教育部。中共中央办公厅、国务院办公厅印发《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》[EB/OL].http://www.moe.gov.cn /jyb_xxgk /moe_1777/moe_1778/2021071
作者简介
浙江省温州市教育评估院综合评估科科长,浙江省教育评价改革专家库专家,浙江省中小学教育质量综合评价核心骨干成员,第三届浙江省基础教育课程改革专业委员会(考试与评价)委员,浙江师范大学和温州大学兼职导,中国现场统计研究会教育统计与管理分会理事,中国教育技术学会教育测量与评价专业委员会常务理事,温州市首届教坛中坚。2016年负责执笔课题获浙江省人民政府基础教学成果二等奖,2017年至今发表80余篇文章。
曾经受邀为国家教育行政学院、清华大学、浙江大学,中国教育学会、黑龙江教育厅、宁夏教育厅,浙江省教研室、广西教研院,西安铁路一中,南京师大附中、华中师大附中、杭州市建兰中学等单位组织的教育局干部、校长、教研员、学科带头人、教师等国培省培项目做专题讲座。
评价改革领域有《“新课标+双减”背景下:新时代教育评价改革学校行动策略》《重构学科评价体系:“新课标+双减”背景下学科评价改革》《中小学学生综合素质评价改革与实践》《“新课标+双减”背景下教师发展性评价与常规管理》《中小学教学质量增值评价与应用》《即时评价语——课堂教学的诗与远方》等。
考试命题领域有《中(高)考试题创新与教学对策》《纸笔考试试题的常规研制技术》《“新课标+双减”背景下:学校纸笔考试与命题管理新机制》《小学学科非纸笔考试(现场表现性评价)命题技术》等。
质量提升与数据应用领域有《数据思维:高效提升区域教学质量新策略》《科学实用:高效提升学校教学质量的新密码》《“数据驱动教育教学改进”学校行动策略》《学科数据:精细诊断与精准教研》《总分数据:全面分析与归因研究》《循证研究:数据分析与报告撰写》《五年中考命题规律和复习对策研究》《科学考试 高效提分》《实在实用实效:“新课标+双减”背景下作业教学改革与管理实践》等。
质量监测与督导领域有《新时代教育质量监测与督导新机制》《区域教育质量监测与评价改革推进》《教育质量监测报告解读与撰写》《基于监测数据:教育质量影响因素及其应用》《基于幼儿成长的学前教育质量量化评价及其应用》《基于监测数据研究:乡村学校教育振兴策略研究》等。
教师专业发展领域有《做一个会教育评价的老师》《做一个会学涯规划指导师(高中)老师》《做一个会写论文的老师》等。
旭东JY测评
关注教育测量与评价
谈论教育测量与评价
服务教育测量与评价
改进教育测量与评价

扫码关注“旭东JY测评”

扫码加作者微信