首页>检索页>当前

撬动考试评价改革的“关键齿轮”

发布时间:2025-08-02 作者:林美貌 来源:中国教育报

  考试评价改革作为教育改革的“牛鼻子工程”,直接影响教学导向、学习方式和人才培养质量。以新一代数智技术为杠杆,撬动考试评价改革,赋能人才培养,成为推进教育数字化转型、深化教育评价改革和促进教育高质量发展的“关键齿轮”。

  数智时代考试评价改革可在评价理念、评价工具、评价功能等方面实现系统性范式转型。

  从“统一标尺”向“多元融合”的评价理念转型。技术快速迭代、产业形态重构和社会运行方式革新,要求人才具备技术素养和跨界复合能力、高阶认知和创新能力、动态适应能力和人文价值判断力等。标准化考试难以评估这些高阶能力,因此要构建技术赋能、多元融合、动态反馈的新型多元评价体系,以适应未来社会对人才的要求。多元评价不是简单增加考核形式,而是借助技术赋能的多元化工具,通过开展情境化表现评价、动态过程性评价和社会化参与评价等,使教育实现促进人的全面发展这一本质目标。

  从“标准化量表”向“智能生态系统”的评价工具转型。考试评价工具的数智化转型是数智技术落地的核心载体,其演进路径呈现出从单一工具向复合生态、从静态测量向动态感知、从人工操作向智能协同的显著特征。评价工具的转向应包含三个层次:第一个层次是传统评价工具的数智化升级,如深化人工智能在智能组卷系统和电子阅卷系统中的应用等。第二个层次是新型数智评价工具的突破,如研发自适应测评系统,构建“千人千卷”的个性化测评模式;探索虚拟现实测评场景,通过沉浸式任务解决评估学生的创新思维和实践能力等。第三个层次是形成数智评价生态,借助数智技术推动考试评价与课程教学、教师考核深度衔接,建立覆盖“教、学、评”全场景的数据采集网络,形成可解释、可追溯的智能评价算法体系,提升考试评价的科学性和系统性。

  从“末端测量”向“过程赋能”的评价功能转型。借助数智技术,推进多维素养建模、认知深度挖掘与情境化测评的深度融合,推动考试评价实现四大功能跃迁:一是突破传统考试的“分数桎梏”,构建覆盖价值观、协作能力和批判性思维的立体化素养评估体系,借助自然语言处理、虚拟现实等技术生成动态“能力雷达图”,实现对学生综合能力的立体评估。二是依托认知诊断模型和学习行为追踪,从“结果判定”转向精准归因和过程干预,定位学生思维盲区并推送个性化学习路径,同时帮助教师实现精准教学。三是通过跨学科情境任务和真实问题模拟,检验学生在复杂场景中解决问题的能力,弥合考场与社会实践间的鸿沟。四是基于大数据聚类分析和生涯关联算法,从“统一标尺”转向差异化成长导航,为个体提供多元发展适配方案。

  数智技术为考试评价改革注入了创新活力,但技术赋能的同时也带来了不可预测性和不可逆风险。因此,数智时代考试评价改革应辩证把握工具效能与教育规律、效率追求与教育公平、技术创新与制度供给三大关系的动态平衡,坚守教育本质。

  始终把握工具效能与教育规律的辩证统一。智能技术赋能考试评价的核心在于数据资源的深度挖掘和科学应用,但不能将之窄化为精准计算的工程问题,而应始终服务于立德树人根本任务。比如,利用算法模型解构知识能力图谱时,需警惕“技术至上”对教育主体性的消解;智能系统替代教师进行诊断和反馈,可能导致教师主体性削弱。因此,教育工作者应具备技术敏感与人文定力的双重自觉,构建“技术向善”的价值锚点,在技术研发时嵌入教育价值校准机制,在制度设计时构建风险预警响应系统,在文化认知中培育技术批判性思维,让技术真正成为“点亮人”而非“定义人”的力量,实现从技术赋能走向教育增值。

  始终把握效率提升与公平保障的动态平衡。教育公平是社会公平的重要基础,数智技术虽然可以显著提升评价效率,但若缺乏系统性制度设计,可能加剧资源分配失衡、算法偏见和数字鸿沟。要实现考试评价数智化改革的高效、公平,就要打好“技术+制度+文化”的组合拳。首先,在技术适配层,要以多模态终端支持系统开发跨平台考试系统,使之像“变形金刚”那样能适配各种设备,确保城乡不同配置设备均可获得标准化的交互体验;要建立深度学习驱动的评卷纠偏机制,给智能评卷系统装上“偏见过滤器”,防止算法因数据偏差产生不公平。其次,在制度保障层,实施“纸质—数字”双轨并行机制,不让跟不上技术脚步的孩子掉队。再次,在文化认知层,实施数字素养培育工程,构建多元主体共治机制,建立数据共享但不泄密的联防机制。

  始终把握技术创新与制度供给的动态适配。数智化考试评价的健康发展,既需要保持技术创新的开拓性,又必须加强制度供给的前瞻性。例如,针对大规模教育数据采集与个人信息保护的制度冲突,需建立分级分类授权机制;针对评价模型可解释性要求与技术复杂性的矛盾,应构建算法备案审查制度;针对落后于技术迭代速度的困境,需建立敏捷性制度响应机制等。在政策层面,推进“管办评”分离改革,建立政府、学校、专业机构与家长协同治理的多元评价格局。如成立教育数据治理委员会,统筹政府、学校、专业机构、家长四方主体,建立数据确权、算法审计、伦理审查的协同机制。在标准层面,实施标准体系先行引领,教育部门应加快制定教育数据安全标准、算法伦理规范等制度。在机制层面,建立动态校准机制,通过人机协同、多方验证确保评价的公平性和科学性,防范技术应用可能带来的“算法偏见”等问题。通过建立技术标准与制度规范的双向映射机制,构建风险可控的试错容错空间,确保技术赋能始终行驶在“教育规律”与“技术伦理”的双轨之上,为改革提供持续动能。

  (作者系福建省教育考试院科研与评价处副处长、副研究员。本文系2022年度福建省教育系统哲学社会科学研究项目[JDW22001]成果)

《中国教育报》2025年08月02日 第04版

0 0 0 0
分享到:

相关阅读

最新发布
热门标签
点击排行
热点推荐

工信部备案号:京ICP备05071141号

互联网新闻信息服务许可证 10120170024

中国教育报刊社主办 中国教育新闻网版权所有,未经书面授权禁止下载使用

Copyright@2000-2022 www.jyb.cn All Rights Reserved.

京公网安备 11010802025840号