
江苏省苏州工业园区方洲小学学生在美术课上寻找校园美景。学校供图

广东省佛山市禅城区澜石小学学生利用设计软件设计龙舟。资料图片
教育评价是教育的指挥棒,更是教育现代化的度量衡。20多年来,我国学生综合素质评价虽历经多轮探索,但始终面临“评什么”内涵不清、“怎么评”科学性不足、“怎么用”导向虚化三大难题。当前,人工智能正以颠覆性力量重塑教育生态,这为学生综合素质评价带来了前所未有的战略机遇——能否借助人工智能破解长期存在的客观性与科学性困局?评价的内容、方法与功能应如何迭代?
自2022年起,在教育部“信息技术支撑学生综合素质评价”试点工作中,以国家重点研发计划项目“大规模学生跨学段成长跟踪研究”为支撑,政产学研用协同创新,开展一场覆盖全国百余万中小学生的改革实践,系统回应了学生综合素质评价“评什么”“怎么评”“怎么用”三大战略命题。
评什么:
“五育”并举与核心素养的整体融通
目前,有两个关键词与学生综合素质评价紧密相关。一个是以德智体美劳全面发展为目标的“五育”并举,另一个是2016年颁布的《中国学生发展核心素养》提出的学生全面发展所应具备的“核心素养”。二者本应相互贯通、彼此支撑,共同构成育人目标与评价的逻辑基础。然而在实践中,两者的逻辑关系与内涵结构始终未被厘清,存在口径不一的问题。
此外,10余年前的理论框架已难以适应数智时代社会的飞速发展,尤其是在适应人工智能时代智能素养的新要求、中华优秀传统文化育人价值转化、拔尖创新人才诊断标准等关键领域,现有的理论体系存在概念内涵不清晰、结构不完整等多方面的不足,“评什么”的问题成为需要破解的重要命题。
在试点工作中,多领域专家协同研究,并在百万级学生数据中多轮迭代检验,一套新时代背景下以《中国学生发展核心素养》为底座,系统纳入德智体美劳全面发展理念的综合素质评价理论体系逐渐成熟。它将综合素质定义为学生在受教育过程中形成的跨越学科的价值观、必备品格和关键能力,涵盖“自主发展、文化修养、社会参与”三大维度,下设“身心健康”“自我管理”“问题解决与创新”“人文与审美”“语言与沟通”等10项指标及36个基本要点,并具象化为特定任务场景中的数据观测点。如“语言与沟通”指标下的“阅读理解”要点,可进一步细分为信息定位、文本理解、评价反思等子能力,学生在完成阅读任务时的作答用时、作答表现、点击与回看等行为轨迹,便成为一系列可观测、可记录的数据信号,共同表征其阅读理解水平。这为回答今天综合素质评价“评什么”提供了可参照、可操作的内容体系。
怎么评:
AI赋能构建分层分级智能化评价体系
按照区域的评价指标体系,提交各类证据档案,在此基础上由多主体结合日常表现,主观评价确定评价等级,这是目前我国各地开展学生综合素质评价的常规做法。这种评价方法存在客观性和科学性两方面的不足。客观性方面,各地各校分层分级综合素质评价平台体系在记录内容、数据处理、指标赋权等方面不一致,数据的真实性、主观研判尺度,以及“客观性”存在不足。科学性方面,综合素质只有在特定场景和特定实践中才能反映出来,日常观察无法全面捕捉到,因缺少对复杂真实场景中的学生表现数据进行分析,以至于评价结果的科学性常常被质疑。
随着人工智能技术不断深度融入教育教学,人工智能已不再是综合素质评价的支撑工具,而是推动其系统性变革的关键变量,促使学生综合素质评价正在向智能化、数据驱动和应用导向的方向转型升级。具体表现为:学生在完成学习任务场景中,通过与智能体、文字、图片、多媒体资源的交互来探索尝试解决复杂问题,在这一过程中,在保证伦理安全的基础上,可以运用数据采集技术收集学生在问题解决过程中的多模态表现数据,并通过应用智能分析技术,结合专家智慧,实现对学生全方位素质发展水平的建模和评估,从而提升评价结果的真实性与客观性,并促进技术支持下的及时反馈引导。如阅读理解测评活动“舌尖上的丝绸之路”以丝绸之路上的饮食文化为情境,模拟真实的数字阅读页面,学生通过点击、检索、作答等方式与图文内容持续交互,其交互过程中的行为数据被同步采集并经智能分析建模,生成个体与群体的诊断报告。黑龙江省某中学将这一测评与历史教学相融合,教师根据诊断结果定位学生的薄弱环节、动态优化教学并提供个性化指导,使评价真正反哺教学、以评促学。
未来,有必要在全国各地已经建设的综合素质档案记录系统的基础上,依托人工智能技术,整合教育部“信息技术支撑学生综合素质评价”试点中探索出的客观诊断的表现性评价体系,实现过程记录、主观评价与表现性评价活动数据的有效映射融合,进而探索“识别”导向的学生综合素质评价方案,建立国家、省、市、校分层分级、互联互通,基于国产化技术底座自主可控的学生综合素质评价能力体系。
怎么用:
充分发挥综合素质评价的育人、诊断和识别作用
《教育强国建设规划纲要(2024—2035年)》提出“完善拔尖创新人才发现和培养机制”,这迫切需要关注和强化学生综合素质评价的“水平诊断”作用。只有科学、客观的精准诊断,才能准确研判学生、学校和区域学生综合素质发展的真实水平,实现既在宏观上监测素质教育实施情况,又在微观上掌握每名学生综合素质具体发展情况。
在“信息技术支撑学生综合素质评价”试点工作推进中,江苏省苏州工业园区方洲小学借助智能化的精准诊断,识别出冯同学艺术感知敏锐的特点,据此制定“美育小导师”个性化育人方案,持续记录该学生的日常表现。3年下来,冯同学的10项核心指标跃升至班级均线以上。又如广东省佛山市南海区将平台上的表现性测评活动与区域已有的教育质量绿色指标监测体系相融合,把过程性、多维度的素质评价数据纳入区域监测,有效提升了区域学生综合素质评价的综合化与客观化水平。
人工智能赋能学生综合素质评价,亟须加快推进构建定位清晰、功能协同的“三位一体”学生综合素质评价体系:一是面向新时代育人目标,以评价作为指挥棒,引导人才培养方向,发挥育人作用;二是面向基础教育质量监测,精准评价学校、区域学生全面发展水平,发挥诊断作用;三是面向拔尖创新人才培养和学生个性发展,识别学生发展特长和潜能,服务人才选拔和个人成长规划,发挥识别作用。综合素质评价三个作用同等重要,只有实现了三个作用,才能彻底打破“唯分数”的瓶颈,真正的素质教育才能得以实现。
数智时代,对于学生综合素质评价“怎么用”的问题,我们认为答案应该是:发挥“育人”作用筑牢学生发展根基,发挥“诊断”作用客观研判发展水平,发挥“识别”作用服务人才选拔和分流。
(作者系北京师范大学教育学部教授)
《中国教育报》2026年06月23日 第04版
工信部备案号:京ICP备05071141号
互联网新闻信息服务许可证 10120170024
中国教育报刊社主办 中国教育新闻网版权所有,未经书面授权禁止下载使用
Copyright@2000-2022 www.jyb.cn All Rights Reserved.