北京师范大学物理与天文学院
  • 师德意见
  • |
  • English
  • |
  • 内网入口

新闻动态

首页» 新闻动态

科研成果|物理认知诊断研究进展获评教育测评顶刊年度优秀论文

供稿:姚建欣     责编:侯卫娜     审核:高鹤    |   2026-04-27

认知诊断是现代教育测量评价领域的重要技术,它通过刻画学生微观层面的认知状态,实现对个体多维认知属性的精准诊断,为教师优化教学决策提供依据。北京师范大学物理与天文学院物理教育研究教师姚建欣、博士研究生库尔班江·杰力力等在物理认知诊断模型创新和应用人工智能降低操作门槛等方面取得重要进展。

其中,物理认知诊断模型创新方面成果“Dual-diagnostic approach for jointly estimating students’ conceptual understanding and misconceptions in forces and motion”发表于国际物理教育研究一流期刊《Physical Review Physics Education Research》。应用人工智能降低认知诊断实施的技术门槛,解决一线教学落地难题方面的论文《基于生成式人工智能的认知诊断应用研究》发表于教育部教育考试院主办的我国教育测量评价研究领域顶刊《中国考试》,并被评为2025年度优秀论文。

物理概念学习过程中,学生持有较多迷思概念,传统的认知诊断模型主要依据子概念掌握情况推断概念理解水平,不能全面解释被试错误作答背后的原因。然而,若要同步诊断学生的概念掌握状态与多种迷思概念,将面临模型参数膨胀、估计不稳定等技术难题。团队面向这一关键问题,提出双阶段多选决定性输入噪声“与”门层级模型(two-stage multiple-choice deterministic inputs, noisy “AND” gate with hierarchy,TS-MC-DINA-H),实现了基于单层选择题作答数据对学生物理概念掌握状态与迷思概念持有情况的同步诊断(图1)。

图1 双阶段多选认知诊断实施步骤

TS-MC-DINA-H模型将选择题干扰项中蕴含的认知信息纳入诊断模型。该方法通过选项水平Q矩阵,将正确选项与概念属性掌握相联系;将干扰选项与典型迷思概念相联系,并引入层级约束和双阶段诊断思路,有效解决了概念属性与大量迷思属性联合建模时容易出现的参数膨胀和估计不稳定问题。相较于传统双层诊断测验,该方法不需要额外设置“理由作答层”,仅基于单层选择题数据便可获得细粒度诊断结果。

对492名高中生的数据分析发现:即使总分相同,学生也可能呈现出不同的概念掌握情况(图2);即使概念属性掌握模式相同,学生所持有的具体迷思概念也可能存在明显差异(图3)。该成果为物理学科迷思概念的细粒度诊断提供了新的技术路径,也为教师利用常规测验开展针对反馈和精准教学提供了支撑。

图2 总分相同学生属性掌握概率对比雷达图


图3 属性掌握模式相同学生的迷思概念持有概率对比热图

在教学应用方面,认知诊断由于涉及认知模型构建、Q矩阵设计、测验开发、结果分析与解释等复杂环节,一线教师在理论理解、操作实施和结果转化等方面仍面临困难。团队针对认知诊断在一线教学中落地难题,构建了“教师—GenAI”协同的认知诊断实施框架(图4)。基于国产大模型DeepSeek辅助认知诊断的实施过程,有效降低认知诊断的实施门槛,为诊断性评价、分层教学和个性化反馈提供了易操作的技术路径。

图4 基于生成式人工智能的认知诊断实施框架

教育部教育考试院从《中国考试》2025年度发表的139篇论文中遴选出8篇优秀论文(图5)。师大物理教育研究团队在认知诊断方面的研究成果被选为其中之一。

图5 《中国考试》2025年优秀论文评选结果截图

上述研究得到北京市教育科学“十四五”规划2024年度延续课题“基于科学思维学习进阶的形成性评价设计与实施研究”支持。参与相关研究工作的还有我校研究生张舒赫、姚子琪,我校本科生杨诚伟、蓝明浦、汪雅文、何良才、姚华鑫。北师大物理教育研究团队学科带头人李春密教授对团队师生给予了系统指导。

论文链接:

https://journals.aps.org/prper/abstract/10.1103/hrx4-gpd2

https://mp.weixin.qq.com/s/P0NEl9RbKH4EDbj7LFeImA

获奖公告:

https://mp.weixin.qq.com/s/bchjA3VB4aw5sfU4wgKW2A