AI技术在教育评估中的表现与影响 - 搭载GPT-5.2模型的Rokid智能眼镜在香港科技大学《计算机网络原理》本科期末考试中取得92.5分(满分100分),高于72分的班级平均分,但低于学生最高分97.5分 [1][2] - AI系统在30分钟内完成考试,而学生需时3小时 [1][2] - 在题型分析中,AI在选择题和单页解答题上获得满分(分别为29分和18分),但在跨页解答题上失分,仅得45.5分(该题型满分未明确给出)[4] AI技术的当前能力与局限 - 大语言模型在理论上能掌握教科书知识,但在实际应用中面临限制,尤其在处理需要跨页面整合信息的题目时表现不佳 [4] - 当前AI系统的核心局限在于缺乏真正的全局认知与工作记忆机制,难以维持跨上下文的逻辑关联 [4] - AI眼镜作为智能终端面临功耗挑战,测试中Rokid眼镜在30分钟答题期间通过Wi-Fi传输高分辨率照片,电量从100%降至58% [5] 教育评估体系面临的重构压力 - AI辅助工具的普及正在挑战以学生独立完成知识应用为假设的传统学术评价体系 [6] - 教育评估重点可能需要从知识复现转向问题定义、创新解决方案设计、重视思维过程以及培养人机协作能力 [7][8] - 教师角色需要转型,从知识传授者转变为学生成长的引导者、学习过程的设计者和思维发展的催化者 [8] 教育公平与学术伦理的新挑战 - AI辅助学习工具的普及可能加剧教育不公平,优质资源可能首先惠及资源丰富的学校和学生 [8] - 学术诚信体系面临重建,多所高校已开始修订规范,例如清华大学发布指导原则,要求披露AI使用情况并严禁AI代写、剽窃等学术不端行为 [9] - 行业呼吁建立合理的监管机制,通过政策法规、技术监控、教育宣传等多层面措施,在保护学术诚信的同时促进教育技术创新 [11]
用搭载GPT-5.2的AI眼镜做题,是一种什么体验?
观察者网·2025-12-27 13:20