用搭载GPT-5.2的眼镜做题,是一种什么体验?
观察者网·2025-12-27 13:21

技术表现与产品测试 - 搭载GPT-5.2模型的Rokid智能眼镜在香港科技大学《计算机网络原理》期末考试中得分92.5分(满分100分),高于72分的班级平均分,但低于学生最高分97.5分 [1][2] - AI系统在30分钟内完成考试,而学生考试时长为3小时 [1][2] - 在具体题型上,AI在选择题和单页解答题上获得满分(分别为29分和18分),但在跨页解答题上失分较多,得分为45.5分(满分为53分)[4][5] - 当前大语言模型在处理需要跨页面整合信息、建立长程逻辑联系的任务时存在局限,缺乏全局认知与工作记忆机制 [5] - 测试过程中,Rokid智能眼镜通过Wi-Fi传输高分辨率照片时耗电显著,答题30分钟电量从100%降至58% [6] 教育评估体系影响 - 实验引发对传统教育评估方式的反思,传统考试侧重于检验学生对已知知识的复现能力,而这正是AI的优势领域 [7][8] - 专家建议教育评估体系需重构,重点应从知识复现转向问题定义、创新解决方案设计、过程思维展现以及人机协作能力的培养 [8] - 在AI冲击下,教师角色需从知识传授者转型为学生成长的引导者、学习过程的设计者和思维发展的催化者 [8] 行业与社会挑战 - AI辅助学习工具的普及可能加剧教育不公平,优质AI资源可能首先惠及资源丰富的学校和学生 [9] - 学术诚信体系面临重建,多所高校已开始修订学术规范,明确界定AI使用场景,例如清华大学要求师生必须依规披露人工智能使用情况,并严禁代写、剽窃等行为 [9] - 研究团队强调需通过制定政策法规、技术监控、教育与宣传等综合监管措施,在保护学术诚信的同时推动教育技术创新 [11]