Workflow
星纪魅族StarV Air2
icon
搜索文档
港科大教授实测AI眼镜“作弊”:30分钟碾压95%的学生,把传统教学评估体系整破防了
量子位· 2026-01-06 15:06
实验概述与核心结果 - 香港科技大学教授团队主导实验,让搭载ChatGPT-5.2模型的AI眼镜参加《计算机网络原理》本科期末考试,在复刻真实考试条件下完成整套试卷[1][7] - AI眼镜通过“眼镜—手机—云端”链路工作:摄像头拍摄题目,传输至远程大模型推理,答案返回并显示在眼镜屏幕上供学生抄录,过程丝滑[12] - 该AI眼镜在30分钟内交卷,取得92.5分(满分100分),在百余人排名中跻身前五,轻松碾压超过95%的人类考生[4] - 具体得分情况:多项选择题(29/29满分),单页短答题(18/18满分),跨页短答题(45.5/53分)[14] 硬件与模型选择 - 项目团队系统评估了12款主流商业智能眼镜,最终候选为同时具备内置摄像头和集成显示屏的Meta Ray-Ban、Frame以及乐奇Rokid[8] - 因Meta未开放对显示内容的直接控制接口,而Frame相机画质有限,团队最终选择乐奇Rokid AI眼镜,因其SDK更丰富、生态更完善、开发自由度更高[9][10][11] - 在大模型选择上,团队对比多款主流模型后,锁定OpenAI最新的ChatGPT-5.2,因其响应速度和通用知识能力较强[11] 技术性能与当前局限 - AI眼镜在跨页短答题中展现出极强的推理连贯性,即便计算复杂部分偶有偏差,中间步骤也非常完整[14] - 主要暴露的短板是功耗问题:在开启Wi-Fi、持续进行高分辨率图像传输的高压连续场景下,30分钟内眼镜电量从100%迅速降至58%[18] - 摄像头清晰度直接决定AI的“视力”,题目若出现模糊、反光或拍摄角度偏差,会导致AI基于不完整信息推理,答题稳定性明显下滑[19] 对传统教学评估体系的冲击 - 实验表明,当教学评估主要关注能否交出“标准答案”时,这恰好落在AI最擅长且最稳定的能力区间内[21] - 以知识点掌握和标准解题路径为核心的传统评估方式,在AI时代开始显得吃力[21] - 英国雷丁大学的一项研究发现,AI生成的答卷混入考试后,有高达94%成功蒙混过关,且AI平均成绩明显高于真实学生[30] - 这引发核心问题:当AI比人更擅长按标准作答时,以笔试为核心、衡量知识点掌握程度的评估体系到底在测量什么[32] 未来教育评估的可能方向 - 传统评估长期只集中捕捉了人类多维智能中非常狭窄的一段(如语言、逻辑数学),难以评估创造力、协作能力等[40][42] - 评估重心需要从“交答案”转向“交思路”,关注学习过程、思考路径和决策质量,这些是AI最难替代且最能区分学生真实素养的地方[37][38] - 一些新的评估尝试已经出现,例如纽约大学商学院教授推出的由AI支撑的口试评估,学生需当场解释决策依据和思路,AI充当考官并进行评分[43][44] - 更现实的挑战是如何让学生把AI用在信息整理、方案推演上,而将人的精力集中到判断、理解和选择等无法被“外包”的环节[48]
从“模速空间”到“张江实践” 科技服务业激活创新生态链
中国证券报· 2025-05-26 04:43
科技服务业发展 - 科技服务业是连接科技创新与市场需求的重要桥梁 工信部等九部门联合印发《关于加快推进科技服务业高质量发展的实施意见》 旨在壮大服务主体 优化发展生态 提升服务能力 加快科技成果转化和产业化 [1] - 我国已建设1.6万家科技型孵化器 形成覆盖全国95%县级以上地区的孵化服务体系 累计孵化上市(挂牌)企业超过5000家 科创板上市企业中三分之一为孵化器培育企业 [7] 模速空间AI孵化器 - 模速空间是上海黄浦江畔的AI孵化器 已吸引上百家知名AI大模型企业及研究机构入驻 辐射带动徐汇区聚集大模型企业近400家 累计推动43个备案大模型落地 约占上海全市的61% [2] - 模速空间打造算力调度平台 公共语料平台 金融服务平台 人才服务平台 场景对接平台等五大公共服务平台 着力解决AI初创企业算力贵 语料缺 融资难等问题 [3] - 徐汇区将构建"1+3+X"人工智能全域载体布局 加快建成环模速空间的5万方载体 给予符合要求的人工智能企业货币化租金补贴 [4] 标杆企业案例 - 无问芯穹是模速空间发展最快的企业之一 团队从7人发展到200人左右 研发人员占比超过70% 35%来自清华大学 公司致力于成为标准化算力运营商 [3] - 星纪魅族 特赞科技和斑马智行等企业致力于在应用层发挥AI效能 斑马智行已与宝马 奥迪 大众等全球一线车企合作 [3][4] 新型研发机构与平台 - 国家地方共建人形机器人创新中心致力于开发人形机器人共性技术底座 已发布国内首个全尺寸开源通用人形机器人公版机"青龙" 并建立OpenLoong开源社区 [5] - 晶泰科技构建智能自主实验平台 借助AI完成实验设计 由机器人执行重复性工作 平台应用于化学合成 配方筛选 中药分析等场景 并融入石油化工 新能源 新材料等行业 [5][6] 孵化服务升级 - 孵化服务正从提供物理场所向超前孵化 深度孵化 投孵联动等专业化服务转变 上海围绕脑机接口 量子计算 绿色燃料等未来产业赛道制定发展方案 [7][8] - 北京朝阳国际科技创新服务有限公司帮助企业降本和创收 基于朝阳的场景优势 为AI 机器人等领域创业企业寻找和落地应用场景 [8] 科技成果转化 - 工信部提出建机制 搭平台 壮主体 育市场 优生态 推动创新链和产业链无缝对接 完善"先用后付" 成果赋权等机制 健全技术经理人需求牵引 人才培养 职业激励等机制 [9]