一、GPT-5.6 Pro泄露,一句话48分钟生成完整《模拟人生》 - GPT-5.6 Pro在隐蔽测试中曝光,仅凭一句自然语言指令即可在48分钟内生成一个包含情感AI和职业系统的完整《模拟人生》游戏,无需传统工具链[1] - 模型知识截止时间推至2025年12月,内部推理容量“Juice Value”从768提升至960,涨幅达25%,图像到设计复刻接近像素级,并将支持浏览器自动化[1] - 社区判断OpenAI正通过GPT-5.5 Pro入口进行A/B测试,计划于6月25日公开发布,主力版本迭代周期被压缩至一个多月[1] 二、Codex推出Record & Replay,把人类操作录制成AI技能 - OpenAI为Codex发布Record & Replay功能,用户完整演示一遍操作后,Codex可观察学习并打包成可复用的skill,适用于报销、传视频、拉报表等重复且含隐性规则的任务[1] - 复现时,skill作为可复用的上下文,可调动Computer Use、浏览器操作和已装插件灵活执行,目前仅支持macOS且需先开启Computer Use,首发不覆盖欧盟、英国和瑞士[1] - 该功能的意义在于绕开API限制,让AI直接学习人类使用软件的方式,人类正从软件操作者转变为软件能力的训练者[1] 三、Claude Code支持Artifacts,把会话过程实时变成网页 - Anthropic宣布Claude Code支持Artifacts功能,能将终端中与AI的工作过程实时转化为可交互、可分享的网页,如PR走查、架构图、事故时间线、发布清单,并随会话进展自动刷新[2] - 生成依托会话完整上下文,无需手动连接数据源,产出固定链接,每次发布即生成新版本,历史可回溯,还提供画廊视图进行统一管理[2] - 功能面向法务、隐私、安全、SRE、工程经理等多角色,目前以Beta形式向Team和Enterprise计划开放,旨在降低团队围绕AI产出的沟通成本[2] 四、Midjourney进军医疗,超声扫描仪60秒生成全身3D地图 - Midjourney官宣进军医疗硬件领域,将在旧金山开设Spa馆,核心产品是Midjourney Scanner全身超声波扫描仪,可将上千美元、一小时的全身体检压缩到几美元、几分钟内完成[2] - 设备原理类比海豚回声定位,约50万个微型换能器单元每秒产生数TB数据,经AI语义分割拼合成亚毫米级精度的全身3D地图,目标在60秒内完成,比MRI快近100倍[2] - 团队计划在2027年底首店开业,并在2031年前于全球部署超过5万台设备,当前信息限定于生成身体成分图谱,后续将逐步申请诊断批准[2] 五、虚幻引擎5.8内置MCP支持,AI原生接入3A游戏开发 - Epic在虚幻引擎5.8中将模型上下文协议(MCP)集成进引擎本体而非作为插件,使其成为官方支持的协议层,标志着AI原生开始接入3A游戏开发流程[3] - 实测中,AI可用自然语言摆放道具、生成街区、批量操作场景对象(如生成400个立方体并用Cable连接)、修改光照氛围,并自动生成脚本和配置物理碰撞[3] - Epic同步公开了UE6路线图,明确将Claude、Codex等AI工具纳入3A制作主流程,此举可能推动Blender、Maya等数字内容创作(DCC)工具跟进类似接口[3] 六、AlphaFold之父John Jumper离开谷歌,加盟Anthropic - 诺奖得主、AlphaFold核心人物John Jumper在DeepMind工作近九年后宣布加入竞争对手Anthropic,此前两天Transformer作者Noam Shazeer刚离职加入OpenAI,谷歌在48小时内连失两员大将[3] - 外界分析推力在于DeepMind在企业级AI编程工具方面缺乏清晰方案,而Jumper近期工作与AI编程深度绑定;拉力则是Anthropic在生命科学领域持续进行重金投入[3] - 公开榜单显示Gemini已掉出第一梯队,Gemini 3.5 Pro一再跳票,团队内部弥漫着沮丧情绪[3] 七、小米发布Miloco 2.0,MiMo大模型驱动的全屋智能AI管家 - 小米开源了以MiMo大模型为核心的全屋智能方案Miloco 2.0,以摄像头为眼、麦克风为耳、米家设备为手脚,让智能家居从听指令升级为会思考、能主动跟进[4] - 相比1.0的规则驱动,2.0带来多模态感知、主动智能、家庭记忆、持续任务四大升级,能承接长期目标并主动提醒干预,以智能体(Agent)形式接入OpenClaw实现一键部署[4] - 在隐私方面,方案坚持原始画面用完即弃、数据本地保存并可清空,本身开源免费(限非商用),主要成本为硬件设备与大模型API调用[4] 八、银河通用发布AstraBrain-WBC 0.5,验证运控Scaling Law - 银河通用用20亿帧动捕数据训练出全球首个人形机器人全身实时运控基座模型,其零样本泛化新动作的成功率从传统MLP的76.89%提升至92.58%,推理延迟仅0.39毫秒,比TWIST方法快约5倍[4] - 该研究系统性地证明了Scaling Law在运动控制领域同样成立,关键创新在于换用GPT风格的因果Transformer架构,并通过谐波运动嵌入实现动作多样性与均衡采样,再以384个专家模型蒸馏为统一策略[4] - 模型参数达到8040万,接近GPT-1的规模,相关论文已被CVPR 2026接收,下一步计划与视觉语言动作(VLA)模型对接,迈向通用具身基础模型[4] 九、斯坦福报告:中国本土培养的顶尖AI人才正加速崛起 - 斯坦福胡佛研究所追踪了DeepSeek七篇论文背后的356名研究者,发现80位有美国经历的研究者平均被引次数达4108次,是成就最高的群体,其中绝大多数现已回到中国[5] - 在271位有记录的研究者中,53.5%的人从未离开中国,31位核心成员中有10人完全由本土体系培养,支撑这些人才的中科院、清华等机构网络在一年内快速扩张[5] - 报告指出美国面临人才留存与本土培养管道两大挑战,限制人才流动的策略已失去一半靶子,中国的人才供应链已进入产出加速期[5] 十、马斯克预测GLM明年Q1追平Fable,唐杰回应用不了那么久 - 智谱开源旗舰模型GLM-5.2引发关注,抱抱脸(Hugging Face)首次自掏腰包为中国模型提供连续6小时的全球免费算力,马斯克预测GLM可能在2027年第一季度达到Fable的水平,智谱CEO唐杰回应“用不了那么久”[5] - GLM-5.2采用MIT协议开源,允许免费商用,支持100万(1M)稳定上下文,提出的IndexShare机制使在百万token下的每token计算量降低约2.9倍,在Code Arena排行榜上居全球可用模型第一[5] - 该模型与Claude Opus 4.8的性能差距已收窄至1%-4%,发布首日即完成对昇腾等国产算力平台的全适配;在OpenRouter平台上,中国模型的调用量占比已超过50%[5]
腾讯研究院AI速递 20260622