腾讯研究院AI速递 20260622

一、GPT-5.6 Pro泄露，一句话48分钟生成完整《模拟人生》 - GPT-5.6 Pro在隐蔽测试中曝光，仅凭一句自然语言指令即可在48分钟内生成一个包含情感AI和职业系统的完整《模拟人生》游戏，无需传统工具链[1] - 模型知识截止时间推至2025年12月，内部推理容量“Juice Value”从768提升至960，涨幅达25%，图像到设计复刻接近像素级，并将支持浏览器自动化[1] - 社区判断OpenAI正通过GPT-5.5 Pro入口进行A/B测试，计划于6月25日公开发布，主力版本迭代周期被压缩至一个多月[1] 二、Codex推出Record & Replay，把人类操作录制成AI技能 - OpenAI为Codex发布Record & Replay功能，用户完整演示一遍操作后，Codex可观察学习并打包成可复用的skill，适用于报销、传视频、拉报表等重复且含隐性规则的任务[1] - 复现时，skill作为可复用的上下文，可调动Computer Use、浏览器操作和已装插件灵活执行，目前仅支持macOS且需先开启Computer Use，首发不覆盖欧盟、英国和瑞士[1] - 该功能的意义在于绕开API限制，让AI直接学习人类使用软件的方式，人类正从软件操作者转变为软件能力的训练者[1] 三、Claude Code支持Artifacts，把会话过程实时变成网页 - Anthropic宣布Claude Code支持Artifacts功能，能将终端中与AI的工作过程实时转化为可交互、可分享的网页，如PR走查、架构图、事故时间线、发布清单，并随会话进展自动刷新[2] - 生成依托会话完整上下文，无需手动连接数据源，产出固定链接，每次发布即生成新版本，历史可回溯，还提供画廊视图进行统一管理[2] - 功能面向法务、隐私、安全、SRE、工程经理等多角色，目前以Beta形式向Team和Enterprise计划开放，旨在降低团队围绕AI产出的沟通成本[2] 四、Midjourney进军医疗，超声扫描仪60秒生成全身3D地图 - Midjourney官宣进军医疗硬件领域，将在旧金山开设Spa馆，核心产品是Midjourney Scanner全身超声波扫描仪，可将上千美元、一小时的全身体检压缩到几美元、几分钟内完成[2] - 设备原理类比海豚回声定位，约50万个微型换能器单元每秒产生数TB数据，经AI语义分割拼合成亚毫米级精度的全身3D地图，目标在60秒内完成，比MRI快近100倍[2] - 团队计划在2027年底首店开业，并在2031年前于全球部署超过5万台设备，当前信息限定于生成身体成分图谱，后续将逐步申请诊断批准[2] 五、虚幻引擎5.8内置MCP支持，AI原生接入3A游戏开发 - Epic在虚幻引擎5.8中将模型上下文协议（MCP）集成进引擎本体而非作为插件，使其成为官方支持的协议层，标志着AI原生开始接入3A游戏开发流程[3] - 实测中，AI可用自然语言摆放道具、生成街区、批量操作场景对象（如生成400个立方体并用Cable连接）、修改光照氛围，并自动生成脚本和配置物理碰撞[3] - Epic同步公开了UE6路线图，明确将Claude、Codex等AI工具纳入3A制作主流程，此举可能推动Blender、Maya等数字内容创作（DCC）工具跟进类似接口[3] 六、AlphaFold之父John Jumper离开谷歌，加盟Anthropic - 诺奖得主、AlphaFold核心人物John Jumper在DeepMind工作近九年后宣布加入竞争对手Anthropic，此前两天Transformer作者Noam Shazeer刚离职加入OpenAI，谷歌在48小时内连失两员大将[3] - 外界分析推力在于DeepMind在企业级AI编程工具方面缺乏清晰方案，而Jumper近期工作与AI编程深度绑定；拉力则是Anthropic在生命科学领域持续进行重金投入[3] - 公开榜单显示Gemini已掉出第一梯队，Gemini 3.5 Pro一再跳票，团队内部弥漫着沮丧情绪[3] 七、小米发布Miloco 2.0，MiMo大模型驱动的全屋智能AI管家 - 小米开源了以MiMo大模型为核心的全屋智能方案Miloco 2.0，以摄像头为眼、麦克风为耳、米家设备为手脚，让智能家居从听指令升级为会思考、能主动跟进[4] - 相比1.0的规则驱动，2.0带来多模态感知、主动智能、家庭记忆、持续任务四大升级，能承接长期目标并主动提醒干预，以智能体（Agent）形式接入OpenClaw实现一键部署[4] - 在隐私方面，方案坚持原始画面用完即弃、数据本地保存并可清空，本身开源免费（限非商用），主要成本为硬件设备与大模型API调用[4] 八、银河通用发布AstraBrain-WBC 0.5，验证运控Scaling Law - 银河通用用20亿帧动捕数据训练出全球首个人形机器人全身实时运控基座模型，其零样本泛化新动作的成功率从传统MLP的76.89%提升至92.58%，推理延迟仅0.39毫秒，比TWIST方法快约5倍[4] - 该研究系统性地证明了Scaling Law在运动控制领域同样成立，关键创新在于换用GPT风格的因果Transformer架构，并通过谐波运动嵌入实现动作多样性与均衡采样，再以384个专家模型蒸馏为统一策略[4] - 模型参数达到8040万，接近GPT-1的规模，相关论文已被CVPR 2026接收，下一步计划与视觉语言动作（VLA）模型对接，迈向通用具身基础模型[4] 九、斯坦福报告：中国本土培养的顶尖AI人才正加速崛起 - 斯坦福胡佛研究所追踪了DeepSeek七篇论文背后的356名研究者，发现80位有美国经历的研究者平均被引次数达4108次，是成就最高的群体，其中绝大多数现已回到中国[5] - 在271位有记录的研究者中，53.5%的人从未离开中国，31位核心成员中有10人完全由本土体系培养，支撑这些人才的中科院、清华等机构网络在一年内快速扩张[5] - 报告指出美国面临人才留存与本土培养管道两大挑战，限制人才流动的策略已失去一半靶子，中国的人才供应链已进入产出加速期[5] 十、马斯克预测GLM明年Q1追平Fable，唐杰回应用不了那么久 - 智谱开源旗舰模型GLM-5.2引发关注，抱抱脸（Hugging Face）首次自掏腰包为中国模型提供连续6小时的全球免费算力，马斯克预测GLM可能在2027年第一季度达到Fable的水平，智谱CEO唐杰回应“用不了那么久”[5] - GLM-5.2采用MIT协议开源，允许免费商用，支持100万（1M）稳定上下文，提出的IndexShare机制使在百万token下的每token计算量降低约2.9倍，在Code Arena排行榜上居全球可用模型第一[5] - 该模型与Claude Opus 4.8的性能差距已收窄至1%-4%，发布首日即完成对昇腾等国产算力平台的全适配；在OpenRouter平台上，中国模型的调用量占比已超过50%[5]