腾讯研究院AI速递 20260410

Meta超级智能实验室 (MSL) 发布首个大模型Muse Spark - Meta超级智能实验室 (MSL) 发布首个大模型Muse Spark，该团队由前Scale AI CEO领导，在九个月内从零重构了AI技术栈 [1] - Muse Spark具备多模态感知、工具调用、视觉思维链和多智能体协同能力，其深度思考模式在HLE测试中达到58% [1] - 该模型定位为个人超级智能基础，目前仅在Meta AI应用中使用，尚未开源，其未来走向可能影响Llama系列的发展 [1] Anthropic发布平台级智能体产品Claude Managed Agents - Anthropic推出Claude Managed Agents，这是一个全托管的智能体运行环境，可将开发周期从数月压缩至数天，并将任务成功率最高提升10个百分点 [2] - 该产品架构将智能体解耦为会话、控制器和沙箱三部分，实现独立可替换，使首token延迟p50下降60%、p95下降超过90% [2] - Notion、Rakuten、Asana等多家企业已在生产环境部署该产品，其按使用量计费，价格为每活跃会话小时0.08美元 [2] MiniMax发布面向Agent的全模态命令行工具MMX-CLI - MiniMax发布面向AI Agent的命令行工具MMX-CLI，使Agent能在如Claude Code等环境中原生调用图像、视频、语音、音乐等全模态能力 [3] - 该工具针对Agent场景做了专门优化，包括输出隔离纯数据模式、语义化状态码和非阻塞异步任务控制，以避免交互式界面干扰 [3] - 仅需两行代码即可安装，可无缝接入MiniMax Token Plan计费体系，支持Agent独立完成从文案到视频的完整自动化工作流 [3] World Labs发布Marble 1.1及1.1-Plus世界模型 - World Labs发布Marble 1.1和Marble 1.1-Plus两款世界模型，可通过单张照片在几分钟内生成可自由探索的3D空间场景 [4] - Marble 1.1侧重画质优化，改善了光照和明暗对比；而1.1-Plus侧重空间生成，能自动补出更大范围的3D世界 [4] - 当前世界模型技术仍难以兼顾大空间与高画质，1.1-Plus在扩展空间范围时画面细节有所下降，体现了成本与质量之间的权衡 [4] 字节发布全双工语音大模型Seeduplex - 字节跳动Seed团队发布原生全双工语音大模型Seeduplex，实现了“边听边说”的交互方式，并已在豆包App全量上线服务 [5] - 该模型在复杂声学环境下，将误回复率和误打断率降低了一半，抢话比例相对下降40%，判停延迟降低约250毫秒 [5] - 模型的应用使整体通话满意度绝对值提升8.34%，对话流畅度MOS分提升12%，但当前效果与真实人人对话相比仍有差距 [5] 微信支付发布AI原生接入工具箱 - 微信支付发布面向AI的支付接入Skill工具箱，包含Skill技能包、AI友好文档和AI友好API三大工具，支持通过自然语言描述需求自动生成代码 [7] - 工具箱内置代码诊断能力，可识别并拦截支付逻辑错误以避免商户资损，并支持智能排障以实时定位报错并给出修复方案 [7] - 该工具箱将接入时间从“天”级降至“分钟”级，适用于新商户零基础接入和已有开发者系统升级，旧接口可一键生成新版代码 [7] 腾讯QClaw V2大版本上线 - 腾讯QClaw V2版本上线多Agent功能，支持最多3个Agent并行工作并自定义性格口吻，以拆解消化复杂长任务 [8] - 该版本推出连接器功能实现跨应用直连，已接入腾讯文档、腾讯会议、Notion、邮箱等主流工具，一次授权即可随时调用 [8] - 业内首发“龙虾管家”安全防护功能，可实时拦截高风险脚本和文件误删操作，并提供完整的安全守护日志 [8] 腾讯Robotics X联合混元推出具身基础模型HY-Embodied - 腾讯混元联合Robotics X实验室发布HY-Embodied-0.5系列具身模型，包括MoT-2B和MoE-32B两款，在22项权威评测中取得16项最佳 [9] - 模型采用混合Transformer架构和原生分辨率视觉编码器，基于超过1亿（100M）高质量具身专属数据训练，实现了三维空间精细感知与物理交互预测 [9] - 模型已在机器人实机任务中验证有效，在打包、堆叠、悬挂等操作上优于pi0和pi0.5基线模型，其代码和权重已开源 [9]