Meta超级智能实验室 (MSL) 发布首个大模型Muse Spark - Meta超级智能实验室 (MSL) 发布首个大模型Muse Spark,该团队由前Scale AI CEO领导,在九个月内从零重构了AI技术栈 [1] - Muse Spark具备多模态感知、工具调用、视觉思维链和多智能体协同能力,其深度思考模式在HLE测试中达到58% [1] - 该模型定位为个人超级智能基础,目前仅在Meta AI应用中使用,尚未开源,其未来走向可能影响Llama系列的发展 [1] Anthropic发布平台级智能体产品Claude Managed Agents - Anthropic推出Claude Managed Agents,这是一个全托管的智能体运行环境,可将开发周期从数月压缩至数天,并将任务成功率最高提升10个百分点 [2] - 该产品架构将智能体解耦为会话、控制器和沙箱三部分,实现独立可替换,使首token延迟p50下降60%、p95下降超过90% [2] - Notion、Rakuten、Asana等多家企业已在生产环境部署该产品,其按使用量计费,价格为每活跃会话小时0.08美元 [2] MiniMax发布面向Agent的全模态命令行工具MMX-CLI - MiniMax发布面向AI Agent的命令行工具MMX-CLI,使Agent能在如Claude Code等环境中原生调用图像、视频、语音、音乐等全模态能力 [3] - 该工具针对Agent场景做了专门优化,包括输出隔离纯数据模式、语义化状态码和非阻塞异步任务控制,以避免交互式界面干扰 [3] - 仅需两行代码即可安装,可无缝接入MiniMax Token Plan计费体系,支持Agent独立完成从文案到视频的完整自动化工作流 [3] World Labs发布Marble 1.1及1.1-Plus世界模型 - World Labs发布Marble 1.1和Marble 1.1-Plus两款世界模型,可通过单张照片在几分钟内生成可自由探索的3D空间场景 [4] - Marble 1.1侧重画质优化,改善了光照和明暗对比;而1.1-Plus侧重空间生成,能自动补出更大范围的3D世界 [4] - 当前世界模型技术仍难以兼顾大空间与高画质,1.1-Plus在扩展空间范围时画面细节有所下降,体现了成本与质量之间的权衡 [4] 字节发布全双工语音大模型Seeduplex - 字节跳动Seed团队发布原生全双工语音大模型Seeduplex,实现了“边听边说”的交互方式,并已在豆包App全量上线服务 [5] - 该模型在复杂声学环境下,将误回复率和误打断率降低了一半,抢话比例相对下降40%,判停延迟降低约250毫秒 [5] - 模型的应用使整体通话满意度绝对值提升8.34%,对话流畅度MOS分提升12%,但当前效果与真实人人对话相比仍有差距 [5] 微信支付发布AI原生接入工具箱 - 微信支付发布面向AI的支付接入Skill工具箱,包含Skill技能包、AI友好文档和AI友好API三大工具,支持通过自然语言描述需求自动生成代码 [7] - 工具箱内置代码诊断能力,可识别并拦截支付逻辑错误以避免商户资损,并支持智能排障以实时定位报错并给出修复方案 [7] - 该工具箱将接入时间从“天”级降至“分钟”级,适用于新商户零基础接入和已有开发者系统升级,旧接口可一键生成新版代码 [7] 腾讯QClaw V2大版本上线 - 腾讯QClaw V2版本上线多Agent功能,支持最多3个Agent并行工作并自定义性格口吻,以拆解消化复杂长任务 [8] - 该版本推出连接器功能实现跨应用直连,已接入腾讯文档、腾讯会议、Notion、邮箱等主流工具,一次授权即可随时调用 [8] - 业内首发“龙虾管家”安全防护功能,可实时拦截高风险脚本和文件误删操作,并提供完整的安全守护日志 [8] 腾讯Robotics X联合混元推出具身基础模型HY-Embodied - 腾讯混元联合Robotics X实验室发布HY-Embodied-0.5系列具身模型,包括MoT-2B和MoE-32B两款,在22项权威评测中取得16项最佳 [9] - 模型采用混合Transformer架构和原生分辨率视觉编码器,基于超过1亿(100M)高质量具身专属数据训练,实现了三维空间精细感知与物理交互预测 [9] - 模型已在机器人实机任务中验证有效,在打包、堆叠、悬挂等操作上优于pi0和pi0.5基线模型,其代码和权重已开源 [9]
腾讯研究院AI速递 20260410