Workflow
Marble 1.1
icon
搜索文档
腾讯研究院AI速递 20260410
腾讯研究院· 2026-04-10 00:25
Meta超级智能实验室 (MSL) 发布首个大模型Muse Spark - Meta超级智能实验室 (MSL) 发布首个大模型Muse Spark,该团队由前Scale AI CEO领导,在九个月内从零重构了AI技术栈 [1] - Muse Spark具备多模态感知、工具调用、视觉思维链和多智能体协同能力,其深度思考模式在HLE测试中达到58% [1] - 该模型定位为个人超级智能基础,目前仅在Meta AI应用中使用,尚未开源,其未来走向可能影响Llama系列的发展 [1] Anthropic发布平台级智能体产品Claude Managed Agents - Anthropic推出Claude Managed Agents,这是一个全托管的智能体运行环境,可将开发周期从数月压缩至数天,并将任务成功率最高提升10个百分点 [2] - 该产品架构将智能体解耦为会话、控制器和沙箱三部分,实现独立可替换,使首token延迟p50下降60%、p95下降超过90% [2] - Notion、Rakuten、Asana等多家企业已在生产环境部署该产品,其按使用量计费,价格为每活跃会话小时0.08美元 [2] MiniMax发布面向Agent的全模态命令行工具MMX-CLI - MiniMax发布面向AI Agent的命令行工具MMX-CLI,使Agent能在如Claude Code等环境中原生调用图像、视频、语音、音乐等全模态能力 [3] - 该工具针对Agent场景做了专门优化,包括输出隔离纯数据模式、语义化状态码和非阻塞异步任务控制,以避免交互式界面干扰 [3] - 仅需两行代码即可安装,可无缝接入MiniMax Token Plan计费体系,支持Agent独立完成从文案到视频的完整自动化工作流 [3] World Labs发布Marble 1.1及1.1-Plus世界模型 - World Labs发布Marble 1.1和Marble 1.1-Plus两款世界模型,可通过单张照片在几分钟内生成可自由探索的3D空间场景 [4] - Marble 1.1侧重画质优化,改善了光照和明暗对比;而1.1-Plus侧重空间生成,能自动补出更大范围的3D世界 [4] - 当前世界模型技术仍难以兼顾大空间与高画质,1.1-Plus在扩展空间范围时画面细节有所下降,体现了成本与质量之间的权衡 [4] 字节发布全双工语音大模型Seeduplex - 字节跳动Seed团队发布原生全双工语音大模型Seeduplex,实现了“边听边说”的交互方式,并已在豆包App全量上线服务 [5] - 该模型在复杂声学环境下,将误回复率和误打断率降低了一半,抢话比例相对下降40%,判停延迟降低约250毫秒 [5] - 模型的应用使整体通话满意度绝对值提升8.34%,对话流畅度MOS分提升12%,但当前效果与真实人人对话相比仍有差距 [5] 微信支付发布AI原生接入工具箱 - 微信支付发布面向AI的支付接入Skill工具箱,包含Skill技能包、AI友好文档和AI友好API三大工具,支持通过自然语言描述需求自动生成代码 [7] - 工具箱内置代码诊断能力,可识别并拦截支付逻辑错误以避免商户资损,并支持智能排障以实时定位报错并给出修复方案 [7] - 该工具箱将接入时间从“天”级降至“分钟”级,适用于新商户零基础接入和已有开发者系统升级,旧接口可一键生成新版代码 [7] 腾讯QClaw V2大版本上线 - 腾讯QClaw V2版本上线多Agent功能,支持最多3个Agent并行工作并自定义性格口吻,以拆解消化复杂长任务 [8] - 该版本推出连接器功能实现跨应用直连,已接入腾讯文档、腾讯会议、Notion、邮箱等主流工具,一次授权即可随时调用 [8] - 业内首发“龙虾管家”安全防护功能,可实时拦截高风险脚本和文件误删操作,并提供完整的安全守护日志 [8] 腾讯Robotics X联合混元推出具身基础模型HY-Embodied - 腾讯混元联合Robotics X实验室发布HY-Embodied-0.5系列具身模型,包括MoT-2B和MoE-32B两款,在22项权威评测中取得16项最佳 [9] - 模型采用混合Transformer架构和原生分辨率视觉编码器,基于超过1亿(100M)高质量具身专属数据训练,实现了三维空间精细感知与物理交互预测 [9] - 模型已在机器人实机任务中验证有效,在打包、堆叠、悬挂等操作上优于pi0和pi0.5基线模型,其代码和权重已开源 [9]
李飞飞发布全新世界模型
量子位· 2026-04-09 14:58
梦瑶 发自 凹非寺 量子位 | 公众号 QbitAI 李飞飞世界模型新成果又又又来了! World Labs直接一口气放出了两款新模型: Marble 1.1 和 Marble 1.1-Plus 。 主打一个——几分钟,就能把真实地点「搬」进3D世界~(开眼啦.jpg) 例如,随手拍几张房间的多视角照片然后喂给模型,我们就能得到一个能自由查看、带空间感的完整3D房间: 哪怕只有一张普通照片,它也能直接往外长出一个超超超大视野的3D世界,是不是有点VR眼镜的效果了! 还没完,因为除了能用平面生成3D世界外—— 模型还能将原本高糊的画面提高清晰度,提高画面亮度对比度,最后生成一个视觉细节更丰富的视觉效果: 网友看到这效果,真·蚌埠住了,直言:这简直是每个室内设计师的梦想!! | cristina brodu � @CriB3001 · 4小时 | | | | | --- | --- | --- | --- | | the dream of every interior designer!! | | | | | 这是每个室内设计师的梦想! ! | | | | | () 1 11 | (21 | 111 29 | N ...
李飞飞World Labs双模齐发,能「造」超复杂大场景,一手实测
机器之心· 2026-04-09 08:51
公司产品更新 - World Labs推出两款新的生成式世界模型:Marble 1.1和Marble 1.1-Plus [2] - Marble 1.1在照明效果、对比度和整体视觉一致性上有显著提升,大幅减少视觉瑕疵 [2] - Marble 1.1-Plus是专为大规模场景打造的全新模型,能够生成比以往更大、更复杂的世界环境 [2] - 公司创始人李飞飞评论称,逐步改进Marble,在生成更大世界方面并非夸张 [3] 产品定位与使用 - 官方建议初次使用者优先选择Marble 1.1,因其生成质量更高、更稳定;创建大型复杂场景时再切换到Marble 1.1-Plus [4] - Marble 1.1被定位为新的默认模型,取代了被标记为Marble 1.0的旧版本 [20] - 开发者可以通过API立即使用这两个模型 [4] - 平台提供两种输入模式:2D输入(添加图片、视频或全景图生成3D世界)和3D输入(使用内置Chisel工具根据自定义3D布局生成世界) [7] 产品功能与实测 - 模型支持全景编辑功能,用户可在已生成的世界中选择编辑区域,输入新提示词以精准修改内容 [9] - 平台提供Expand功能,可通过创建无缝扩展将世界扩展到原始边界之外,但目前该功能需要付费使用 [10] - 实测显示,Marble 1.1-Plus成功生成了规模更大、细节更丰富的复杂环境 [10] - 案例显示,Marble 1.1能基于真实空间的全景图,生成一个“平行版本”的空间,具有更复杂的布局和光照层次 [13] 商业模式与定价 - Marble 1.1的生成价格为1500 credits,旧版模型Marble 1.0的生成价格也为1500 credits [21] - 此次升级在固定成本和使用流程前提下实现更高质量的世界生成,对用户而言是一次“无感升级” [22] - Marble 1.1 Plus的生成价格为1500 credits基础费用外加0–1500 credits的“可变世界”生成费用,这是Marble首次引入可变成本机制以适配不同规模需求 [23][24] - 另有一个Marble 1.0 Draft模型,是当前速度最快的模型,适合快速探索想法与测试提示词,生成价格为150 credits [25] 公司发展动态 - 自去年11月正式发布生成式世界模型以来,World Labs在短短几个月内接连完成了多项关键进展,包括优化导出功能、推出API、完成十亿美元级别的融资等 [20]