大厂多模态Agent能力激战正酣

火山引擎产品发布 - 公司于12月18日发布豆包大模型1.8及音视频创作模型Seedance1.5pro [1] - 截至12月，豆包大模型日均token使用量突破50万亿，较去年同期增长超过10倍 [1] - 目前已有超过100家企业客户累计token使用量超过一万亿 [1] 豆包大模型1.8技术升级 - 模型核心升级围绕打造更强大的Agent大脑展开，针对多模态Agent场景进行定向优化 [2] - 在复杂指令遵循、多轮交互及操作系统级别实际操作能力上实现系统性增强 [2] - 视觉能力底层升级，单次视频理解帧数提升至1280帧，并能以低帧率解析超长视频 [2] Seedance1.5pro音视频创作模型 - 模型采用原生音视频联合生成架构，实现毫秒级音画同步 [2] - 能基于画面景深和角色数量，精准匹配多人、多语言对话的口型 [2] 行业阶段与趋势 - 大模型行业已从参数竞赛进入以多模态Agent为核心的产业落地新阶段 [3] - AI价值从“单点生成”向“全链路执行”质变，具备在垂直场景中闭环完成任务的能力 [3] - IT基础设施从“功能驱动”向“智能驱动”范式重构，未来软件形态将是以Agent为主体的智能协同网络 [3] - 大模型应用正在跨越“成本与稳定性”的规模化门槛 [3] 市场竞争格局 - 主要云厂商已将战略重心调整至多模态智能体平台，竞争维度升级为全栈技术、开发生态与行业场景的立体化角逐 [4] - 阿里云在9月全面升级全栈AI体系，其通义旗舰模型Qwen3-Max在聚焦Agent工具调用能力的Tau2-Bench测试中取得突破性高分 [4] - 阿里云发布Agent开发框架ModelStudio-ADK和低代码平台ModelStudio-ADP，将Agent开发效率提升至“1个小时”开发一个深度报告项目的水平 [4] - 百度搜索于10月15日全面升级文心助手AIGC创作能力，支持8种模态创作，并支持一键调用多工具解决多场景问题 [4] 火山引擎竞争策略 - 公司全面升级企业级AI Agent平台AgentKit，覆盖Agent从开发、部署到管控的全生命周期 [5] - 推出HiAgent智能体工作站，构建统一的企业AI任务调度中心，提供开箱即用的通用智能体并支持个性化定制 [6] - 推出业内首个“AI节省计划”，通过阶梯定价承诺最高可为按量付费企业节省47%的成本 [6]