Workflow
AI节省计划
icon
搜索文档
豆包大模型日均调用量突破50万亿tokens 火山引擎深化AI时代Agent生态变革
新浪财经· 2025-12-20 04:27
核心观点 - 火山引擎发布豆包大模型1.8与音视频创作模型Seedance 1.5 pro,其大模型在多模态理解、生成及Agent能力上已跻身全球第一梯队,并展示了强劲的用户增长与商业化进展 [3] - 公司通过技术创新与成本优化,致力于降低人工智能技术门槛,推动AI普惠化落地,并认为大模型市场未来增长空间广阔,焦点在于共同开拓而非存量竞争 [3][6] - 公司正构建从模型能力到AI云原生基础设施的全面能力,以支持企业级Agent从开发到规模化运营,加速AI在各行各业的深度落地 [9][10] 豆包大模型1.8的技术升级与能力 - 模型定位从知识库转向执行器,针对多模态Agent场景进行定向优化,增强了工具调用、复杂指令遵循及OS Agent能力 [3][4] - 多模态理解能力实现飞跃,单次视频理解帧数从640帧提升至1280帧,支持以低帧率理解超长视频并调用工具进行高帧率关键片段分析 [4] - 在视频运动理解、复杂空间理解、文档OCR能力方面均有提升 [5] - 支持256K长上下文窗口,可通过API进行上下文管理,以更好地支持长程Agent任务 [5] - 通过更大的图片转tokens压缩比和思考长度可调节优化,在提升效果的同时进一步优化了成本 [5] - 在多项公开评测中表现强劲,在视觉推理、通用视觉问答、空间理解及视频理解等任务中获最佳或接近最佳成绩,在通用智能体测评集BrowseComp上全球领先,数学与推理等基础能力接近全球顶尖通用模型 [6] 豆包大模型的商业化进展与市场策略 - 截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍 [3] - 目前已有超过100家企业客户累计token使用量超过1万亿 [3] - 公司认为大模型市场明年规模能再扩大10倍,各方焦点在于携手开拓增长空间而非存量竞争 [6] - 发布了豆包助手API,将对话、思考、搜索等核心能力开放,帮助企业开箱即用或构建自定义豆包 [10] - 推出了业内首个全模型参与抵扣的AI节省计划,基于承诺用量提供阶梯式折扣,最高能帮助企业节省47%的成本 [10] 音视频创作模型Seedance 1.5 pro的创新 - 采用创新的原生音视频联合生成架构,能同时处理环境音、背景音乐和人声对白,实现毫秒级音画同步,解决了口型对不上、音画脱节的问题 [7] - 支持多人多语言对话,口型对齐精准,覆盖中文方言、英文及小语种 [7] - 在运动细节捕捉和人物情绪呈现上达到影视级标准,具备自发的镜头调度能力,可执行长镜头跟随、希区柯克变焦等高难度专业运镜 [7] - 即将上线“Draft样片”功能,可生成低分辨率样片预览,据测算可帮助创作者提升65%的整体效率,并减少60%的无效创作成本 [8] - 个人用户已在豆包、即梦AI等平台可体验,企业用户自12月23日起可通过火山引擎API接入服务 [8] AI云原生架构与企业级Agent生态 - 传统的IT架构已无法满足Agent时代需求,以模型为中心的AI云原生架构正在形成并围绕Agent开发与运营进行重构 [9] - 在企业Agent开发层面,全面升级了企业级AI Agent平台AgentKit,覆盖Agent从开发、部署到管控的全生命周期 [9] - 在企业Agent运营层面,推出了HiAgent智能体工作站,构建统一的企业AI任务调度中心,提供开箱即用的通用智能体并支持个性化定制,2025年累计服务数百家行业头部企业 [9] - 企业Agent应用正发生关键跨越:平均一家企业投产的智能体数量从2024年的几十个增至2025年的200多个,个别企业甚至超过千个;应用场景从to C娱乐延伸到to B的严肃生产场景 [10] - 小米集团案例显示,AI云原生架构帮助其手机业务将资源交付周期从一周缩短到10分钟以内,并帮助汽车业务提升训练稳定性和仿真效率,缩短算法迭代和上车周期 [9]
火山引擎,发布新模型
新华网财经· 2025-12-18 22:07
豆包大模型1.8与Seedance 1.5pro发布 - 火山引擎在FORCE原动力大会上正式发布豆包大模型1.8及音视频创作模型Seedance 1.5pro [1] - 豆包大模型1.8面向多模态Agent场景进行了定向优化,增强了工具调用、复杂指令遵循及OS Agent能力,旨在成为更强多模态Agent的“大脑” [3][4] - Seedance 1.5pro是音视频创作模型,具备影视级叙事张力,在音画同步技术上取得突破性进展 [5] 模型性能与市场表现 - 截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍 [3] - 目前已有超过100家企业客户累计token使用量超过一万亿 [3] - 豆包1.8在多项公开评测中表现具竞争力:在视觉推理、通用视觉问答、空间理解及视频理解等任务中获最佳或接近最佳成绩;在通用智能体测评集BrowserComp上表现全球领先;在数学与推理等基础能力维度上接近全球顶尖通用模型 [4] - 豆包1.8的单次视频理解帧数从640帧倍增至1280帧,支持以低帧率理解超长视频并调用工具对关键片段进行高帧率理解 [4] Seedance 1.5pro技术细节与效率提升 - Seedance 1.5pro采用创新的原生音视频联合生成架构,支持环境音、背景音乐、人声等多种元素,实现毫秒级音画同步输出 [6] - 该模型在对白处理上提供丰富精细选择,支持多人多语言对话且口型对齐精准,语言能力覆盖中文方言、英文及小语种 [6] - 即将上线的“Draft样片”功能可先生成低分辨率样片预览,关键要素与最终成片高度一致,可帮助创作者提升65%的整体效率并减少60%的无效创作成本 [6] 产品服务与接入 - 个人用户已可在豆包、即梦AI等平台体验Seedance 1.5pro模型 [7] - 企业用户可从12月23日起通过火山引擎API接入Seedance 1.5pro模型服务 [7] AI Agent战略与平台升级 - 火山引擎认为以模型为中心的AI云原生架构正在形成,并围绕Agent的开发与运营进行重构 [8] - 公司升级了企业级AI Agent平台AgentKit,覆盖Agent从开发、部署到管控的全生命周期 [8] - 公司推出了HiAgent智能体工作站,通过构建统一的企业AI任务调度中心、提供开箱即用的通用智能体及支持个性化定制,帮助企业实现Agent的规模化管理与应用 [8] - 公司推出了业内首个“AI节省计划”,覆盖所有按量后付费的大模型产品,通过阶梯式折扣最高可帮助企业节省47%的成本 [8]
火山引擎:以智能体为负载的人工智能时代加速到来
新华财经· 2025-12-18 21:59
行业技术架构演进 - 以智能体为负载的人工智能时代正加速到来,传统的基础设施即服务、平台即服务、软件即服务分层规划的信息技术架构不再有效 [1] - 技术载体从个人计算机时代的网页、移动时代的手机应用,演进为人工智能时代的智能体 [1] - 行业正在形成以模型为中心的人工智能云原生架构,模型成为软件的核心 [1] 新架构核心特征 - 模型即服务是使用模型的最佳方式 [1] - 算力以“标记”的方式转换为智能 [1] - 云平台和中间件围绕智能体开发和运营,将“标记”组装成智能体,并实现智能体与现有工作流、智能体之间的智能互通 [1] 公司产品发布与升级 - 火山引擎发布两款豆包大模型:豆包大模型1.8和豆包视频生成模型1.5 pro [2] - 豆包大模型1.8专门面向多模态智能体场景进行了定向优化,具备更强的智能体能力 [2] - 火山引擎升级了人工智能云原生全栈服务以支持新架构 [1] 公司模型能力与市场地位 - 豆包大模型家族在多模态理解和生成能力、智能体能力上,已位于全球第一梯队 [2] - 截至今年12月,豆包大模型日均“标记”使用量已突破50万亿,居中国第一、全球第三 [2] - 已有超过100家企业在火山引擎上累计“标记”使用量超过一万亿 [2] 公司定价策略创新 - 火山引擎推出“AI节省计划”,覆盖平台上所有的按量后付费大模型产品,包括豆包大模型家族及各类三方开源模型 [2] - 该计划采用阶梯式折扣,用户用量越多节省越多,最高可以节省近47%的使用成本 [2]
火山引擎发布豆包大模型1.8和音视频创作模型Seedance 1.5 pro
金融界资讯· 2025-12-18 12:42
豆包大模型1.8发布与性能表现 - 火山引擎正式发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro [1] - 豆包大模型1.8面向多模态Agent场景进行定向优化,增强了工具调用、复杂指令遵循及OS Agent能力 [3] - 在视觉理解方面,豆包1.8的单次视频理解帧数从640帧倍增至1280帧,支持以低帧率理解超长视频并调用工具对关键片段进行高帧率理解 [3] - 权威评测数据显示,豆包大模型在多模态理解、生成能力及Agent能力上已跻身全球第一梯队 [1] - 在多项公开评测中,豆包1.8在视觉推理、通用视觉问答、空间理解及视频理解等任务中均获得最佳或接近最佳成绩 [5] - 在通用智能体测评集BrowserComp上表现全球领先,在数学与推理等基础能力维度上整体水平已接近全球顶尖的通用模型 [5] 模型使用与客户数据 - 截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍 [1] - 目前已有超过100家企业客户累计token使用量超过一万亿 [1] Seedance 1.5 pro音视频创作模型 - Seedance 1.5 pro具备影视级叙事张力,能精准捕捉运动细节并细腻呈现人物情绪,在音画同步技术上取得突破 [6] - 该模型采用创新的原生音视频联合生成架构,支持环境音、背景音乐、人声等多种元素,实现毫秒级音画同步输出 [6] - 在对白处理上,模型支持多人多语言对话,口型对齐精准,覆盖中文方言、英文及小语种 [6] - 即将上线的“Draft样片”功能可先生成低分辨率样片预览,其关键要素与最终成片高度一致,可帮助创作者提升65%的整体效率,并减少60%的无效创作成本 [6] - 个人用户已可在豆包、即梦AI等平台体验该模型,企业用户可从12月23日起通过火山引擎API接入服务 [6] AI云原生架构与Agent平台升级 - 传统的IT架构已无法满足Agent时代需求,以模型为中心的AI云原生架构正在形成并围绕Agent的开发与运营进行重构 [8] - 在Agent开发层面,公司全面升级了企业级AI Agent平台——AgentKit,覆盖Agent从开发、部署到管控的全生命周期 [8] - 在Agent运营层面,公司推出了HiAgent智能体工作站,通过构建统一的企业AI任务调度中心、提供开箱即用的通用智能体及支持个性化定制,帮助企业实现Agent的规模化管理与应用 [8] - 为降低企业使用门槛,公司推出了业内首个“AI节省计划”,覆盖所有按量后付费的大模型产品,通过阶梯式折扣最高可帮助企业节省47%的成本 [8] - 通过从模型能力到基础设施的全面革新,公司正在推动AI应用从单一的模型调用向复杂的Agent智能体生态演进 [8]
豆包大模型1.8正式发布,总裁谭待:日均token使用量突破50万亿
新浪财经· 2025-12-18 11:50
豆包大模型1.8发布与性能 - 火山引擎发布最新旗舰模型豆包大模型1.8,该模型面向多模态Agent场景进行了定向优化,其工具调用能力、复杂指令遵循能力及OS Agent能力均得到增强 [1][5] - 权威评测数据显示,豆包大模型在多模态理解、生成能力及Agent能力上,已跻身全球第一梯队 [1][5] - 在视觉理解方面,豆包1.8的单次视频理解帧数从640帧倍增至1280帧,支持以低帧率理解超长视频,并能调用工具对关键片段进行高帧率理解,该能力可广泛用于在线教育、产品质检等场景 [1][5] 模型使用量与客户规模 - 截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍 [1][5] - 目前已有超过100家企业客户累计token使用量超过一万亿 [1][5] Seedance 1.5 pro音视频创作模型 - 火山引擎推出Seedance 1.5 pro音视频创作模型,具备影视级叙事张力,能精准捕捉运动细节并细腻呈现人物情绪,在音画同步技术上取得突破性进展 [2][6] - 该模型采用创新的原生音视频联合生成架构,支持环境音、背景音乐、人声等多种元素,实现了毫秒级的音画同步输出 [2][6] - 在对白处理上,模型支持多人多语言对话,口型对齐精准,覆盖中文方言、英文及小语种,提升了视频内容的真实感与全球化创作潜力 [2][6] 降低创作成本与门槛 - Seedance系列即将上线“Draft样片”功能,创作者可先生成低分辨率样片进行预览,其关键要素与最终成片高度一致,数据显示该功能可帮助创作者提升65%的整体效率,并减少60%的无效创作成本 [2][6] - 个人用户已可在豆包、即梦AI等平台体验该模型;企业用户则可从12月23日起,通过火山引擎API接入Seedance 1.5 pro模型服务 [2][6] 企业级AI Agent平台与成本计划 - 火山引擎全面升级了企业级AI Agent平台AgentKit,该平台覆盖了Agent从开发、部署到管控的全生命周期,旨在解决企业在Agent落地中面临的身份权限管理、模型确定性及系统集成等核心挑战 [3][7] - 为降低企业使用门槛,火山引擎推出了业内首个“AI节省计划”,该计划覆盖所有按量后付费的大模型产品,通过阶梯式折扣,帮助企业最高节省47%的成本 [3][7] 行业架构趋势 - 传统的IT架构已无法满足Agent时代的需求,以模型为中心的AI云原生架构正在形成,并围绕Agent的开发与运营进行重构 [2][6]