AI云原生架构
搜索文档
大厂多模态Agent能力激战正酣
证券日报· 2025-12-18 23:40
本次发布的豆包大模型1.8,其核心升级完全围绕"打造更强大的Agent大脑"展开。与单纯追求参数规模 不同,该版本在设计之初便针对多模态Agent场景进行定向优化,在复杂指令遵循、多轮交互以及操作 系统级别的实际操作(OS Agent)能力上实现了系统性增强。 技术突围 在至关重要的多模态理解层面,豆包1.8完成了视觉能力的底层升级。其单次视频理解帧数提升至1280 帧,并能以低帧率解析超长视频,在需要时调用工具对关键片段进行高精度分析。这一能力使得模型能 够处理在线教育课程、工业质检视频等复杂冗长的视觉信息,为Agent在真实场景中自主决策提供了感 知基础。 同步亮相的音视频创作模型Seedance1.5Pro,则从内容创作端展示了多模态融合的更高阶形态。该模型 采用创新的原生音视频联合生成架构,实现了毫秒级的音画同步,并能基于画面景深和角色数量,精准 匹配多人、多语言对话的口型。这解决了AI视频生成中长期存在的"张口无声"或口型错位的顽疾,将技 术从"炫技"推向"实用"。 火山引擎推出上述两个模型,标志着大模型行业已从单纯的参数竞赛,全面进入了以多模态Agent为核 心的产业落地新阶段。赛智产业研究院人工 ...
火山引擎发布新模型,AI应用加快推进
选股宝· 2025-12-18 22:52
西南证券认为,AI发展水平正从推理者向智能体Agent演进,AI产品逐步能够理解目标、具备外部记忆 和推理能力,相关智能体产业链正经历从模型能力提升到应用商业化的系统性跃迁。产品创收加速,商 业化应用曙光乍现。 相关公司方面,税友股份:率先推出财税AI产品,试点阶段效果突出。"数智会计"在2000家企业应用 中,实操效率达传统会计的10倍。 据上证报报道,12月18日,作为字节跳动年度最重要的大会之一,在今年的FORCE原动力大会上,火 山引擎宣布正式发布豆包大模型1.8及音视频创作模型Seedance 1.5pro。同时,火山引擎总裁谭待透露了 在Agent开发工具方面的最新更新。 演讲中谭待表示,希望这款最新大模型能够成为打造更强多模态Agent"大脑"。截至今年12月,豆包大 模型日均token使用量突破50万亿,较去年同期增长超过10倍;目前已有超过100家企业客户累计token使 用量超过一万亿。今年以来其日均tokens使用量仍保持高速增长。今年被称为"AI Agent"元年。谭待认 为,传统的IT架构已无法满足Agent时代的需求,以模型为中心的AI云原生架构正在形成,并围绕Agent 的开发与 ...
火山引擎发布豆包大模型1.8和音视频创作模型Seedance 1.5 pro
金融界资讯· 2025-12-18 12:42
图:火山引擎总裁 谭待 豆包大模型1.8:打造更强多模态Agent"大脑" 作为豆包家族的最新旗舰模型,豆包大模型1.8(Doubao-Seed-1.8)面向多模态Agent场景进行了定向优化。其工具调用能力、复杂指令遵循能力及OS Agent能力均得到增强,提升了模型在处理复杂任务时的规划与执行水平。 在视觉理解方面,豆包1.8的单次视频理解帧数从640帧倍增至1280帧。模型支持以低帧率理解超长视频,并能调用工具对关键片段进行高帧率理解。该能 力可广泛用于在线教育、产品质检等场景中。 | | | | 多模态理解能力 | | | | | | --- | --- | --- | --- | --- | --- | --- | --- | | 能力相应 | 角印象 | Claude-Solonan-4.9 | GPT-6.1 High | Genirs Super | Good LA-1018 | Doubso Seed-1.8 | Dears-Vi. 2000-A219 | | SMONE | MARKI-Pro | 68.0 | 76.0 | 81.0 | 67.9 | 79.2 | 1300 49.3 | ...
豆包大模型1.8正式发布,总裁谭待:日均token使用量突破50万亿
新浪财经· 2025-12-18 11:50
目前,个人用户已可在豆包、即梦AI等平台体验该模型;企业用户则可从12月23日起,通过火山引擎 API接入Seedance 1.5 pro模型服务。 新浪科技讯 12月18日上午消息,今日,火山引擎在FORCE原动力大会上正式发布豆包大模型1.8及音视 频创作模型Seedance 1.5 pro。权威评测数据显示,豆包大模型在多模态理解、生成能力及Agent能力 上,已跻身全球第一梯队。 据火山引擎总裁谭待介绍,截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长 超过10倍;目前已有超过100家企业客户累计token使用量超过一万亿。 作为豆包家族的最新旗舰模型,豆包大模型1.8(Doubao-Seed-1.8)面向多模态Agent场景进行了定向优 化。其工具调用能力、复杂指令遵循能力及OS Agent能力均得到增强,提升了模型在处理复杂任务时的 规划与执行水平。 在视觉理解方面,豆包1.8的单次视频理解帧数从640帧倍增至1280帧。模型支持以低帧率理解超长视 频,并能调用工具对关键片段进行高帧率理解。该能力可广泛用于在线教育、产品质检等场景中。 针对日益增长的视频创作需求,火山引擎 ...