Workflow
HiAgent智能体工作站
icon
搜索文档
火山引擎,发布新模型
新华网财经· 2025-12-18 22:07
12月18日,作为字节跳动年度最重要的大会之一,在今年的FORCE原动力大会上,火山引擎宣布正式发布豆包大模型1.8及音视频创作模型Seedance 1.5pro。同时,火山引擎总裁谭待透露了在Agent开发工具方面的最新更新。 值得关注的是,谭待透露,截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍;目前已有超过100家企业客户累计token使 用量超过一万亿。记者注意到,今年以来其日均tokens使用量仍保持高速增长。 从此次大会上披露的信息来看,该模型不仅具备影视级的叙事张力,能够精准捕捉运动细节并细腻呈现人物情绪,更在音画同步技术上取得了突破性进 展。 据技术负责人介绍,Seedance 1.5pro采用创新的原生音视频联合生成架构,支持环境音、背景音乐、人声等多种元素,实现了毫秒级的音画同步输出。 从现场演示上看,在对白处理上,该模型提供了更为丰富精细的选择,甚至支持多人多语言对话,口型对齐精准。在语言能力上,模型覆盖中文方言(如 四川话、粤语等)、英文及小语种。 同时,火山引擎相关负责人表示,为进一步降低创作门槛与成本,Seedance系列即将上线"Draft样 ...
火山引擎发布豆包大模型1.8和音视频创作模型Seedance 1.5 pro
金融界资讯· 2025-12-18 12:42
图:火山引擎总裁 谭待 豆包大模型1.8:打造更强多模态Agent"大脑" 作为豆包家族的最新旗舰模型,豆包大模型1.8(Doubao-Seed-1.8)面向多模态Agent场景进行了定向优化。其工具调用能力、复杂指令遵循能力及OS Agent能力均得到增强,提升了模型在处理复杂任务时的规划与执行水平。 在视觉理解方面,豆包1.8的单次视频理解帧数从640帧倍增至1280帧。模型支持以低帧率理解超长视频,并能调用工具对关键片段进行高帧率理解。该能 力可广泛用于在线教育、产品质检等场景中。 | | | | 多模态理解能力 | | | | | | --- | --- | --- | --- | --- | --- | --- | --- | | 能力相应 | 角印象 | Claude-Solonan-4.9 | GPT-6.1 High | Genirs Super | Good LA-1018 | Doubso Seed-1.8 | Dears-Vi. 2000-A219 | | SMONE | MARKI-Pro | 68.0 | 76.0 | 81.0 | 67.9 | 79.2 | 1300 49.3 | ...