Workflow
字节AI更新
21世纪新健康研究院·2024-12-20 13:24

大模型层面来看的话发布了这个豆包视觉理解模型这个模型的话是有更强的这个内容识别能力不仅可以这个识别出图像中的物体类别形状这些基本要素还能够理解物体之间的关系空间布局以及这个场景的不根据所识别的这个文字和图像信息进行复杂的逻辑计算而且这个模型还有这个更细腻的 价格来看的话豆包视觉理解模型的这个输入价格是每千tokens 0.003元比行业平均价格是要低85%相当于一块钱可以处理这个284张720P的这个图片 并且在这个会上也发布了豆包音乐模型4.0这个豆包音乐模型4.0版本是可以支持输入歌词生成音乐的从一分钟创作升级到包括前奏、主歌、副歌、间奏、过渡段等完整的三分钟的传曲创作 那大模型之外的话在中间层这个昨天的会上还推出了扣子1.5版本和这个HiAgent的1.5那能够提供更多元行业多业务场景的这样的一个模板其中的话扣子作为这个就是AI应用开发品牌有这个低门槛 个性化 实时性 多模态这些优点能够给这个AI应用的开发和发布搭建更好的一个环境 也就是说其实围绕自己的AI的一个生态体系是逐渐壮大的行业场景也在不断的拓展这次发布的视觉理解模型和音乐模型也代表着豆包大模型家族多模态能力的提升后续有望能够赋能说内容创作进一 ...