Workflow
豆包模型上新,字节继续卷性价比
36氪·2025-06-15 12:41

字节跳动AI产品更新 - 公司一次性发布多款AI产品,包括豆包大模型1.6、Seedance 1.0 Pro视频生成模型、语音播客模型和实时语音模型,形成全家桶式产品矩阵 [1] - 不同于单纯追求参数升级,公司更注重将模型能力转化为可直接运行的应用,覆盖文字、图像、视频、语音等多个领域,并集成到现有产品如豆包APP和火山方舟中 [1] - 产品策略强调组合能力和实际落地应用,而非单一模型性能竞赛 [19] Seedance 1.0 Pro视频生成模型 - 该模型在Artificial Analysis文生视频和图生视频两项榜单中排名第一,ELO评分分别为1299和1343,超过可灵2.0和谷歌Veo 3 [3][4] - 支持文字和图片输入,生成10秒1080p视频,具备2-3个镜头切换能力,强调镜头连贯性和内容稳定性 [6] - 采用"精准描述模型"技术,先生成文字描述再训练视频,提升动作和细节控制能力 [8] - 生成速度处于行业中等偏上水平,5秒1080p视频约需40秒 [8] - 实测表现:能处理快速运动+连续镜头场景,物理运动稳定性较好,人物表情控制能力有所提升但仍有局限 [9][10][12] - 已接入即梦和豆包APP,定价为每千tokens 1分5,每条5秒视频约3.67元 [12] 豆包大模型1.6 - 推出三个版本:主力版、深度思考版和极速版,整体能力进入行业第一梯队 [13] - 加强边想边搜和DeepResearch能力,可拆分复杂任务并生成报告 [15] - 强化多模态实用能力,能整合图像、动作和提示词信息 [17] - 新增图形界面操作功能,支持打开网页、填写表单、浏览图片等操作 [17] - 定价策略调整,综合成本较1.5版本降低约63%,输入0.8元/百万tokens,输出8元/百万tokens [21] 公司AI战略 - 采取差异化路线:C端通过豆包APP实现"聊天+工具"形态,B端依托火山引擎提供完整AI服务 [19] - 强调模型与业务工具同步发展,如PromptPilot、AgentKit等多工具集成设计 [19] - 资源分配上模型团队直接协同产品线,确保迭代与实际场景挂钩 [22] - 战略重点从模型性能转向实际应用,关注"用得起、用得上、用得快" [20][23] 行业竞争格局 - 主要互联网公司采取不同AI发展路径:阿里侧重模型规模和通用能力,腾讯专注ToB业务融合,字节聚焦内容生成和多模态 [23] - 行业迭代节奏加快,从半年一次缩短至2-3个月一次 [23] - 竞争焦点从技术指标转向实际应用能力,包括部署便捷性、使用成本和系统集成度 [23] - 未来竞争关键在于将AI转化为基础设施,实现广泛场景应用 [24]