Workflow
可灵2.0
icon
搜索文档
Seedance 1.0超越可灵2.0?豆包“双箭齐发” 字节跳动摁下Agent加速键
每日经济新闻· 2025-06-12 15:05
豆包大模型1.6发布 - 豆包1.6系列由三个模型组成:doubao-seed-1-6(综合模型)、doubao-seed-1-6-thinking(深度思考强化版)、doubao-seed-1-6-flash(极速版)[4] - 豆包1-6是国内首个支持256K上下文的思考模型 三个版本均支持256K上下文[7] - 在复杂推理 竞赛级数学 多轮对话和指令遵循等测试集上 豆包1-6-thinking表现跻身全球前列[7] - 豆包1-6支持多模态理解和图形界面操作 能自动操作浏览器完成酒店预定 识别购物小票并整理成Excel表格等任务[8] - 豆包1-6首创按"输入长度"区间定价 0K-32K输入区间价格为0-8元/百万tokens 输出8元/百万tokens 综合成本仅为豆包1-5或DeepSeek R1的三分之一[13] 视频生成模型Seedance 1-0 Pro - Seedance 1-0 Pro在国际评测榜单Artificial Analysis的文生视频 图生视频两项任务中排名首位 超越Veo3 可灵2-0等模型[1] - 价格低至0-015元/千tokens 生成一条5秒1080P视频仅需3-67元 为当前行业最低[1] - 具备无缝多镜头叙事 多动作随心运镜 稳定运动与真实美感等技术特点 已应用于电商内容制作 游戏资产生成及影视预演等场景[11] - 生成速度快 仅需几十秒即可完成视频生成[11] 市场表现与行业影响 - 豆包大模型日均tokens使用量超过16-4万亿 较去年5月首次发布时增长137倍[14] - 在中国公有云大模型市场份额达46-4% 排名第一[14] - 服务全球TOP10手机厂商中的9家 8成主流汽车品牌 70%系统重要性银行及超5成985高校[14] - 价格降低带动业界跟进 推动中国大模型发展 可能引发新一轮"价格战"[14] Agent战略布局 - 公司认为AI时代的技术主体是Agent 需基于多模态深度思考模型才能实现复杂任务[12] - Agent的token消耗量大幅提升 需降低模型使用成本才能推动规模化应用[12] - 豆包1-6的能力升级和价格降低旨在促进生态繁荣 成为产业智能化的"地基"[14]
「火山」烧向百度云
36氪· 2025-06-12 11:03
火山引擎增长战略 - 公司2025年营收目标超过250亿元,较2024年120亿元增长100%以上,增速远超行业平均水平[1] - 2025年营收规模将接近百度智能云(预测280亿元),形成直接竞争关系[1] - 公司总裁谭待表示将采取"激进"策略实现目标,强调聚焦基本功和创新[1][7] 价格战策略 - 豆包1.6模型定价为输入0.8元/百万tokens、输出8元/百万tokens,综合成本仅为竞品1/3[4][11] - 2024年豆包初始定价比行业均价低99.3%,0.8厘可处理1500+汉字[9] - 低价策略使客户日均tokens使用量增长20-30倍,2024年市场份额达46.4%[3][9] - 采用统一定价和按上下文长度分区定价的创新模式[11] 技术能力提升 - 豆包1.6-thinking在推理和指令执行能力超越DeepSeek-R1-0528[19] - Seedance 1.0 pro视频生成模型测评超越快手可灵2.0,ELO评分达1299[20][22] - 成立研究型组织"Seed Edge",确立"探索智能上限"目标[19] 市场竞争格局 - 百度智能云2025Q1中标数和金额居行业第一,2025年预测增速30%[1][17] - 阿里云营收规模比火山高一个数量级,百度智能云营收为火山近2倍[12] - 竞品文心4.5 Turbo输入0.8元/百万tokens、输出3.2元/百万tokens,价格已低于豆包1.6[18] 战略转型 - 从"低价叙事"转向技术和服务能力建设[18][19] - 重点转向相同价格下提升模型能力,拓展更多行业应用场景[19] - 需要实现从调用量到实际营收的转化,缩小与头部云厂商差距[12][16]
消费周期与AI叙事下的中国互联网投资新范式
海通国际证券· 2025-06-04 15:41
报告行业投资评级 报告未明确提及行业投资评级相关内容 报告的核心观点 - 下半年继续看好恒生科技,虽短期中美贸易谈判有不确定性,但国内政策发力驱动基本面修复,叠加港股资金面改善,港股下半年或向上,恒生科技板块更值得重视 [3][13] - 电商行业由“低价竞争”走向“差异化竞争”,监管介入优化平台规则,各电商公司收入、利润、费用情况有差异 [15][22] - 本地生活领域到店格局优化,外卖竞争激烈,美团积极应对,新业务出海有进展,即时零售规模增长,各公司积极布局 [42][50][57] - 科技领域开启新一轮资本投入周期,阿里巴巴云业务收入加速并将投入巨额资本开支,快手可灵AI升级表现优异 [58][62][65] 根据相关目录分别进行总结 板块:下半年继续看好恒生科技 - 市场回顾:今年以来中国资产重估叙事发酵,港股震荡上行,4月关税扰动回落,5月中美经贸局势缓和反弹,未来短期中美贸易谈判有不确定性,或扰动港股,但国内政策和资金面因素使港股下半年或向上 [8] - 估值:从国际对比视角看,目前港股估值不算高 [9] - 投资建议:关注两条主线,一是AI催化+基本面趋势向上,关注阿里巴巴 - W、快手 - W;二是虽短期投入改善平台生态,但商业模式优,中长期壁垒稳固,且出海/外卖积极拓展第二成长曲线,关注美团 - W、拼多多、京东集团 - SW [3][13] 电商:由“低价竞争”走向“差异化竞争” - 竞争格局:行业由“低价竞争”走向差异化竞争,监管介入优化平台“仅退款”等规则,保障商家权益 [15][17] - 收入端:实物商品网上零售额增速逐年放缓,但阿里巴巴、京东收入提速,拼多多在线营销服务收入增速有所放缓 [22] - 利润端:2024年拼多多、阿里巴巴、京东集团Non - GAAP净利率有不同变化,各公司1Q25情况也有差异 [30] - 费用端:2024年和1Q25拼多多、阿里巴巴、京东集团费用率及销售费用率有不同变化 [37] 本地生活:到店格局优化,外卖&即时零售积极投入 - 到店业务:美团核心本地商业OP自1Q24起提速,因到店行业竞争减弱、公司部门协同性提升,2Q2025预计核心本地商业OP有扰动,但长期有望夯实壁垒 [46] - 外卖业务:京东外卖订单量快速增长,阿里巴巴升级即时零售业务,美团积极应对竞争,2Q预计利润有扰动,但长期壁垒稳固 [50] - 新业务:美团Keeta打造第二增长曲线,海外外卖UE更优,看好其出海发展 [54] - 即时零售:行业规模预计增长,美团、京东、阿里巴巴等公司积极布局 [57] 科技:开启新一轮资本投入周期 - 阿里巴巴:云业务收入加速,未来三年拟投入3800亿元Capex,4Q25FY云智能集团总收入同比增长18%,经调整EBITA利润率8% [62] - 快手:可灵AI全系统模型升级,可灵2.0在多项评测上超越Sora等AI视频模型 [65] 重点公司盈利预测及估值 报告给出阿里巴巴 - W、美团 - W、京东集团 - SW、快手 - W、途虎 - W、同道猎聘等公司2024 - 2027E的Non - GAAP/经调整净利润及PE估值 [67]
国泰海通互联网应用2025年中期策略:消费周期与AI叙事下的中国互联网投资新范式
智通财经网· 2025-06-04 11:45
行业观点 - 下半年继续看好恒生科技板块 港股震荡上行但估值仍不算高 国内政策发力驱动基本面修复叠加资金面改善有望推动港股下半年向上 [1] - 恒生科技板块云集稀缺优质资产 结构上更值得重视 建议关注两条投资主线 [1] 投资主线1:AI催化+基本面趋势向上 - 阿里巴巴-W(09988):4Q25FY淘天CMR同比增长12% 云智能集团收入加速趋势有望延续 受益于淘天业务基数效应及全站推渗透率提升 叠加云业务AI产品助推 1-2Q26FY基本面向上趋势有望延续 [2] - 快手-W(01024):受益于抖音策略调整 电商业务格局有望阶段性改善 可灵2.0版本作为全维度生产力工具具备较大应用空间 [2] 投资主线2:商业模式优+中长期壁垒稳固 - 美团-W(03690):短期投入夯实份额 外卖业务具备双边网络效应和锁定效应 长期竞争优势稳固 Keta在沙特展现技术实力 计划5年内在巴西投入10亿美元拓展第二增长曲线 [3] - 拼多多(PDDUS):1Q25Non-GAAP净利润同比下滑47% 因聚焦生态建设投入 但长期有望夯实壁垒 下半年盈利或回升 TEMU加速半托管及欧洲市场布局 [3] - 京东集团-SW(09618):1Q25收入超预期 季度活跃用户数同比增长超0% 3P商家成交用户数和订单量双位数增长 618期间外卖日单量破2500万 高频外卖业务或带动零售加速 [3]
视频生成大模型的2025半年“赛点”:向左刷榜“跑分”,向右刷屏“跑量”
36氪· 2025-05-29 09:59
谷歌Veo 3发布 - 谷歌在2025 Google I/O开发者大会上发布视频生成大模型Veo 3,实现视频与音频的原生集成,包括音乐、背景音效和角色对话的自然生成,并能同步口型 [1] - Veo 3具备更强的物理规律理解与模拟能力,显著提升AI视频生成的真实感与沉浸感 [3] - 谷歌在发布Veo 3当天即刻上线Flow平台面向市场开放使用,不同于Sora发布时不对外开放的策略 [8] 国产视频生成模型表现 - 快手可灵2.0以1124分的Arena ELO基准测试评分位居Artificial Analysis榜单图生视频赛道榜首,对比谷歌Veo 2的胜负比达205%,对比OpenAI Sora的胜负比达367% [4] - 生数科技Vidu Q1在VBench Leaderboard和SuperCLUE榜单上登顶文生视频和图生视频分项榜首,超越Runway、Sora等国外模型 [6] - 阿里通义万相2.1曾在VBench Leaderboard榜单排名第一,在复杂运动处理、现实物理还原等方面表现突出 [6] 行业竞争格局 - 视频生成大模型赛道竞争激烈,国内外厂商呈现"螺旋式"互殴局面,榜单排名频繁更替 [4][6] - 国产模型通过高频迭代迅速跻身第一梯队,可灵AI上线以来已迭代20多次 [4] - 行业技术进步显著,从早期"鬼畜"画面发展到音频、画面、动作等多因素高度协同集成 [7] 商业化进展 - 国内厂商商业化路径更宽更快,快手可灵AI单月流水超千万元,与伊利、vivo等头部品牌达成合作 [11] - 抖音AI特效话题播放量超36亿次,快手AIGC广告收入规模提升12倍,单日消耗峰值突破2000万元 [8] - 首部付费AI短剧《兴安岭诡事》市场反响热烈,AI+萌娃、AI+宠物等主题视频创作吸引大量流量 [8] 商业模式对比 - 国内采用免费版与会员制结合策略,每天送积分吸引用户,会员定价平均低于国外厂商 [12] - 谷歌Veo 3需开通125美元/月的Ultra会员,且每月仅能生成约85条视频,限制用户大规模出片能力 [11] - 抖音即梦AI周活跃用户数从76万增至200万,月活达893万,商业化支撑数据亮眼 [11][14]
短短30秒,颠覆整个行业
混沌学园· 2025-05-06 19:17
AI视频技术突破 - AI视频技术已实现从"技术炫技"到"商业落地"的跨越,关键在于生成内容能让人"信以为真"[11] - 可灵2.0和Sora代表当前最高水平,前者已具备商用能力,后者展示未来可能性[3] - 技术突破体现在四个协同层面:语义准确理解、镜头语言自然、物理动作真实、表演可信沉浸[13] 内容生产逻辑重构 - 创作者角色从剪辑工转变为故事导演,通过prompt即可完成短片创作[13] - 制作成本断崖式下降至传统方式的5%-10%,周期缩短至几分钟[14] - 这不仅是工具升级,更是表达范式的跃迁,解放了内容想象力[14] 行业应用场景 - 广告创意领域:实现从产品概念到视觉脚本的快速转换[16] - 教育培训:构建虚拟博物馆、重现历史事件等沉浸教学场景[17] - IP孵化:用于故事预演和角色行为测试,提前感知受众反应[18] - 游戏开发:加速世界观PV构建和角色性格测试[20] - 电商直播:虚拟主播和产品演绎短片比硬广更具吸引力[22] 技术平台分化 - 技术驱动型平台(如Sora、Luma)侧重技术验证和品牌影响[28] - 工具平台型(如可灵、Runway)主打低门槛使用,探索订阅制等商业模式[28] - 不同平台形成风格化分工:Luma擅长空间构建,Pika偏好卡通化画面,Runway强于视觉风格控制[24] 商业化前景 - AI视频平台已形成工具化、平台化、商业化雏形[27] - 可能成为内容供给链的"底层引擎",类似剪映之于抖音的关系[28] - 正在探索"内容即服务(CaaS)"模式,包括模板商城、授权内容等[28] 技术挑战 - 多人物交互仍存在技术难点[29] - 长视频中语义和光线一致性尚未解决[29] - 多模态生成未完全打通语音、图像、文字联动[29]
快手成立可灵AI事业部 高级副总裁盖坤挂帅
每日经济新闻· 2025-04-30 19:59
公司战略与组织架构调整 - 公司正式成立可灵AI事业部,下设产品部、运营部和技术部,负责可灵、可图等系列大模型业务 [1] - 高级副总裁盖坤担任可灵AI事业部负责人,继续兼任社区科学线负责人,向CEO程一笑汇报 [1] - 社区科学线下成立基础大模型与应用部,负责LLM大模型、多模态理解大模型及应用技术研发 [1] - 独立的团队和组织架构设计旨在保持公司在视觉大模型领域的竞争力 [2] AI业务发展现状 - 2023年初启动AI战略,已打造快意语言大模型、可图图像生成大模型、可灵视频生成大模型等矩阵 [1] - 截至2023年6月,可灵AI累计完成超20次迭代,全球用户规模突破2200万 [1] - 2024年4月发布可灵2.0视频生成模型及可图2.0图像生成模型 [1] 商业化进展与目标 - 自商业化以来至2024年2月,可灵AI累计营业收入超过1亿元 [2] - CEO预计2025年可灵AI将实现收入的跨越式增长 [2] - AIGC短视频营销素材和虚拟数字人直播解决方案日均消耗突破3000万元 [2] 行业定位与价值 - AI已成为驱动平台流量增长和创造商业生态价值的核心引擎 [2] - 公司级战略凸显AI在整体业务中的核心地位 [1][2]
可灵2.0正式发布 - 现实,真的不存在了。
数字生命卡兹克· 2025-04-15 15:24
可灵2.0技术突破 - 可灵2.0在运镜幅度、物理规律、人物表演、动作稳定性、语义理解等方面实现水桶式提升,将AI视频技术推向新高度[7][9][12] - 霸王龙案例展示2.0版本在环境交互、运动感和物理反馈上的显著进步,1.6版本存在树木橡胶化等缺陷[9][11][12] - 摘眼镜案例体现2.0版本对精细动作的完美还原,包括镜片光影变化和物理反馈,1.6版本出现眼镜腿抖动等穿帮[14][16][17] 多主体交互能力 - 五人篝火场景中2.0版本实现自然表情交互和火光动态映射,1.6版本存在人工感[23][25][26] - 派大星吹笛案例展示2.0强大的语义理解能力,能准确呈现停顿观察等复杂指令[27] - 多人场景下2.0版本保持各主体动作协调,1.6版本出现假动作等问题[20][21] 情感表达真实感 - 小丑妆女孩案例中2.0版本实现电影级情绪传递,包括眼神变化和嘴角抽动等微表情[14][17] - 外星人哭泣、老人敬礼等案例展示2.0版本对复杂情感的精准刻画[30][31] - 通过淋雨失恋、开车第一视角等场景建立强烈沉浸感[32][34] 技术局限性 - 群像高速运动时部分人物稳定性不足,出现分裂现象[49][50] - 投篮等需要精确物理模拟的场景仍存在轨迹失真问题[55] - 怪物猎人等复杂群像场景中小尺寸人物会出现混乱[52] 行业影响 - 技术达到"信"而非"像"的级别,首次实现观众情感共鸣[41][44][45] - 当前水平已超越其他AI视频模型,直接对标好莱坞特效标准[57] - 代表AI视频领域审美跃迁,重新定义真实感标准[38][39][46]