Workflow
Kling 2.0
icon
搜索文档
三年跃迁中国AI凭什么逆袭美国?
36氪· 2025-06-26 10:29
中国AI技术发展现状 - 中美AI技术差距从2022年显著缩小至2025年不足三个月,中国AI实验室和企业取得巨大进步 [2] - DeepSeek R1模型(2025年5月)与OpenAI o3同获68分评分,阿里巴巴Qwen3 235B A22B评分47分,中美语言模型能力接近 [2] - 中国通过技术创新实现跨越,如DeepSeek R1采用强化学习优化推理能力,参数规模达671B(活跃参数37B),在MMLU-Pro等评测中表现优异 [2] 开放权重战略 - 中国头部实验室采用开放权重策略,与美国闭源形成对比,如阿里巴巴QwQ 32B Preview超越Meta Llama 3.1 405B成为最智能开源模型 [4] - 开放权重降低技术门槛,加速技术扩散并构建生态,如字节跳动Seedream 3.0吸引全球开发者二次开发 [7][8][9] - 阿里巴巴、腾讯、华为等企业2024-2025年陆续推出旗舰开源模型,形成技术共享共识 [9][10] 企业生态协同 - 大科技公司(阿里、腾讯、华为)提供底层模型和平台支持,如阿里ModelScope、华为Pangu系列配套芯片云服务 [16] - AI初创企业专注垂直领域:Moonshot AI专攻长文本处理,MiniMax优化轻量级边缘设备模型 [18] - 跨界玩家(小米、百度、360)将AI融入现有产品,如小米MiMo-7B增强小爱同学,360整合AI至安全软件和办公工具 [19][20] 多模态能力进展 - 中国图像生成模型快速追赶,字节Seedream 3.0(ELO 1111)接近Midjourney V6(ELO 1150),阿里Seedream系列优化中文提示支持 [22] - 视频生成领域中国加速突破,快手Kling 2.0(ELO 1053)和阿里Wan 2.1(ELO 1039)虽落后Google Veo 3(ELO 1247),但本土化应用突出 [25][26] - 大公司整合多模态能力:阿里ModelScope支持图像/视频功能,腾讯Hunyuan提供一站式多模态接口 [28][29] 中美AI竞争与合作 - 基础研究共享仍存空间,如Transformer架构和扩散模型曾依赖全球协作 [33] - 行业标准共建需求显著,中美共同参与联合国教科文组织等国际AI治理框架建设 [34][35] - 商业合作持续存在,中国企业需求英伟达芯片,美国企业寻求中国市场机会 [36]
摩根士丹利:快手科技_人工智能视频生成热度攀升,Sedance 1.0 Pro 强劲首发为下一个驱动力
摩根· 2025-06-23 10:09
报告行业投资评级 - 快手科技股票评级为“Equal - weight”(等权重),行业观点为“Attractive”(有吸引力),目标价为60.00港元,较目标价的涨跌幅度为1% [6] 报告的核心观点 - 近期两款新模型发布改变了AI视频生成领域的竞争格局,字节跳动发布的Seedance 1.0 pro在文本到视频和图像到视频的人工分析排行榜上均排名第一,超越谷歌、快手和OpenAI的相关模型,且价格比同类产品低60 - 70%,生成速度相对较快;MiniMax发布的Hailuo 02在图像到视频排行榜上排名第二 [2] - 这证实了市场长期以来认为字节跳动将成为AI视频生成领域重要参与者的观点,新模型发布将加剧竞争,但目前难以判断谁是长期赢家 [3] - 建议关注快手Kling 2.2版本在技术性能和定价方面的未来迭代,Kling年初至今的强劲财务表现是快手股价的关键驱动因素,但在AI视频生成竞争稳定前,不宜对Kling估值给予过高评价,维持对快手的等权重评级 [3] 根据相关目录分别进行总结 新模型发布情况 - 6月11日,字节跳动在火山引擎动力大会上发布AI视频生成模型Seedance 1.0 pro,能生成1080P高清视频,多相机无缝切换,定价为每5秒视频3.67元,约40秒可生成5秒视频 [2] - 6月16日,MiniMax发布AI视频生成模型Hailuo 02 [2] 排行榜排名 - 文本到视频排行榜:Seedance 1.0排名第一,Arena ELO为1295;谷歌Veo 3 Preview (No Audio)排名第二,Arena ELO为1248;谷歌Veo 2排名第三,Arena ELO为1131;快手Kling 2.0排名第四,Arena ELO为1110;OpenAI Sora排名第五,Arena ELO为1047 [8] - 图像到视频排行榜:Seedance 1.0排名第一,Arena ELO为1351;MiniMax Hailuo 02 (0616)排名第二,Arena ELO为1331;谷歌Veo 3 Preview (No Audio)排名第三,Arena ELO为1241;快手Kling 2.0排名第四,Arena ELO为1194 [9] 快手科技财务数据 - 截至2025年6月17日收盘价为59.40港元,52周范围为68.90 - 37.55港元,稀释后流通股数为4354百万股,当前市值为2367.20亿元人民币,企业价值为2141.59亿元人民币,日均交易额为22.31亿港元 [6] - 预计2024 - 2027财年每股收益分别为4.02元、4.54元、5.00元、5.45元,净收入分别为1270亿元、1420亿元、1540亿元、1650亿元,EBITDA分别为200亿元、270亿元、320亿元、370亿元 [6] 估值方法 - 采用贴现现金流模型,关键假设包括12%的加权平均资本成本和2%的永续增长率,对Kling的估值采用全球顶级软件公司的25倍EV/S [10] 行业内其他公司评级 - 互联网及其他服务行业内,Autohome Inc等部分公司有不同的评级,如Autohome Inc评级为E(等权重),Full Truck Alliance Co. Ltd评级为O(超配)等 [67]
豆包模型上新,字节继续卷性价比
36氪· 2025-06-15 12:41
字节跳动AI产品更新 - 公司一次性发布多款AI产品,包括豆包大模型1.6、Seedance 1.0 Pro视频生成模型、语音播客模型和实时语音模型,形成全家桶式产品矩阵 [1] - 不同于单纯追求参数升级,公司更注重将模型能力转化为可直接运行的应用,覆盖文字、图像、视频、语音等多个领域,并集成到现有产品如豆包APP和火山方舟中 [1] - 产品策略强调组合能力和实际落地应用,而非单一模型性能竞赛 [19] Seedance 1.0 Pro视频生成模型 - 该模型在Artificial Analysis文生视频和图生视频两项榜单中排名第一,ELO评分分别为1299和1343,超过可灵2.0和谷歌Veo 3 [3][4] - 支持文字和图片输入,生成10秒1080p视频,具备2-3个镜头切换能力,强调镜头连贯性和内容稳定性 [6] - 采用"精准描述模型"技术,先生成文字描述再训练视频,提升动作和细节控制能力 [8] - 生成速度处于行业中等偏上水平,5秒1080p视频约需40秒 [8] - 实测表现:能处理快速运动+连续镜头场景,物理运动稳定性较好,人物表情控制能力有所提升但仍有局限 [9][10][12] - 已接入即梦和豆包APP,定价为每千tokens 1分5,每条5秒视频约3.67元 [12] 豆包大模型1.6 - 推出三个版本:主力版、深度思考版和极速版,整体能力进入行业第一梯队 [13] - 加强边想边搜和DeepResearch能力,可拆分复杂任务并生成报告 [15] - 强化多模态实用能力,能整合图像、动作和提示词信息 [17] - 新增图形界面操作功能,支持打开网页、填写表单、浏览图片等操作 [17] - 定价策略调整,综合成本较1.5版本降低约63%,输入0.8元/百万tokens,输出8元/百万tokens [21] 公司AI战略 - 采取差异化路线:C端通过豆包APP实现"聊天+工具"形态,B端依托火山引擎提供完整AI服务 [19] - 强调模型与业务工具同步发展,如PromptPilot、AgentKit等多工具集成设计 [19] - 资源分配上模型团队直接协同产品线,确保迭代与实际场景挂钩 [22] - 战略重点从模型性能转向实际应用,关注"用得起、用得上、用得快" [20][23] 行业竞争格局 - 主要互联网公司采取不同AI发展路径:阿里侧重模型规模和通用能力,腾讯专注ToB业务融合,字节聚焦内容生成和多模态 [23] - 行业迭代节奏加快,从半年一次缩短至2-3个月一次 [23] - 竞争焦点从技术指标转向实际应用能力,包括部署便捷性、使用成本和系统集成度 [23] - 未来竞争关键在于将AI转化为基础设施,实现广泛场景应用 [24]