生成式视频
搜索文档
里昂:料2026年中美AI竞赛升级 首选腾讯控股等
智通财经· 2026-02-05 14:35
行业整体前景与趋势 - 中国互联网行业在2025年表现强劲,预计2026年涨势将延续 [1] - 行业收入及调整后EBIT预计将分别同比增长12%及29% [1] - 中国有望在全球引领AI应用落地 [1] 细分领域竞争与发展 - DeepSeek引领国内AI趋势,代理AI和生成式视频应用的竞争将加剧 [1] - 中国与美国将在全球范围内的AI模型、应用、云服务及自动驾驶(Robotaxi)领域展开正面竞争 [1] - 尽管面临地缘政治挑战,中国游戏和电商在海外市场持续快速增长 [1] - 对国内电商板块的前景持谨慎态度 [1] 投资策略与估值 - 投资策略上偏好AI、游戏及健康相关板块 [1] - 板块当前2026年预测调整后市盈率为16.1倍(2027年为13.7倍),较美国同业存在约40%的折让,估值仍具吸引力 [1] 重点公司及业务看点 - 2026年六大首选股包括腾讯控股、小米集团-W、阿里巴巴-W、网易-S、快手-W及京东健康 [1] - 特别看好阿里巴巴的云业务、腾讯的AI应用,以及小米的消费级AI设备 [1]
Kling AI 持续快速迭代
中信证券· 2026-02-04 21:36
报告投资评级 * 报告未明确给出投资评级 但引用了中信里昂研究的观点 并提供了市场共识目标价作为参考[2][3][12] 报告核心观点 * 报告核心观点与中信里昂研究一致 认为快手在2025年第四季度总营收及调整后净利润将实现增长 其AI产品Kling的收入可能继续超预期增长[3] * Kling AI通过快速迭代和功能升级 凭借显著的性价比和效率优势 有望持续吸引用户并推动收入增长[3][4] * 快手电商业务增长受竞争加剧和消费疲软影响而放缓 直播业务则因高基数和内容治理而承压[5][6] * 公司未来的催化因素包括月活跃用户超预期增长、单用户广告收入提升以及通过成本控制实现的利润率改善[7] 公司业务与财务表现 * 报告研究的具体公司是快手(股票代码:1024 HK) 其是中国第二大短视频平台 业务涵盖直播、电商、游戏及本地生活服务[10] * 截至2026年2月2日 公司股价为77.0港元 市值为416.90亿美元 3个月日均成交额为312.31百万美元 市场共识目标价为89.38港元[12] * 公司主要股东为腾讯(持股17.25%)和宿华(持股11.15%)[12] * 从收入结构看 在线营销收入占比53.1% 直播收入占比34.4% 其他收入占比12.5% 从地区看 亚洲地区收入占比高达98.4%[11] Kling AI业务进展 * Kling AI在2025年12月推出了2.6 Turbo版本 专注于生成整合音效的视频内容 新版本发布后 其APP在多个市场的iOS下载榜登顶[4] * Kling 2.5的图生视频功能位列全球第一 其API定价为每分钟4.20美元 仅为竞争对手Sora 2 Pro定价(30美元)的14%[4] * Kling的典型视频生成时间约为86.4秒 快于Sora 2 Pro的449.6秒 具有竞争力的定价与生成效率是其关键优势[4] * Kling作为前三强生成式视频平台 在成本效率方面具有显著优势 用户与收入增长势头有望持续[3] 各业务板块展望 * **在线营销(广告)业务**:预计同比增长 主要受电商GMV同比增长及外部广告同比增长驱动[5] * **外部广告增长**可能受益于短剧、小游戏、小说等内容消费垂直领域的强劲扩张 但部分被巴西市场下滑所抵消[5] * **内部广告增速**可能低于GMV增速 因平台持续为商家提供流量支持以推动货架电商生态发展[5] * **电商广告货币化率**在市场竞争加剧与消费疲软背景下 可能同比/环比下降[5] * **电商佣金**方面 KOL分佣可能推高电商佣金抽佣率[5] * **直播业务**:收入可能同比下降 主要受高基数效应与持续加强的内容治理影响[6] 同业比较 * 报告将快手与美图公司(1357 HK)和微博(WB US)进行了同业比较[15] * 美图公司市值为46.6亿美元 微博市值为26.2亿美元[15]
深度观察:估值13亿,这个读懂电影语法的AI,让好莱坞彻底慌了
36氪· 2026-01-16 20:36
公司核心业务与产品 - 公司Higgsfield推出Cinema Studio重大更新,将电影工业顶级设备与手法数字化、模块化,用户可随意搭配6种摄影机、11颗镜头、4种焦距、3种光圈及多种运镜与特效 [1] - 产品旨在解决AI生成图像的“塑料感”痛点,通过深度学习顶级摄影设备在不同光照下的色彩响应、动态范围和颗粒感,以复刻真实光线质感与景深 [8][11][12] - 用户通过简单文本提示和上传参考图即可操作,可选择不同机身、镜头组合,并指定焦距、光圈,平台提供1K、2K、4K等分辨率选项以在成本与画质间取舍 [12] - 产品内置全新控制引擎,解构与重组“电影语法”,提供大量预设的好莱坞经典复杂镜头运动,如Dolly系列、无人机镜头、360度环绕等,并可混合使用创造独特视觉效果 [18][20][21][23] - 产品依托DOP I2V-01-preview模型,并集成OpenAI Sora 2、Google Veo 3.1、Wan 2.5、Kling和Minimax等多个顶级AI视频模型,通过统一界面提供 [27] - 产品正解决生成式视频中跨镜头角色与场景一致性的难题,用户可根据底图生成主体一致、风格固定的“3✖️3关键帧”,以构建连续叙事片段 [27][29] 公司市场表现与财务数据 - 公司近期在原有融资基础上增发8000万美元股票,使A轮融资总额达到1.3亿美元,公司估值跨入13亿美元的“独角兽”行列 [7] - 公司上线九个月积累了超过1500万用户,年收入在两个月内翻倍,跃升至2亿美元 [11] 行业影响与竞争格局 - 公司通过技术平权,将原本需要百万美元设备成本和庞大摄制组的电影级制作,成本降至生成一张IMAX级别剧照低于一美元,极大降低了专业壁垒 [3][5][17] - 行业内有其他公司尝试类似方向,如国内团队“影视飓风”上线摄影APP“飓风相机”,内置不同镜头影调风格并提供付费电影大师调色LUT [14] - 技术对影视行业传统分工和技能价值构成潜在冲击,尽管AI在精细物理运动和长时间逻辑一致性上仍有不足,但其进化速度已令人侧目 [33] - 公司选择专注于雕琢电影语法这一精细垂类,而非追逐无限逼真像素,预示着生成式视频下一阶段重点从“画得有多像”转向“讲得有多好” [35] 用户反馈与市场应用 - 有用户使用产品制作了病毒式传播的“太空西部片”预告片,YouTube播放量超12万,实现了因成本高昂而难以落地的混合题材 [31] - 奥斯卡最佳视觉效果奖得主Jason Zada体验后表示,极难完成的镜头现在变成了一个预设选项,只需点击一下即可实现 [25] - 视效领域专家John Gaeta认为该技术让所有人更接近拥有“上帝之眼”,即对摄影机和场景的完全创意控制 [30]
顶级视频模型半衰期只有 30 天,但生成式媒体 infra 公司的收入却在一年增长了 60 倍
Founder Park· 2026-01-16 20:22
文章核心观点 - 生成式媒体(尤其是视频)的算力需求呈指数级增长,远超大型语言模型,这构成了行业的核心瓶颈和机遇 [4][5] - fal.ai 作为一家生成式媒体基础设施公司,通过统一API、云端推理平台及深度性能优化,解决了算力受限难题,并因此在2025年实现了收入和估值的爆发式增长 [4][6][7] - 公司通过差异化押注生成式视频、构建技术壁垒、优化算力成本、建立生态枢纽,成功卡位,并预测动画风格AI内容将比写实风格更早迎来爆发 [7][11][31][62] 公司概况与市场定位 - fal.ai 是一家为开发者和企业提供高性能AI生成媒体平台的infra公司,通过统一、低延迟的API和云端推理平台,让客户能高性能调用图像、视频、音频等多模态生成模型,而无需自建GPU基础设施 [4][8] - 公司成立于2021年,在早期(Sora发布前)就敏锐观察到图像与视频生成市场的快速增长潜力,并差异化地押注于此,将公司定位调整为“Generative Media Platform”,从而在视频模型爆发前完成生态卡位 [10][11] - 公司坚信生成式视频市场规模巨大,其底层逻辑是视频占据了互联网80%以上的带宽,且视频是一种信息压缩率更高、更符合人类直觉的媒介 [13] 技术壁垒与性能优化 - 视频生成是典型的“算力受限”场景,与LLM的“内存带宽受限”有本质区别 视频生成需要在成千上万个Token上同时进行去噪和注意力计算,完全占满GPU计算带宽 [15][16] - 算力需求对比悬殊:以顶尖LLM处理单个Prompt(约200 Token)算力为1单位,生成一张高质量图像是其100倍;生成一个5秒24fps标清视频(约120帧)是图像的100倍(即LLM的10000倍);生成4K超高清视频还需在此基础上再增加10倍 [5][17][18][19] - 公司组建了约占10%人力的精锐编译器团队,专注于极致性能优化,通过构建核心的Tracing Compiler和基于Templated Kernels的动态替换方案,其推理引擎性能通常领先PyTorch等通用框架3到6个月 [19][21] - 公司正将低延迟优化经验从音频生成扩展至实时视频生成领域,以解决亚秒级延迟的infra挑战 [22][23] 商业表现与融资情况 - 公司在2025年实现爆发式增长:截至2025年7月,过去12个月收入增长60倍;2025年7月至12月期间,公司估值翻了三倍 [6] - 2025年12月,完成由红杉资本领投的1.4亿美元D轮融资,估值达到45亿美元 [6][8] - 根据融资历史表:2025年10月,公司收入已超过2亿美元;为超过100万名开发者和100多家企业客户提供支持 [10] 成本优势与算力管理 - 公司管理着分布在约35个不同数据中心的异构计算资源,通过自研的从编排器到CDN的一整套软件系统,将其整合成统一的“分布式超级计算”集群进行智能调度 [24] - 核心调度逻辑包括基于Warm Cache状态进行路由,将请求精准分发给已加载特定模型权重的GPU节点,避免重复加载的巨大开销 [24] - 通过同时与Hyperscalers(超大规模云厂商)和Neo-clouds(新兴云厂商)合作进行套利,公司获得了极具竞争力的算力成本,因为Neo-clouds的价格有时比Hyperscalers低2倍甚至3倍 [28][30] 生态卡位与平台价值 - 视频生成领域竞争格局极不稳定,顶级视频模型的“半衰期”仅为30天,导致模型排名持续变动 [31] - fal.ai平台同时运行着超过600个生成式媒体模型,成为连接多方模型供应商的单一枢纽,使开发者无需受制于单一模型,降低了技术迭代风险 [31][33] - 平台模型生态呈现长尾效应,任何时刻都有接近50个活跃模型被频繁使用,同时存在大量具备特定“人格”或特性的长尾模型 [34] - 公司已成为顶级模型实验室(如DeepMind/Veo、Kling、MiniMax、OpenAI/Sora)的关键分发渠道和合作伙伴,经常能获得新模型的独家首发权,形成了吸引开发者与吸引模型方的正向飞轮效应 [39][43] 用户行为与典型用例 - 在前100名客户中,平均每个客户在同一时间会使用14个不同的模型 [44] - 专业创作者的工作流正在复刻传统动画制作流程:先使用文生图模型迭代确定视觉风格和故事板,再使用视频模型在关键帧之间进行插值生成动态视频 [44] - 为降低复杂工作流构建门槛,公司与Shopify合作开发了No-code workflow builder(无代码工作流构建器) [46] - 教育是潜力巨大的蓝海市场,例如Adaptive Security公司利用平台动态生成高度个性化的安全培训视频 [47][48] - 游戏领域,Text-to-Game被视为Text-to-Video的自然延续,未来可能出现“一次性”的超休闲游戏形态 [52][53] - AI原生IP正在崛起,例如Italian Brainrot这类由社区利用AI生成的无主IP,通过海量生成和社区筛选机制,已展现出商业价值 [54] 行业未来判断 - 视频模型架构面临推理效率瓶颈,当前时间维度压缩比仅约4倍,必须大幅提升压缩率(类似图像模型从像素空间转向潜在空间)才能实现规模扩展,满足4K实时生成所需的百倍算力提升 [58][59] - 在生成式媒体领域,算力将比数据先耗尽,因为互联网上拥有极度丰富且免费的视频数据 [60][61] - 预测一年内将涌现出完全由AI生成(含人类剪辑)的电影级短片(约20分钟) [62] - 动画、动漫或卡通风格将比照片级写实风格更早迎来爆发,因为AI大幅降低了传统高昂的动画制作成本,且动画风格对人物表情等细节的容错度更高,更利于故事讲述 [62][63] - 在视觉特效领域,AI生成纯物理现象(如爆炸、建筑倒塌)已经非常完美 [64]