实时生成 - 财报，业绩电话会，研报，新闻

实时生成

搜索文档

英伟达Q4财报一览：网络营收首破百亿、单季净利润加冕全球第一，数据中心将逐季增长

新浪财经· 2026-02-26 21:36

财报核心业绩概览 - 公司FY26Q4营收达681亿美元，同比增长73%，环比增长20%，显著高于市场一致预期的659亿美元及此前650亿美元的指引 [3] - 公司FY26Q4 GAAP净利润为429.6亿美元，同比增长94%，环比增长35%，显著高于市场一致预期的363亿美元 [8] - 公司FY26Q4 NonGAAP净利润为389.7亿美元，同比增长77%，环比增长26%，高于市场一致预期的375亿美元 [8] - 公司FY26Q4 GAAP毛利率为75%，同比提升2个百分点，NonGAAP毛利率为75.2%，同比提升1.7个百分点 [8] - 公司给出FY27Q1营收指引为780亿美元（不含大陆数据中心营收），同比增长77%，远超市场一致预期的728亿美元 [11] - 公司预计FY27Q1 GAAP毛利率为74.9%，NonGAAP毛利率为75%，并预计全年毛利率维持在约75%的水平 [11] - 按目前指引，预计公司FY27全年NonGAAP净利润将达1142亿美元，并有望突破2000亿美元大关 [16] 数据中心业务表现 - 数据中心Q4营收为623亿美元，同比增长75%，环比增长22%，占总营收比例高达92% [5] - 自ChatGPT出现以来，公司数据中心营收规模已增长近13倍 [5] - 计算营收为513亿美元，同比增长58%，环比增长19%，其中Grace Blackwell机柜（GB200/GB300）本季度约占数据中心收入的2/3 [9] - 网络营收为110亿美元，同比增长263%，环比增长34%，首次突破单季度100亿美元大关，规模全球第一 [9] - 网络业务增长由NVLink、Spectrum-X以太网以及InfiniBand的强劲采用驱动，自收购Mellanox以来，网络营收已增长超10倍 [9] - 本季度Total supply-related commitments高达952亿美元，环比暴增89%，提前锁定了包括晶圆、CoWoS封装及HBM等在内的关键产能 [12] - 目前Blackwell相关基础设施已部署并被主要客户消耗的规模达到9GW [14] - 本财年主权AI营收超300亿美元，同比增长两倍，长期预计主权AI机会至少与AI基础设施市场同步增长 [14] 游戏业务表现 - 游戏业务Q4营收为37亿美元，同比增长47%，环比下滑13%，占总营收比例6% [10] - 游戏业务增长由Blackwell需求强劲以及供应改善驱动，但预计供应约束将成为Q1及之后的逆风 [10] 产品与技术进展 - 公司产品路线图从隔年迭代加速到每年迭代，芯片产品矩阵不断扩充 [13] - CUDA软件持续优化，在4个月内于GB200与NVL72上实现了最高5倍性能提升 [14] - 公司计划在每一代产品上实现X倍级的每瓦性能跃迁，并在长期持续扩大领先优势 [14] - CUDA GPU的长使用寿命是相对于其他AI芯片的显著TCO优势，庞大的安装基数将芯片寿命延长至远超最初估计 [14] - 公司已向客户发出首批Vera Rubin样片，计划在2025年下半年开始量产出货 [14] - 公司采用两颗接近光刻reticle极限的大die进行贴合的设计路径（如Grace Blackwell与Rubin），以减少跨界开销，并认为竞争对手的“dielet税”会体现在架构有效性上 [14] - 公司与Groq签署了一项非独家许可协议，使用其低时延推理技术 [14] 市场与客户结构 - 公司本财年按总部地统计：美国营收占比69%，台湾20%，大陆9% [14] - 公司第一大客户营收占比为22%，第二大客户占比14%，客户结构越来越分散 [14] - 本季度CSP（云服务提供商）占数据中心营收略超50%，剩下是互联网和垂直行业 [14] - 全球AI工厂建设浪潮还在早期，需求涵盖了CSP、主权国家、大模型公司、企业和超算中心每个市场 [13] - 公司认为数据中心增长正从云计算主导发展到垂直行业与主权AI遍地开花 [13] 财务与资本管理 - 公司宣布自下季度起，NonGAAP口径将不再剔除股权激励，主动收紧会计口径 [14] - 公司Q4回购38亿美元股票，分红2.43亿美元，剩余回购额度为585亿美元 [14] - 管理层表示只要每代产品能实现远超摩尔定律的每瓦性能提升及远超系统成本涨幅的每美元性能提升，就能维持毛利率 [14] 行业趋势与竞争格局 - 实时生成式AI需要的计算量远超过去的预录制软件，驱动算力需求持续飙升 [17] - 目前几乎所有AI大模型（包括GPT-5系列）仍使用老款Hopper（H100/H200）或旧TPU训练，由Blackwell新卡训练的AI大模型值得期待，因为scaling law仍然奏效 [16] - Agentic AI的“ChatGPT时刻”已经到来，Claude Cowork与OpenClaw共同推动算力需求飙升 [14] - GPT-5.3 Codex训练与推理运行在Grace Blackwell与NVL72系统上，Anthropic也将在Grace Blackwell与Vera Rubin系统上进行训练与推理 [14]

Grace Blackwell机柜（GB200/GB300）

Grace Blackwell机柜（GB200/GB300）

AI视频迎来了它的DeepSeek时刻

经济观察报· 2026-01-21 15:15

文章核心观点 - 爱诗科技发布的通用实时世界模型PixVerse R1，标志着AI视频行业进入了一个新阶段，实现了用户与生成视频的实时交互，开创了“正在发生的现在”的实时生成新纪元，被业内称为“AI视频的DeepSeek时刻” [1][2][9][14] PixVerse R1的技术突破与产品特性 - 模型改变了视频生成逻辑，无需输入提示词也可自动生成视频，用户指令可实时改变画面，实现“言出法随”的效果 [2] - 模型采用Omni原生多模态架构，将文字、图片、音频、视频在同一架构中训练，视为统一的Token流 [5] - 采用自回归流式生成并具备“长期记忆”，能记住此前输入的信息，而不仅是上一帧 [6] - 采用瞬时响应引擎，将传统扩散模型所需的50+采样步数压缩至1-4步，计算效率提升数百倍，实现真正的实时生成 [6] - 模型可将视频生成转变为无限、连续和互动的视觉流，代表了视听媒体创建、体验和共享的重大演变 [6] - 目前每个模板体验限制为5分钟，主要受限于算力消耗，理论上可实现无限生成视频 [5] 行业影响与潜在应用 - 模型对长镜头和长片意义重大，开启了视频创作的新阶段，未来迭代版本可能成为里程碑式产品 [8] - 与传统视频记录“过去”不同，该模型生成的是“正在发生的现在”，是一个可交互的数字生命体，使用户从旁观者变为参与者，实现“共创” [9] - 实时生成能力与世界模型的结合，使AI原生游戏和互动电影成为可能，故事线可由AI与用户共同即兴创作 [10] - 新型互动系统有望在互动媒体、实时VR/XR、创意教育、模拟规划等多个新领域开启应用，这些领域目前仍是“无人区” [11] - 产品上线后，已有影视公司和多家游戏公司寻求合作，探讨产品与内容结合的可能性 [3][10] 公司战略合作与市场认可 - 产品发布6天后，中国儒意以1420万美元战略投资爱诗科技，双方宣布进行版权共享，建立涵盖影视、游戏、流媒体等多方面的战略合作伙伴关系 [3][8] - 中国儒意认为爱诗科技的多模态AI大模型技术在影视行业中具有巨大潜力，双方将共同创建针对专业影视领域的人工智能工具 [8] - 此次合作类似于国外迪士尼与OpenAI的合作，标志着国内影视巨头与AI科技公司强强联手，开启“AI+内容”的下一代互动体验 [3] 爱诗科技的公司实力与背景 - 公司成立于2023年，已在全球AI视频赛道位居前列，截至2025年第三季度，全球用户突破1亿，月活用户超1600万 [13] - 公司产品入选硅谷风投a16z的“全球Top50生成式AI消费级移动应用”榜单 [13] - 2024年11月启动商业化后，不到一年时间月收入增长超过10倍，年度经常性收入达到4000万美元 [13] - 公司自研的PixVerse模型在两年内迭代五个大版本，其V1版本在2023年10月（公司成立6个月后）推出，率先发布业内可生成4K质量视频的AI模型，时间早于Sora [13] - 创始人兼CEO王长虎拥有20年计算机视觉与AI领域经验，曾是字节跳动视觉技术负责人，主导过抖音、TikTok等技术研发 [14]

经济观察网· 2026-01-21 14:39

产品技术突破 - 爱诗科技发布全球首个通用实时世界模型PixVerse R1，支持HD画质，改变了视频生成逻辑，用户无需输入提示词也可自动生成视频，实现“言出法随”的实时交互效果[1] - 模型采用Omni原生多模态架构，将文字、图片、音频、视频在同一架构内训练，并采用自回归流式生成与“长期记忆”技术，能记住此前输入的信息[3][4] - 模型采用瞬时响应引擎，将传统扩散模型所需的50+采样步数压缩至1-4步，计算效率提升数百倍，实现人眼可感知的“即时”响应，是真实时生成，而非“先渲染、后播放”的伪实时[4] - 该产品可将视频生成转变为无限、连续和互动的视觉流，标志着视听媒体创建、体验和共享的重大演变[4] - 目前每个模板体验限制为5分钟，主要受限于算力消耗，若无算力困扰理论上可无限生成视频[3] 战略合作与投资 - 产品上线6天后，中国儒意对爱诗科技进行1420万美元的战略投资，双方宣布进行版权共享，并建立涵盖影视、游戏、流媒体等多方面的战略合作伙伴关系[2][5] - 中国儒意是港股上市公司，旗下儒意影业出品电影累计票房超400亿元，并拥有多部著名电视剧版权[6] - 双方将共同创建针对专业影视领域的人工智能工具，推动影视创作方式变革[6] 市场地位与公司表现 - 爱诗科技成立于2023年，已在全球AI视频赛道位居前列，其PixVerse模型在两年内迭代五个大版本[9][10] - 截至2025年第三季度，公司全球用户已突破1亿，月活用户超1600万，产品入选a16z“全球Top50生成式AI消费级移动应用”榜单[9] - 2024年11月启动商业化后，不到一年时间月收入增长超过10倍，年度经常性收入达到4000万美元[9] - 公司在2023年10月（成立仅6个月后）推出PixVerse V1，率先发布业内可生成4K质量视频的AI视频模型，时间早于Sora模型发布[10] 行业影响与应用前景 - PixVerse R1实现了“正在发生的现在”的实时生成，与传统“记录过去的成品”视频有根本区别，用户从旁观者变为可随时干预内容走向的参与者，实现“共创”[6] - 该技术使视频的生产与消费边界消融，用户在观看的同时也能即时生成、编辑和再创作内容[7] - 实时生成能力与世界模型能力的结合，是当前国内外巨头角逐但尚未出现成熟产品的领域，爱诗科技是全球领先者[7] - 该技术能使AI原生游戏和互动电影成为可能，故事线可由AI与玩家共同即兴创作，虚拟社区的角色和环境可根据用户互动持续演化[7] - 产品发布后，已有多家游戏公司联系爱诗科技探讨合作可能性，其潜力还覆盖互动媒体、实时VR/XR、创意教育、模拟培训等多个新领域[8] - 有知名AI创作者认为，该产品对长镜头和长片意义重大，虽当前画质和可控性尚未达到正式创作要求，但未来迭代版本将是里程碑式产品[6] 创始人与愿景 - 爱诗科技创始人兼CEO王长虎有20年计算机视觉与AI领域经验，曾是字节跳动视觉技术负责人，主导过抖音、TikTok等技术研发[11] - 王长虎表示，PixVerse R1开创了“正在发生的现在”的实时生成新纪元，使叙事能“所想即所现”，智能化媒体应实时响应用户意图，让每个人成为动态叙事的创作者[11]

李飞飞世界模型大更新，实时生成3D世界，只要一块GPU

36氪· 2025-10-17 16:03

技术核心与创新 - 公司发布名为RTFM的全新实时世界生成模型，可从单张静态图片实时渲染出可供自由探索和交互的3D场景[1][4] - 该模型采用类似Sora的“自回归扩散Transformer”架构，不构建任何显式的3D模型，而是通过端到端学习海量视频数据来直接预测新视角画面[9] - 模型核心创新在于引入“空间记忆”机制，为每一帧画面赋予3D空间中的精确姿态，并通过“上下文杂耍”技术仅调用局部参考帧，以维持世界持久性而不显著增加计算负担[11] 性能与效率突破 - 模型经过架构、蒸馏和推理过程的极致优化，设计目标为在现有硬件上运行明日模型，成功实现在单块H100 GPU上以交互式帧率进行实时推理和生成[1][8] - 实时生成4K 60fps交互视频流对算力要求极高，每秒需处理token量约等于一本《哈利·波特》文字量，持续一小时的交互需处理超1亿个token，当前基础设施难以负担[6] - 该技术路线相比传统3D引擎的显式建模方法，能更好地利用增长的数据和算力，实现无限扩展[9][11] 应用与演示现状 - 模型已作为研究预览版正式发布，并提供了名为FRAMEBOY的Demo供体验，其逼真的光影、反射和阴影效果在实时交互中呈现[1][3] - 当前Demo体验时间限制为3分钟，3分钟后世界状态无法维持，展示了模型在空间智能和持续交互方面的探索方向[13] - 该技术被视作通往AGI空间智能方向的重要一步，其单GPU高效运行的特性为未来世界模型的普及提供了可能性[13][15]

世界模型

实时生成

空间记忆

RTFM (Real-Time Frame Model)

RTFM (Real-Time Frame Model)

Sora 2

Genie 3

多模态内容生成的机会，为什么属于中国公司？

Founder Park· 2025-06-24 19:53

多模态技术发展现状 - 中国企业在视频生成、3D创作等多模态细分领域已跻身全球第一梯队，与美国在大语言模型领域的领先形成差异化竞争[1] - Pixverse的视频生成产品用户规模超过许多美国知名产品，VAST在3D技术上实现核心突破，Feeling AI探索多模态融合创新路径[1] - 中国团队在场景理解、数据积累和工程落地方面具备综合优势，抖音、快手等产品背后的视觉技术为视频生成奠定基础[7] 中国团队的核心优势 - 视频技术领域有多年积累，组织架构灵活性助力创新，全球用户量最大的视频生成产品多数来自国内团队[7] - 多模态领域技术路径尚未定型，中国丰富的应用场景和人才储备为创新提供沃土[7] - 差异化技术策略实现突破，3D领域从核心技术攻坚转向产品化落地，专注画质而非功能丰富性[8] 竞争格局与战略应对 - 面对阿里、腾讯等巨头的开源攻势，创业公司通过保持战略定力、聚焦细分需求寻找突破口[9] - 大厂竞争是创业公司的"成人礼"，战略节奏领先是关键，先聚拢顶尖科学家实现技术突破，再转向产品化和商业化[9][10] - 开源是创业公司可以借力的东风，但难以满足特定场景需求，需要在开源基础上进行深度定制[12] 技术发展趋势 - 实时生成成为重点方向，Pixverse线上模型5秒生成5秒视频，目标实现真正实时生成[17] - 多模态融合趋势显著，GPT-4o强调的原生多模态实现训练时共享同一语义空间[14] - 3D生成转向自回归路线，生成模型面数低且拓扑结构类似人工建模，方便二次编辑[18] 产品与用户策略 - Pixverse采取双轨策略：网页版服务专业用户，移动端"拍我"App面向大众，模板化生成降低创作门槛[21][22] - VAST调整用户定位，从游戏玩家转向专业用户，打造完整3D创作工作流而非简单模型生成[25] - Feeling AI面向海外14-24岁年轻群体，结合游戏、创作和虚拟陪伴体验，模糊创作者与消费者界限[27][28] 未来目标与挑战 - Pixverse目标实现高质量实时视频生成，用户规模达3亿-5亿[37] - VAST希望降低3D创作门槛，探索可交互内容新生态，可能出现"3D版抖音"[37] - 行业共识是技术进步将让更多普通用户参与多模态创作，AI加速动态3D内容发展进程[33]

Artificial Intelligence

Artificial Intelligence

3D 技术