Workflow
非结构化数据
icon
搜索文档
黄仁勋 GTC 2026 演讲实录:所有SaaS公司都将消失;Token成本全球最低;“龙虾”创造了历史;Feynman 架构已在路上
AI前线· 2026-03-17 07:30
公司战略定位 - 公司已从单一的图形处理器供应商转型为为“数万亿美元AI基建时代”提供完整技术栈的“总包工头” [2] - 公司的核心壁垒是CUDA软件生态及其庞大的安装基数,这形成了强大的“飞轮效应”,吸引了开发者、催生新市场并持续降低算力成本 [3][6] - 公司业务覆盖AI全领域,是全球唯一能运行语言、生物、图形、视觉、机器人、边缘及云端所有AI领域的平台 [18] CUDA生态与飞轮效应 - CUDA架构诞生20年,其单指令多线程(SIMT)架构和“tiles”功能降低了编程难度,并围绕其形成了包含数千种工具、编译器、框架和库的庞大生态 [4] - 公司在全球建立了数亿块运行CUDA的GPU和计算系统,服务每一朵云、每一家计算机公司和几乎每一个行业,构成了飞轮效应的基础 [6] - 飞轮效应表现为:安装基数吸引开发者,开发者创造新算法和技术突破,催生新市场并扩大生态,进而进一步扩大安装基数,同时使计算成本持续下降 [6][7] - 庞大的安装基数使得公司愿意持续优化软件,因为每项新优化都能让数百万用户受益,这延长了硬件(如六年前出货的Ampere架构)的生命周期,甚至在云上出现定价上涨 [6][7] 数据处理基础设施变革 - AI的快速发展正推动全球数据处理体系发生结构性变革,核心是结构化数据与非结构化数据的全面加速 [8] - 企业计算长期建立在结构化数据(数据框)之上,未来AI系统和智能体也将直接访问和使用这些数据库,要求数据处理基础设施获得数量级性能提升 [10] - 全球每年产生的数据中约90%是非结构化数据(如向量数据库、PDF、视频、语音),AI的多模态理解能力正将其转化为可计算的信息资源 [12] - 为支持这一转变,公司构建了两项关键基础技术:用于加速结构化数据处理的cuDF和用于处理非结构化数据及AI数据的cuVS [13] - 这些技术正逐步融入全球数据处理生态,例如IBM正利用cuDF加速其IBM watsonx.data平台 [13] AI原生行业爆发与市场前景 - 2025年风险投资对AI初创公司的投入高达1500亿美元,创历史之最,投资规模跃升至数十亿美元级,因为这些公司普遍需要海量算力和Token [15] - AI行业爆发源于三件大事:ChatGPT开启生成式AI时代、推理AI(如o1/o3)的出现以及Claude Code开启代理(Agentic)时代 [15] - AI已从“感知”进化到“生成”、“推理”,现在可以执行高效的实际工作,“推理拐点”已经到来,过去两年计算需求增长了约10,000倍,使用量增长约100倍 [17] - 公司预见通过2027年的营收将至少达到1万亿美元,2025年是公司的“推理之年” [17] - 公司业务中,60%来自顶级云服务商,40%来自区域云、主权云、企业级服务器及工业自动化 [18] AI推理性能与成本优势 - AI推理是最困难也是最关键的商业环节,它直接决定AI服务的收入来源 [22] - 衡量AI系统效率的关键指标是每瓦特生成多少token,公司从Hopper H200到Grace Blackwell NVLink 72架构,实现了每瓦特性能提升约35倍(分析师认为接近50倍),并带来更低的token成本 [22] - 通过极致的软硬件协同设计(如NVFP4计算架构、NVLink 72、Dynamo、TensorRT-LLM等),公司构建了完整的大模型推理技术体系 [20] - 仅通过更新软件栈,就能将部分AI推理平台的生成速度从约700 token/秒提升至接近5000 token/秒,性能提升约7倍 [25] - 公司的Token成本在全球范围内具有绝对优势,即便竞争对手的架构免费,其总成本(如1GW数据中心工厂15年摊销成本高达400亿美元)也不够便宜 [25] - 数据中心正从存储和计算中心转变为生产token的“AI工厂”,token成为新的数字商品 [27] Vera Rubin AI超级计算平台 - Vera Rubin是一个全新的计算平台,由七款芯片组成,涵盖计算、网络和存储,是目前最先进的POD规模AI平台 [28] - 该平台包含40个机架、1.2千万亿个晶体管、近2万个公司芯片、1152个NVIDIA Rubin GPU、60 exaflops运算能力以及10 PB/s总扩展带宽,目前已全面投产 [28] - 该平台得到了Anthropic、OpenAI、Meta、Mistral AI及所有主要云提供商的支持 [28] - 过去十年间AI计算能力实现了约4000万倍的提升,推动数据中心向“AI超级计算机”形态演进 [30] - Vera Rubin是一套从硬件到软件完全纵向整合的计算平台,专为智能体AI设计,重新设计了计算、存储和网络架构 [31] - 平台硬件包括全新的NVIDIA Vera CPU,该CPU针对高性能、大规模数据处理和能效优化,是全球首个在数据中心采用LPDDR5内存的CPU,并已开始单独销售,有望成为一项数十亿美元级业务 [33] - 系统采用100%液冷架构,通过45°C热水散热降低制冷成本,并将整机安装时间从两天缩短至约两小时 [33] - 网络互连采用第六代NVLink架构,并推出了全球首个CPO光电共封装的NVIDIA Spectrum-X以太网交换机 [35] - 通过Kyber机架架构的Rubin Ultra Compute System,可以在一个NVLink域中连接144个GPU,形成大规模统一计算机 [35] Feynman GPU架构与深度整合 - Feynman GPU架构将采用定制化HBM技术,可能基于HBM4E增强版或定制化HBM5方案,允许将部分GPU数据处理逻辑嵌入存储底层,实现超高带宽与低延迟 [41][42] - Feynman平台将搭载代号为Rosa的全新CPU,该CPU被设计为AI智能体的编排中枢,旨在高效调度GPU、存储与网络之间的Token流动 [43] - Feynman时代标志着公司将计算、存储和封装进行了深度耦合,正将数据中心演进为一台高度集成的“巨型超级计算机” [44] AI基础设施与数字孪生平台 - 公司推出NVIDIA DSX平台,这是一个面向“AI工厂”的基础设施平台,用于数据中心的数字仿真、虚拟调试和运行期动态优化 [46][47] - 数据中心建设阶段可通过工程仿真工具进行虚拟调试,大幅缩短建设周期;运行后其数字孪生系统可作为“操作系统”,由AI智能体动态调度冷却、电力和网络系统以优化效率 [46] - NVIDIA Omniverse平台被设计用于承载全球规模的数字孪生模型 [49] - 公司的AI计算基础设施正在向太空延伸,计划开发Vera Rubin Space One轨道数据中心 [49] 智能体操作系统与软件生态 - 公司高度评价并正式支持开源项目OpenClaw,其增长速度甚至超过了Linux,被视为智能体计算机的操作系统 [52][54] - OpenClaw能够连接大语言模型,管理计算资源,调用工具和服务,具备任务调度与多模态交互能力 [54] - 公司认为未来所有科技和软件公司都需要制定“OpenClaw战略”,因为企业软件正在从传统SaaS转向以智能体为核心的AaaS(Agentic as a Service) [55] - 公司与OpenClaw作者合作推出NVIDIA NemoClaw参考架构,增加了OpenShell安全组件,提供企业级安全扩展,使企业能安全部署智能体系统 [56][58] 开放模型生态与行业应用 - 公司推进开放模型生态,目前生态已包含接近300万个开放模型,覆盖语言、视觉、生物、物理和自动驾驶等多个领域 [59] - 公司已发布多条开放模型产品线(如Nemotron、Cosmos World Foundation Model、Project GR00T等),并开放训练数据和方法,策略是“纵向整合、横向开放” [59][60] - 公司宣布成立Nemotron Coalition联盟,与多家技术公司合作共同推进模型发展 [61] - 在物理AI领域,全球几乎所有机器人公司与公司合作,公司提供从训练平台、仿真到部署的完整技术体系 [62] - 自动驾驶的“ChatGPT时刻已经到来”,车辆具备推理和语音指令执行能力,公司宣布与比亚迪、现代、日产、吉利(合计年产量约1800万辆)以及Uber成为新的Robotaxi合作伙伴 [64] - AI产业正同时经历三大变革:AI推理与AI工厂、智能体系统革命,以及物理AI与机器人时代 [65]
独家洞察 | AI掘金术:从非结构化数据中,挖出金融高见
慧甚FactSet· 2026-01-15 10:13
金融数据处理的挑战与机遇 - 金融数据量激增,将信息转化为可执行情报变得复杂,关键信息常被困于非结构化格式并分散在割裂的系统和来源中[1] - 结构化数据(如定价和基本面数据)固然重要,但许多关键洞察隐藏在财报电话会议记录、监管文件和新闻等非结构化来源中[1] AI在释放非结构化数据价值中的作用 - 释放非结构化数据的价值离不开无缝的人工智能(AI)集成[3] - 对内容进行标准化、向量化和信息增强,是从人工审核升级到流程自动化所必需的能力,构成了成功AI驱动工作流的基石[3] - 这些能力使高价值、高质量的信息能够更快速、更准确地被提取出来[3] AI就绪的非结构化数据作为金融智能基础 - 提升对非结构化内容的访问能力、克服数据碎片化、确保数据为AI应用做好准备至关重要[4] - 公司正构建一个AI就绪的金融文档语料库,包含全球监管申报文件、财报电话会议记录、StreetAccount新闻等内容[4] - 通过添加补充信息、元数据标签和上下文图层来丰富数据集,更丰富的上下文意味着更聪明的人工智能、更可靠的结果以及基于深度上下文理解的工作流程[4] - 对于投资组合经理和分析师,这意味着可以将非结构化洞察与持仓数据无缝整合,从而追踪风险并捕捉信号[4] 技术架构与数据交付 - 公司经增强处理、已具备AI就绪能力的数据,是围绕检索增强生成 (RAG) 架构而构建的[5] - 数据通过开放的应用程序接口 (API) 生态系统和其他灵活的数据交付渠道对外提供[5] - 公司正在开发一个Snowflake Cortex知识扩展,旨在让用户能够发起语义搜索,并返回相关文档内容及其关联的元数据[5] - 通过这一扩展,Snowflake的Cortex AI可以无缝访问这些支持AI的非结构化数据,为用户提供洞察,支持决策,并赋能多种业务工作流程[5] 与Snowflake Intelligence的集成与互操作性 - 互操作性对释放数据价值并实现规模化数据增强至关重要,尤其是在与企业专有内容来源相结合的情况下[7] - Snowflake Intelligence通过多种方式补充了公司的AI就绪数据能力,包括允许用户使用自然语言进行查询、直接在Cortex Knowledge Extension上构建AI代理以及在结构化和非结构化数据集之上广泛应用生成式AI[7] - 这些能力有助于将内容转化为可执行的洞察,从而实现更快、更明智的决策,无需等待人工数据准备[7] - 通过将结构化市场数据、自有持仓数据和非结构化内容整合于统一视图,获得更深入的洞察[7] 集成带来的新可能性与开放式生态系统 - 将公司的AI就绪数据与Snowflake Intelligence集成,为用户处理信息的方式开辟了新的可能性[9] - 开放式生态系统使金融机构能够随时随地访问和利用AI就绪的内容,无论是在Snowflake平台内还是通过公司API集成到自有平台、模型和应用程序中,都能实现最大价值[9] - 这种灵活的方法确保团队能够将情境洞察与内部专有数据及外部数据源相结合,在不被单一工作流所束缚的前提下,持续推动实验、迭代以及可规模化的创新[9] - 凭借具备AI就绪性且互操作性的基础架构,洞察生成能力可以跟上信息体量和复杂性不断增长的节奏[9] - 高质量的洞察力和竞争优势取决于能否随时随地获取最新、最可靠的情报[9] 具体应用场景示例 - 通过语义搜索技术,在新闻和文字记录中捕捉早期信号,比传统数据集更快地发现新兴主题[11] - 借助智能代理自动化竞争与风险情报分析,实时追踪同行评论、监管政策变动及申报文件动态更新[11] - 从非结构化内容中提取情感、业绩指引和可执行的洞察,用于丰富模型、仪表盘和下游业务工作流程[11]
下半年预期可能难以实现,现在或许是远离Snowflake的最佳时机
美股研究社· 2025-03-14 19:30
公司股价与市场情绪 - 股价近几个月反弹主要由市场情绪而非基本面驱动 [1] - 2025年下半年增长预计加速但业绩预期被认为过于激进 [1] - 新产品可能提振公司但大环境可能变得不利 [1] 竞争格局 - Databricks年收入30亿美元同比增长60%现金流为正 [3] - Databricks SQL年收入6亿美元同比增长超150%估值620亿美元 [3] - 竞争对手技术复杂且成本高部分客户迁移节省超50%成本 [3] - Databricks在非结构化数据和生成式AI领域定位更强可能削弱公司业务 [4] - 公司职位空缺略有增加净客户增加和净留存率稳健表明业务健康 [4] 产品与技术发展 - 公司从云优化数据仓库转型为更广泛的数据平台 [5] - 开放数据格式快速采用约500个账户已采用Apache Iceberg [5] - Snowpark贡献3%收入新数据工程工作量带来2亿美元年化收入 [6] - 与微软和ServiceNow合作提高数据互操作性 [6] - 收购Datavolo以支持结构化和非结构化数据接入 [6] - Cortex受客户青睐超4000个账户使用AI/ML功能 [6] 财务表现 - 第四季度产品收入9.43亿美元同比增长28% [7] - 净收入留存率稳定在126%剩余履约义务同比增长33%至69亿美元 [7] - 预计第四季度产品收入9.55-9.6亿美元同比增长21-22% [7] - 全年产品收入预计42.8亿美元增长24% [7] - 非GAAP营业利润率约9%得益于经营杠杆和成本削减 [8] - 现金及等价物总额53亿美元 [10] 长期增长与估值 - 预计未来十年云计算支出年增15%达2万亿美元 [2] - 2026年收入预计44亿美元同比增长23% [11] - 2030年收入预计94亿美元同比增长18% [11] - 分析师预期每股收益15美元但预计仅10美元 [12] - 收入倍数与同行持平但软件股普遍被高估 [11]