DGX Station
搜索文档
Jim Keller的RISC-V工作站实测
半导体行业观察· 2025-11-28 09:22
如果你正在寻找一款能够运行本地AI推理或对中小规模模型进行微调的工具,那么Tenstorrent的 QuietBox可能并不适合你。我们预计这种情况会有所改变,但就目前而言,该公司的软件栈对于大 多数本地AI爱好者来说还不够完善。 然而,对于有兴趣探索 Tenstorrent 的硬件架构和软件栈的机器学习软件开发人员,或者那些希望在 生产中部署这家初创公司芯片的开发人员来说,像 Blackhole QuietBox 这样的系统提供了一个相对 低成本的切入点,可以进入该公司基于 RISC-V 的加速器生态系统。 TT-QuietBox 开箱 提到人工智能基础设施,Tenstorrent 可能不是人们首先想到的名字。但与众多争夺风险投资和英伟 达市场份额的人工智能芯片初创公司不同,Tenstorrent 的芯片实际上已经走出了实验室。 如果您有点特立独行,想要打破常规,Tenstorrent 的组件和系统随时可供任何有需要的人使用。事 实上,您或许会惊讶地发现,该公司已经推出了三代基于 RISC-V 的加速器,旨在为开源社区积蓄力 量。 他们的理念是提供性能合理的加速器,能够高效地从单卡扩展到 32 芯片系统甚至 ...
英伟达 - 2026 年销售加速;目标价上调至 270 美元;维持买入评级
2025-11-24 09:46
**涉及的公司和行业** * 公司:NVIDIA Corp (NVDA O) [1][42] * 行业:人工智能 (AI) GPU、数据中心半导体、游戏、汽车、专业可视化 [10][20][33][37] **核心观点和论据** * **财务表现与展望** * 公司公布10月季度收入570亿美元,非GAAP每股收益130美元,高于市场预期 [10][22] * 公司指引1月季度收入为650亿美元,高于市场约630亿美元的预期 [1][24] * 数据中心收入连续增长25%,主要受Blackwell平台强劲需求推动,云计算GPU“售罄” [10][11] * 预计2027财年销售额将达到2690亿美元,较此前2250亿美元的预测上调19% [3][27] * 预计2027财年/2028财年非GAAP每股收益分别为810美元和1008美元,上调12%和19% [2] * **产品与技术** * Blackwell平台需求“超出图表”,占季度计算销售额430亿美元的90%以上 [10][11] * GB300平台占计算销售额的三分之二,可能已超过此前讨论的每周1千个机架的运行速率 [11] * 网络业务(以太网和InfiniBand)恢复增长,季度环比增长13%,达到82亿美元 [11] * 与OpenAI和Anthropic的投资合作伙伴关系是消费方面最成功的AI公司 [1] * **供应链与产能** * 台积电CoWoS晶圆产能预计明年将增长至120万片,为数据中心销售额加速增长提供路径 [1] * 基于更多数据点,将2027财年GPU单元预测上调至1020万个,较此前870万的预测增长44% [3][26] * 预计2025年至2026年期间,Blackwell和Rubin的合并出货量将从1420万提升至1620万 [3][26] * **市场与行业趋势** * 首席执行官认为当前并非AI泡沫,加速计算、生成式AI和代理AI三大平台正在融合 [1] * 预计AI加速器总市场规模(TAM)到2028年将达到5000亿美元,较此前4640亿美元的预测上调 [35] * 预计AI商用GPU销售额将在2028年达到4030亿美元,2025年至2028年复合年增长率为28% [35] * 预计2028年数据中心半导体总市场规模将达到7010亿美元,较此前预期上调7% [36] * **盈利能力** * 尽管投入成本上升,毛利率预计将维持在70%中段水平 [1] * 10月季度非GAAP毛利率为736%,公司指引1月季度非GAAP毛利率将达到75% [10][24] * **其他业务板块** * 游戏收入季度环比下降1%,但同比增长30%,占本季度销售额约7% [18] * 专业可视化收入季度环比增长26%,达到760亿美元,主要由DGX Spark驱动 [19] * 汽车销售额季度环比小幅增长1%,公司预计2026财年汽车总销售额(数据中心+汽车)将达到50亿美元 [20] * **投资评级与估值** * 维持买入评级,目标价从220美元上调至270美元,基于30倍市盈率乘以2027年预期每股收益约10美元贴现回当前 [2][6][46] * 预期股价回报率为448% [6] **其他重要内容** * **风险因素** * 竞争可能导致公司在游戏市场失去份额 [47] * 新平台采用速度慢于预期可能导致数据中心和游戏销售额下降 [47] * 汽车和数据中心市场的波动性可能增加股价/市盈率的波动 [47] * 加密货币挖矿对游戏销售的影响 [47] * **中国市场** * 由于美国出口管制,公司第三季度无法大量出货H20(5000万美元),管理层继续将中国H20销售额预测设为零 [17] * **合作伙伴生态** * 公司与多家科技巨头和政府建立了广泛的AI合作伙伴关系网络,包括微软、谷歌、亚马逊、Meta、软银等 [15][16]
老黄亲送马斯克“雷神之锤”!英伟达个人超算今日开售,2 万多元买个“本地 OpenAI”回家?
搜狐财经· 2025-10-16 15:58
产品规格与定位 - DGX Spark是一款个人AI超级计算机,将数据中心级的DGX架构浓缩为可置于桌面的设备,其本质是“把云上AI能力拉回桌面”的个人PC[2][4] - 与2016年的DGX-1相比,DGX Spark在AI性能上从170 TFLOPS(FP16)提升至1 PFLOP(FP4),系统功耗从3200W大幅降低至240W,重量从60.8kg减轻至1.2kg,价格从12.9万美元降至3999美元[1] - 产品尺寸为150mm x 150mm x 50.5mm,与Mac mini大小相当,被称为“世界上最小的AI超级计算机”[5] - 在英伟达产品线中,DGX Spark定位为面向轻量级本地推理与微调的便携设备,而其“大哥”DGX Station则定位高端桌面级大模型训练与企业级工作负载,是“个人集群节点级”的重型设备[7][9] 技术架构与性能 - DGX Spark基于全新的NVIDIA GB10 Grace Blackwell超级芯片,该芯片将CPU和GPU直接集成,共享128GB统一内存,使大模型可一次性加载进系统运行,不受显存限制[21] - 独立测评显示,该设备在运行8B至20B参数的中小型模型时,性能大于或等于同价位独立显卡平台,尤其在批处理与框架优化配合下吞吐表现稳定[10] - 对于70B参数以上的大模型,DGX Spark可运行但属于“可用级”而非“生产级”,更适合加载测试与兼容性研究[10] - 设备支持像云服务器一样一键上线模型服务,并能通过Docker启动专为本地大模型推理优化的高性能框架,使模型常驻本地端口等待调用,成为“本地AI节点”[10][11] 行业趋势与影响 - 英伟达发布桌面级AI超算反映了AI由云向本地“反向迁移”的趋势,过去几年“上云”是行业共同信仰,但2025年开始,云成本、隐私风险与网络瓶颈等问题浮出水面[22] - 云服务变得昂贵,推理成为新的成本中心,云GPU按秒计费且带宽与出站流量另算,有公司发现其年度云账单高达300万美元,另一家公司月账单从5000美元一夜飙升至5万美元[23] - 本地设备性能提升,桌面不再只是输入终端而正成为“计算现场”,未来训练主要在数据中心,但推理正外溢到设备与边缘,企业客户自建GPU节点以获得更低成本与更高合规性[24] - AI应用从后台工具转变为实时伙伴,深入语音助手、视频生成、工业控制、AR/VR等对延迟敏感的场景,推动实时推理下放到端侧和边缘节点,形成“云为大脑、本地为手脚、端侧为神经末梢”的分布式系统[25]
老黄亲送马斯克“雷神之锤”!英伟达个人超算今日开售,2万多元买个“本地OpenAI”回家?
AI前线· 2025-10-15 15:45
文章核心观点 - AI算力正从云端向本地设备进行“反向迁移”,英伟达推出的个人AI超级计算机DGX Spark是这一趋势的具体体现,旨在将数据中心的AI能力带给个人开发者 [2][33][43] 英伟达DGX Spark产品详情 - DGX Spark是一款个人AI超级计算机,售价为3999美元起,定位为面向轻量级本地推理与微调的便携设备 [3][12] - 与2016年的DGX-1相比,DGX Spark在性能、功耗和体积上均有显著提升:AI性能从170 TFLOPS提升至1 PFLOP,系统功耗从3200W大幅降低至240W,重量从60.8kg减轻至1.2kg,价格从129,000美元降至3,999美元 [4] - 该设备基于NVIDIA GB10 Grace Blackwell超级芯片,采用CPU与GPU融合设计,共享128GB统一内存,使大模型可一次性加载运行 [33] - 产品被形容为“世界上最小的AI超级计算机”,尺寸与Mac mini相仿 [10] DGX Spark性能测评与应用场景 - 根据LMSYS的测评,DGX Spark在运行8B~20B参数的中小型模型时,性能大于等于同价位独立显卡平台,批处理效率和吞吐表现稳定 [13] - 对于70B参数以上的大模型,设备可运行但属于“可用级”而非“生产级”,更适合加载测试和兼容性研究 [14] - 测评展示了完整的本地AI工作流:设备能像云服务器一样一键上线模型服务并常驻运行,支持推理加速技术,可通过标准API被调用,并能接入Open WebUI和Zed编辑器等工具,形成完整的离线AI开发环境 [16][18][21][22][24][28][29] - 其核心优势在于能在桌面上提供类似“个人版ChatGPT服务器”的体验,实现低延迟、无需网络的本地AI交互 [25][32] AI算力从云到本地迁移的行业趋势 - 过去几年AI行业普遍依赖云端算力,但到2025年,云成本高昂、隐私风险和网络瓶颈等问题凸显,推理成为新的成本中心,促使算力向本地迁移 [34][35][36] - 有公司因云账单从每月5000美元飙升至5万美元而决定“下云”,自建机房以控制成本 [37] - 同时,本地设备性能提升,除DGX Spark外,微软的Copilot+ PC和苹果的Apple Intelligence也强调本地AI能力,有公司将推理迁移至本地后,月度AI基础设施开销从4.2万美元降至9000美元 [38] - AI应用正从后台工具转变为实时伙伴,对延迟敏感的场景(如语音助手、工业控制)推动推理向端侧和边缘节点扩散,形成“云为大脑,本地为手脚”的分布式系统 [40][41][42][39]
英伟达(NVDA.US)继续书写AI算力神话! DGX Spark重磅问世 数据中心级算力奔赴桌面
智通财经网· 2025-10-14 16:05
产品发布核心信息 - 英伟达于当地时间周三正式推出全球最小规模的AI超级计算机Nvidia DGX Spark,该产品以紧凑的桌面台式机形式提供基于Grace Blackwell架构的AI堆栈 [1] - 该产品旨在为中小型企业及AI开发者提供在PC端侧快捷接入AI超级计算系统的途径,无需耗费数百万美元租用云端算力或购买自有AI服务器,售价仅为3999美元 [2] - 产品可配备最高128GB的统一内存,单机峰值AI性能约1 PFLOP(FP4),内置DGX OS及CUDA X-AI全栈软件,支持在本地运行70B至200B参数规模的AI大模型进行推理与微调 [7] 产品技术规格与定位 - 与2016年推出的DGX-1相比,DGX Spark在尺寸、重量和功耗上大幅优化,尺寸为150mm x 150mm x 50.5mm,重量仅1.2kg,功耗为240W,而DGX-1重量为60.8kg,功耗3200W [5] - 产品定位为“开发者的个人/团队级AI试制间”,与大型AI算力工厂如DGX GB200/GB300形成互补关系,专注于原型开发与技术微调,而非替代大型服务器集群 [8] - 用户可通过连接两台DGX Spark系统运行更大规模的AI模型,参数规模可高达4050亿 [6] 市场影响与增长前景 - 该产品的推出被视为公司新的业绩增长点,有望支撑其股价冲击华尔街机构Cantor Fitzgerald设定的300美元目标价,对应市值超过7万亿美元 [1] - 英伟达股价年内涨幅高达40%,当前股价徘徊在188美元附近,市值稳定在4.6万亿美元,长期位居全球市值榜首 [1] - 公司近期与多家企业达成巨额交易,包括对OpenAI的1000亿美元级别投资,后者将采购高达10吉瓦容量的AI服务器集群;此外,公司与CoreWeave签署了价值63亿美元的AI算力订单 [9] 行业趋势与机构观点 - 以英伟达、台积电、博通及美光科技为主导的全球AI算力产业链的“超级牛市行情”远未停歇,该板块仍是全球资金最青睐的投资领域 [1][10] - 华尔街机构预测,AI算力硬件为核心的人工智能基础设施投资浪潮规模有望达到2万亿至3万亿美元,英伟达CEO黄仁勋进一步预测,2030年前AI基础设施支出将达到3万亿至4万亿美元 [11] - 华尔街分析师不断上调公司目标价,平均预期显示英伟达市值有望在一年内突破5万亿美元 [10]
黄仁勋Computex演讲看点总结 - 算力周跟踪
2025-07-16 14:13
纪要涉及的行业和公司 - 行业:电子板块、数据中心网络、AI行业、半导体行业 - 公司:英伟达、台积电、富士康、华硕、联发科 纪要提到的核心观点和论据 - **核心观点** - 海外算力板块预期逐步修复,相关公司业绩逐季释放,算力PC板块估值处于底部,建议关注 [8] - **论据** - **产品进展**:Blackwell系列产品中,HGX系列8卡服务器去年投产今年2月交付,GB200机柜已投产,今年Q3将升级到GB300,定位AI工厂核心计算单元 [1] - **出货情况**:今年Q1因ODM厂L11级组装问题,机柜出货量低于预期,市场下调全年出货量预期,但计算托盘沿用HDI白安卡版本以降低装配难度、尽快出货 [2][3] - **技术创新**:数据中心网络推出NVLink Fusion版本,客户采购芯片或IP即可让ASIC芯片使用 [3] - **产品发布**:推出面向个人的DGX Spark和桌面级的DGX Station,分别降低AI开发门槛和提供桌面端强大计算能力 [4] - **合作计划**:联合台积电、富士康在台湾建立首座人工智能超级计算机,开设新办事处并联合各方建巨型AI超算中心,支持本地科研和半导体设计 [5][7] - **性能提升**:华硕推出的英伟达RTX Pro服务器性能比英伟达之前旗舰H100系统在不同负载下高出1.7 - 4倍,已可投入量产 [6] - **软件拓展**:以Cuda生态为基础推出大量专业加速库,将AI加速能力标准化模块化应用到各产业场景 [7] 其他重要但是可能被忽略的内容 - RTX5060显卡及搭载该显卡的MSI新款笔记本预计五月上市发售 [5] - Blackwell RTX Pro 6000功能站系列含8块GPU,支持CX8网卡,通信快、功耗低,适合训练和推理强大AI模型 [5]
英伟达(NVIDIA)FY26Q1 业绩点评及业绩说明会纪要
华创证券· 2025-05-31 15:20
报告行业投资评级 未提及 报告的核心观点 报告对英伟达 FY26Q1 业绩进行点评,指出营收显著高于预期,主要受益于数据中心业务爆发,各细分业务有不同表现,公司对 FY26Q2 给出业绩指引,同时会议问答中探讨了推理需求、中国市场影响、AI 发展阶段等多方面问题 [2][3][5] 根据相关目录分别进行总结 NVIDIA FY26Q1 业绩概况 - FY26Q1 营收 441 亿美元,高于市场预期和公司指引,主要因数据中心业务爆发,Blackwell 贡献数据中心计算收入 7 成,H20 一季度产生 45 亿美元费用,预计二季度损失 80 亿美元收入,GAAP 和非 GAAP 毛利率分别为 60.5%和 61.0%,GAAP 和非 GAAP 稀释每股收益分别为 0.76 美元和 0.81 美元,供应链管理优化存货周转天数等指标 [7] - 公司预计 FY26Q2 营业收入为 450 亿美元,上下浮动 2%,考虑 H20 收入损失约 80 亿美元,预计 GAAP 和非 GAAP 毛利率分别为 71.8%和 72.0%,上下浮动 50 个基点,力争下半年将毛利率提高到 70%左右 [8] 会议内容 问答环节 - 对于推理需求,Grace Blackwell NVL72 是推理 AI 理想引擎,与 Hopper 相比速度和吞吐量高出约 40 倍,可降低成本、提高响应质量和服务质量 [9] - H20 第一季度确认 46 亿美元营收,未出货 25 亿美元,第二季度中国数据中心营收将大幅下降,预计损失 80 亿美元,未来还有其他无法履行订单,估计未来中国市场 TAM 接近 500 亿美元 [10][11] - AI 处于起步阶段,将成为新基础设施,除在云端建设外,还将进入企业、电信、工厂等领域,企业 AI 正在腾飞,6G 将建立在 AI 之上,每个工厂都将伴随 AI 工厂 [12][13] - 目前订单比之前更多,正在增加供应链建设,未来几年供应链将忙碌,欧洲有大量未公布的 AI 工厂建设规划 [14][15] - H20 损失 80 亿美元,为达 450 亿美元营收目标,非中国业务需表现更好,主要驱动因素是 Blackwell 增长和供应链供应增加 [16] - 与年初相比有四个积极惊喜,包括推理 AI 需求增长、AI 扩散、企业 AI 腾飞、工业 AI 发展 [17][18] - 出口管制使 Hopper 受限,目前无适合中国市场产品,正在思考解决方案 [20] - 网络业务有 NVLink、Spectrum - X、Bluefield 等平台,增强以太网功能提高集群利用率,上个季度增加两家重要 CSP 采用 SpectrumX [21][22]
英伟达电话会全文!黄仁勋:“AI推理爆炸式增长”,痛失H20巨额收入但Blackwell芯片周产7.2万颗GPU
硬AI· 2025-05-29 22:05
核心观点 - 英伟达Q1营收同比增长69%至440亿美元,超出预期,但受H20出口限制影响,Q2预计损失80亿美元收入[1][8][25] - Blackwell芯片产能创纪录,周产72,000颗GPU,支撑微软单季处理100万亿Token的推理需求[1][10][28] - AI推理需求呈现爆炸式增长,微软Q1处理Token量同比增长5倍至100万亿[4][12][29] - 中国AI市场价值500亿美元,但受出口限制影响基本对美国关闭,公司正探索替代方案[3][8][45] - 企业AI和工业AI成为重要增长引擎,预计将改造5000亿美元IT基础设施[17][84] 财务表现 - Q1数据中心收入390亿美元,同比增长73%,其中Blackwell贡献近70%[25][27] - Q1网络业务收入环比增长64%至50亿美元,Spectrum-X年化收入超80亿美元[33][35] - Q1游戏业务收入创纪录达38亿美元,环比增48%,AI PC产品线扩展[37] - Q2营收指引450亿美元,GAAP毛利率预计71.8%,Blackwell盈利能力改善[20][43] 产品与技术 - Blackwell架构吞吐量比Hopper高40倍,专为复杂推理设计,软件优化使其性能提升1.5倍[3][10][30] - GB300系统本季度末量产,采用与GB200相同规格,HBM增加50%带来FP4推理性能提升50%[10][28] - NVLink技术实现PCIe Gen5带宽14倍,单机架带宽达130TB/s,Q1出货超10亿美元[34][35] - Omniverse平台助力工业客户:台积电节省数月工期,富士康热仿真提速150倍[39] 市场动态 - 全球近100个AI工厂在建,同比增长一倍,单个工厂平均GPU用量翻倍[31][62] - 主权AI成为新增长点,沙特500兆瓦、阿联酋5吉瓦项目启动,多国建设国家AI平台[49][84] - 开源模型DeepSeek R1和通义千问获认可,展现中国AI研发实力[13][46] - 推理工作负载从简单问答转向复杂代理式AI,计算强度提升100-1000倍[12][53] 供应链与产能 - Blackwell成为史上最快爬坡产品,主要客户每周部署近1,000个NVL72机架[10][28] - 美国本土制造布局加速:台积电亚利桑那厂年底量产,富士康休斯顿建百万平方英尺工厂[47] - 单个GB200 NVLink72机架含120万组件,重近两吨,供应链面临挑战[47] - H20库存减记45亿美元,部分材料被重新利用[26][45]
英伟达Q1业绩会实录:没有美国芯片,中国AI照样一路狂飙
36氪· 2025-05-29 17:48
财报表现 - 第一财季营收440.62亿美元,同比增长69%,净利润187.75亿美元,同比增长26%,摊薄后每股收益0.76美元,同比增长27% [1] - 数据中心业务营收同比大增73%,占总营收88% [1] - 因H20芯片出口限制计提45亿美元库存减值,损失25亿美元潜在销售额,预计第二财季再损失80亿美元 [1] 中国市场影响 - 中国AI芯片市场规模约500亿美元,但已对美国企业关闭 [3] - Hopper架构产品在中国市场不可行,无法满足新出口管制要求 [3] - 出口限制加速中国自主技术发展,削弱美国技术领导地位 [3][4] AI技术发展 - 推理型AI模型需求激增,每项任务所需Token量是传统模型的数百至数千倍 [6] - Grace Blackwell架构推理性能比Hopper提升40倍,进入量产阶段 [11] - AI基础设施进入企业部署阶段,推出RTX Pro Enterprise AI服务器等新产品 [14] 全球战略布局 - 与富士康合作在台湾建设首座AI工厂,推进日本、韩国等多国AI基础设施项目 [9] - 特朗普政府撤销《AI扩散规则》,推动美国AI技术与国际伙伴合作 [8] - 台积电在亚利桑那州建设晶圆厂,目标一年内实现芯片到超级计算机全流程本土制造 [7] 行业趋势 - AI被视为工业革命核心力量,各国竞相建设国家级AI平台 [9] - 6G网络将基于AI构建,制造业未来每家工厂将配备AI工厂 [14] - 开源模型如DeepSeek R1推动AI向"智能体"形态演进,强化技术栈领导地位 [6]
英伟达高管解读Q1财报:未来每个制造业工厂都会有匹配的“AI工厂”
新浪科技· 2025-05-29 08:48
财报业绩 - 2026财年第一财季营收440.62亿美元 同比增长69% [1] - 调整后净利润198.94亿美元 同比增长31% [1] 推理业务发展 - Grace Blackwell NVLink 72超级计算平台是推理AI的理想引擎 设计核心是提升推理性能 [2] - 与Hopper相比 Grace Blackwell的速度和吞吐量提高约40倍 显著降低成本并提升回答质量 [3] - 推理处理的token量比单样本聊天机器人多100到1000倍 机器通过自我思考拆解问题 [2] AI行业前景 - AI将改变每个行业 包括医疗保健 金融服务 零售 交通 制造业等 目前处于起步阶段 [3] - AI需要基础设施和"工厂"生成token 这项技术的应用还处于非常早期阶段 [3] - 6G将基于AI构建 目前处于非常早期阶段 制造业工厂将配套AI工厂 [5] 企业级AI部署 - 企业进行AI本地部署 因大量数据留在本地 访问控制非常重要 [4] - 公司发布RTX PRO企业级AI服务器 DGX Spark和DGX Station等新产品 企业级AI刚起步 [4] - 美国是早期启动者 云端有可用资源 是最大市场和设备安装基地 [4]