产品规格与定位 - DGX Spark是一款个人AI超级计算机,将数据中心级的DGX架构浓缩为可置于桌面的设备,其本质是“把云上AI能力拉回桌面”的个人PC[2][4] - 与2016年的DGX-1相比,DGX Spark在AI性能上从170 TFLOPS(FP16)提升至1 PFLOP(FP4),系统功耗从3200W大幅降低至240W,重量从60.8kg减轻至1.2kg,价格从12.9万美元降至3999美元[1] - 产品尺寸为150mm x 150mm x 50.5mm,与Mac mini大小相当,被称为“世界上最小的AI超级计算机”[5] - 在英伟达产品线中,DGX Spark定位为面向轻量级本地推理与微调的便携设备,而其“大哥”DGX Station则定位高端桌面级大模型训练与企业级工作负载,是“个人集群节点级”的重型设备[7][9] 技术架构与性能 - DGX Spark基于全新的NVIDIA GB10 Grace Blackwell超级芯片,该芯片将CPU和GPU直接集成,共享128GB统一内存,使大模型可一次性加载进系统运行,不受显存限制[21] - 独立测评显示,该设备在运行8B至20B参数的中小型模型时,性能大于或等于同价位独立显卡平台,尤其在批处理与框架优化配合下吞吐表现稳定[10] - 对于70B参数以上的大模型,DGX Spark可运行但属于“可用级”而非“生产级”,更适合加载测试与兼容性研究[10] - 设备支持像云服务器一样一键上线模型服务,并能通过Docker启动专为本地大模型推理优化的高性能框架,使模型常驻本地端口等待调用,成为“本地AI节点”[10][11] 行业趋势与影响 - 英伟达发布桌面级AI超算反映了AI由云向本地“反向迁移”的趋势,过去几年“上云”是行业共同信仰,但2025年开始,云成本、隐私风险与网络瓶颈等问题浮出水面[22] - 云服务变得昂贵,推理成为新的成本中心,云GPU按秒计费且带宽与出站流量另算,有公司发现其年度云账单高达300万美元,另一家公司月账单从5000美元一夜飙升至5万美元[23] - 本地设备性能提升,桌面不再只是输入终端而正成为“计算现场”,未来训练主要在数据中心,但推理正外溢到设备与边缘,企业客户自建GPU节点以获得更低成本与更高合规性[24] - AI应用从后台工具转变为实时伙伴,深入语音助手、视频生成、工业控制、AR/VR等对延迟敏感的场景,推动实时推理下放到端侧和边缘节点,形成“云为大脑、本地为手脚、端侧为神经末梢”的分布式系统[25]
老黄亲送马斯克“雷神之锤”!英伟达个人超算今日开售,2 万多元买个“本地 OpenAI”回家?