体验英伟达 AI 个人超算「核弹」DGX Spark,能微调出 DeepSeek R2 吗
英伟达英伟达(US:NVDA) 36氪·2025-12-31 12:27

产品概述 - 英伟达DGX Spark是一款被黄仁勋推荐的“个人超算”,其核心特点是“小而美”,尺寸小巧,设计具有硬核美感[1][3] - 产品尺寸为5.051515厘米,重量为1.2公斤,体积与Mac Mini相近,远小于Mac Studio[3][5] - 该设备搭载了GB10 Grace Blackwell超算芯片,其算力效果可媲美RTX 5070/5070 Ti,并配备了128GB的GPU+CPU融合内存以及273 GB/s的LPDDR5X内存带宽[6] - 产品预装了Ubuntu Linux操作系统,在京东等电商平台售价约为32000元人民币[9] 性能与能力 - 该设备能本地运行最高2000亿参数的大模型,支持对大模型进行微调、推理测试以及搭建各种AI工具,实现离线生图等功能[17] - 在实际测试中,设备成功部署并运行了65GB的gpt-oss 120b模型,但在尝试运行142GB的Qwen 3:235b(2350亿参数)模型时进程被强制结束,表明其能力存在上限[20] - 在生成视频方面,使用腾讯混元1.5模型生成一段10秒、240帧的视频时,GPU利用率达到96%,内存使用接近90GB,几乎榨干了128GB内存[22] - 在图像生成方面,设备支持Qwen、FLUX、Z-Image等多种模型,生成速度表现尚可[22] 目标用户与核心价值 - 该产品并非通用电脑,其定位是面向AI研究员、开发者以及极客玩家,提供完整的全栈AI开发环境,用于快速复现前沿论文和验证想法[17][42] - 对于计算机相关专业的学生或研究员,该设备能帮助其快速运行各种深度学习项目,复现计算机视觉或自然语言处理领域的工作[42][44] - 产品的一大核心价值在于其提供了丰富的全栈软件工具,涵盖了英伟达工具、框架、库和预训练模型,解决了AI开发中复杂的环境配置和版本依赖问题[37] - 该设备也吸引了部分极客爱好者,可将其作为家庭服务器,通过本地网络供其他设备调用其算力进行文本、图片或视频生成,但其生成速度体验可能不及商业模型[51][52] 应用场景与局限性 - 设备支持通过开源框架(如LLaMa Factory)对大模型进行微调,例如使用LoRA技术对Llama 3模型进行微调,修改其自我认知,整个过程耗时约1小时[29][31][32] - 产品不适用于与深度学习无关的通用任务,如视频剪辑或玩游戏[17] - 由于采用Linux操作系统和ARM64架构,在软件安装和使用上存在门槛,例如无法直接安装仅支持amd64架构的Chrome浏览器,需要用户具备一定的专业知识[40][41][42] - 对于需要上架App Store的移动应用开发者而言,主流开发工具(如Xcode)在macOS上,因此该设备并非首选[47]