Workflow
Mac Mini M4 Pro
icon
搜索文档
黄仁勋送马斯克的3万块个人超算,要借Mac Studio才能流畅运行?首批真实体验来了
搜狐财经· 2025-11-22 15:19
产品定位与目标用户 - 产品为NVIDIA DGX Spark,定位为个人AI超级计算机,目标用户是科研人员、数据科学家和学生等群体,旨在提供高性能桌面级AI计算能力以支持AI模型开发和创新[8] - 售价为3万元人民币,被称作“全球最小超算”,具备2000亿参数处理能力和128GB内存[1][5] 核心性能表现 - 设备AI核心能力定位在RTX 5070和RTX 5070 Ti之间,能处理1200亿参数的大模型,总体性能优于Mac Mini M4 Pro(10999元版本)[11][15][21] - 在Prefill(预填充)阶段表现出色,批量大小为1时Prefill TPS达7,991,但Decode(解码)阶段性能受限,同条件下Decode TPS仅20.52,显示出算力强但数据传输慢的特点[11][23][24] - 最大短板为内存带宽仅273 GB/s(使用LPDDR5X内存),而对比产品如RTX 5090带宽达1800 GB/s,这导致Decode阶段性能成为瓶颈[13][31] 应用场景与玩法 - 官方提供超过20种开箱即用玩法,包括生成视频、搭建多智能体助手等AI全家桶功能[13][47] - 实际应用案例包括本地AI视频生成(使用ComfyUI框架和阿里Wan 2.2 14B模型)、并行运行多个LLMs和VLMs实现智能体交互等[37][45][47] - 典型用户玩法包括本地运行大模型确保数据安全、不受限制生成图片视频、打造私人助理等[8][9] 性能优化方案 - 有团队采用PD分离方案,将Decode阶段交给带宽更高的Mac Studio M3 Ultra(带宽819 GB/s),使整体推理速度提升2.8倍,但成本增至近10万元[32][33][34] - 通过流水线式分层计算与传输实现计算和传输时间重叠,优化了DGX Spark带宽限制问题[33] 生态与兼容性 - 设备获得LM Studio等桌面工具支持,社区有Reddit用户开展AMA活动分享测试结果[44][53] - 兼容性方面,有用户尝试运行nanochat项目但面临兼容性问题和长时间训练挑战(对比8xH100芯片训练需4小时,RTX 4090需约100小时)[56][57][58]