Workflow
H800 GPU
icon
搜索文档
DeepSeek-R1与Grok-3:AI规模扩展的两条技术路线启示
Counterpoint Research· 2025-04-09 21:01
核心观点 - DeepSeek-R1 和 Grok-3 代表了AI发展的两种不同路径:前者通过算法创新和高效资源利用实现高性能,后者依赖大规模计算资源投入 [2][8] - 行业趋势正从“原始规模主导”转向“战略效率优先”,算法设计、混合专家模型(MoE)和强化学习成为关键杠杆 [8][10] - 未来AI发展将更注重投资回报率(ROI),平衡规模扩展与算法优化 [8][10] 模型性能与资源对比 - DeepSeek-R1 仅使用约2000块NVIDIA H800 GPU即达到全球前沿推理模型性能,展现高效训练能力 [2] - Grok-3 动用约20万块NVIDIA H100 GPU,性能略优于DeepSeek-R1、GPT-o1和Gemini 2,但资源消耗相差百倍 [2][8] - 两者性能相近,但资源投入差异显著,凸显算法创新可抗衡纯计算规模 [8] 发展路径差异 - Grok-3 采用“蛮力策略”,依赖数十亿美元GPU计算规模,边际性能提升显著但ROI递减 [8] - DeepSeek-R1 通过混合专家模型(MoE)、推理强化学习和高质量数据,以最小硬件代价实现顶尖性能 [8] - 行业可能从“规模法则”转向“算法突破+工程实用主义”的全局发展观 [10] 未来AI趋势 - 集中式训练项目(如Grok-3)成本过高,仅限少数巨头参与,中小机构需转向效率优化策略 [10] - 混合专家模型(MoE)、稀疏化、改进微调和强化学习将成为核心,降低资源消耗 [10] - 新数据训练与强基础模型结合(如RAG或定期微调),可避免持续大规模计算负担 [10]
黄金时代即将结束,英伟达股价即将迎来大幅下跌
美股研究社· 2025-03-26 20:45
作 者 | Hunter Wolf Research 编译 | 华尔街大事件 越来越多的证据表明,AI 训练并不一定依赖于高端 GPU,这可能会减缓 英伟达( NASDAQ: NVDA ) 未 来的增长。 英伟达 的数据中心业务经历了强劲增长,这得益于 Hyperscaler 客户对 AI 训练的大量 GPU 需求。 数据中心业务的收入在 2024 财年和 2025 财年分别增长了 216% 和 142%。 | | 2022 | 2023 | 2024 | 2025 | | --- | --- | --- | --- | --- | | Revenue Growth Rate | 61.4% | 0.2% 125.9% 114.2% | | | | Data Center | 58.5% | 41.4% 216.7% 142.4% | | | | Gaming | 60.6% | -27.2% | 15.2% | 9.1% | | Professional Visualization | 100.5% | -26.9% | 0.6% | 22.3% | | Automotive | 5.6% | 59.5% ...