Workflow
对话季宇:大模型非必须在GPU跑,CPU内存带宽已足够
英伟达英伟达(US:NVDA) 虎嗅APP·2025-05-18 21:51

核心观点 - 行云集成电路创始人季宇提出通过CPU内存替代GPU显存运行大模型,可将本地部署成本从百万级降至十万级,挑战行业传统认知 [9][10][19] - 公司定位为技术路线验证者,通过DeepSeek一体机等产品推动大模型从超算竞争转向消费电子级普惠应用 [14][18][25] - 自研GPU的核心逻辑是重构芯片架构,保留DDR内存性能同时剔除冗余组件,进一步降低成本 [23][24] 技术路线创新 - 成本突破:采用服务器级CPU(12通道DDR5内存)实现1.2TB/s带宽,超过RTX 4090显卡(1TB/s),单机成本从80万GPU投入降至十万级 [13][19] - 架构设计:计划研发专用计算卡,保留内存通道但去除CPU冗余物理核,最大化性价比 [24] - 软件优化:通过极致调优使内存方案达到超算级体验,打破"GPU必需"的行业惯性 [21] 产品战略 - DeepSeek一体机:定位概念验证产品,采用公版硬件组装(8张H20芯片成本约80万),目标证明低成本路线的可行性 [8][9][14] - 蚁群计划:用300-400万预算搭建"褐蚁"集群,支持500-1000并发,降低创业团队进入门槛 [25] - 商业逻辑:模仿英伟达颠覆英特尔的历史路径,通过新场景定义而非性能追赶实现行业变革 [17][18] 行业洞察 - 趋势判断:大模型需从超算级设备转向消费电子级价格(十万级)才能触发经济循环 [18][25] - 竞争壁垒:行业惯性导致厂商难突破GPU依赖,但内存方案存在软件优化构建的护城河 [20][21] - 生态构建:主动放弃硬件门槛,推动技术普惠化以扩大应用生态 [22]