DeepSeek一体机“褐蚁”

搜索文档
对话季宇:大模型非必须在GPU跑,CPU内存带宽已足够
虎嗅APP· 2025-05-18 21:51
核心观点 - 行云集成电路创始人季宇提出通过CPU内存替代GPU显存运行大模型,可将本地部署成本从百万级降至十万级,挑战行业传统认知 [9][10][19] - 公司定位为技术路线验证者,通过DeepSeek一体机等产品推动大模型从超算竞争转向消费电子级普惠应用 [14][18][25] - 自研GPU的核心逻辑是重构芯片架构,保留DDR内存性能同时剔除冗余组件,进一步降低成本 [23][24] 技术路线创新 - **成本突破**:采用服务器级CPU(12通道DDR5内存)实现1.2TB/s带宽,超过RTX 4090显卡(1TB/s),单机成本从80万GPU投入降至十万级 [13][19] - **架构设计**:计划研发专用计算卡,保留内存通道但去除CPU冗余物理核,最大化性价比 [24] - **软件优化**:通过极致调优使内存方案达到超算级体验,打破"GPU必需"的行业惯性 [21] 产品战略 - **DeepSeek一体机**:定位概念验证产品,采用公版硬件组装(8张H20芯片成本约80万),目标证明低成本路线的可行性 [8][9][14] - **蚁群计划**:用300-400万预算搭建"褐蚁"集群,支持500-1000并发,降低创业团队进入门槛 [25] - **商业逻辑**:模仿英伟达颠覆英特尔的历史路径,通过新场景定义而非性能追赶实现行业变革 [17][18] 行业洞察 - **趋势判断**:大模型需从超算级设备转向消费电子级价格(十万级)才能触发经济循环 [18][25] - **竞争壁垒**:行业惯性导致厂商难突破GPU依赖,但内存方案存在软件优化构建的护城河 [20][21] - **生态构建**:主动放弃硬件门槛,推动技术普惠化以扩大应用生态 [22]
对话季宇:大模型非必须在GPU跑,CPU内存带宽已足够
虎嗅· 2025-05-18 14:54
公司背景 - 创始人季宇为前华为"天才少年"、昇腾编译器专家、清华大学计算机科学博士、CCF优秀博士学位论文获得者[1] - 两年前从华为离职后创办行云集成电路,专注于自研GPU[1] - 公司近期发布DeepSeek一体机"褐蚁",定位为本地部署大模型的集成化计算设备[4][5] 产品技术 - DeepSeek一体机采用"英特尔/国产CPU+英伟达GPU+系统盘/内存盘"组合,单机报价达百万级[4][5] - 公司提出通过CPU内存替代GPU显存的技术路线,可将大模型本地部署成本从百万级降至十万级[6][8] - 最新服务器级CPU内存带宽达1.2TB/s,超过RTX 4090的1TB/s水平[10] - 计划重新设计芯片,保留高性能计算卡特性但去除冗余物理核,专注提升DDR内存性能[11][22] 行业观点 - 认为计算机行业存在"新旧交替"规律,英伟达取代英特尔的历史可能重演[15] - 指出当前行业惯性导致多数厂商仍坚持GPU路线,忽视CPU内存潜力[19] - 提出应将大模型从超算竞争转向消费电子竞争,降低使用门槛[16][17] - 通过"蚁群"项目展示集群方案:300-400万预算可实现500-1000并发,支持10万DAU[23] 商业模式 - 将DeepSeek一体机定位为PoC(概念验证)产品,旨在证明技术路线可行性[12] - 未来计划通过自研芯片为客户提供更低成本方案[12][21] - 强调应用普惠理念,主张采用通用硬件降低行业进入门槛[20] - 认为价格降至一定水平后,行业将迎来爆发式增长[23]