Workflow
CPU
icon
搜索文档
AIAgent沙箱化有望带来CPU新增量空间:看好 CPU 及相关产业链
财通证券· 2026-01-26 13:45
报告行业投资评级 - 行业投资评级为“看好”,且评级为“维持”[2] 报告核心观点 - 核心观点认为,随着AI Agent的持续发展,其沙箱技术有望逐渐配套使用,而AI Agent的持续沙箱化将为CPU厂商及相关产业链带来新的增长点[6] - AI Agent沙箱化部署正逐步落地:海外方面,Meta于2025年12月以超过20亿美元收购了以AI Agent与沙箱化架构为核心的创新公司Manus,有望加速该技术的推广和应用;国内方面,阿里云等主流云平台已发布和迭代以AI Agent Sandbox为核心的AI Agent Infra产品体系[6] - 沙箱隔离技术用于控制AI Agent的潜在风险,其底层基石之一是基于KVM的微虚拟机技术,而KVM是Linux内核的模块,需要CPU的支持,这将带来CPU增量需求空间[6] 根据相关目录分别进行总结 行业动态与趋势 - 海内外正逐渐部署AI Agent沙箱化,相关收购与产品发布将加速技术落地[6] - AI Agent的行动模块通过函数调用实现工具使用,但当前系统无条件信任LLM输出存在安全风险,沙箱技术被广泛用于控制执行不可信代码或访问外部工具带来的风险[6] 投资建议与关注方向 - 报告建议关注海外CPU厂商,如AMD和Intel[6] - 报告建议关注国内CPU替代链,包括海光信息和龙芯中科[6] - 报告建议关注AMD相关供应链,包括通富微电、奥士康、世运电路[6] - 报告建议关注Intel相关供应链,包括澜起科技、世运电路、兴森科技[6] 重点公司数据 - 海光信息总市值为6415.18亿元,2024年收盘价为276.00元,2024年EPS为0.83元,2025年预测EPS为1.33元,2026年预测EPS为1.98元,对应2024年PE为332.53倍,2025年预测PE为207.52倍,2026年预测PE为139.39倍[5] - 龙芯中科总市值为773.93亿元,2024年收盘价为193.00元,2024年EPS为-1.56元,2025年预测EPS为-0.88元,2026年预测EPS为-0.03元[5] - 通富微电总市值为855.02亿元,2024年收盘价为56.34元,2024年EPS为0.45元,2025年预测EPS为0.77元,2026年预测EPS为1.00元,对应2024年PE为125.20倍,2025年预测PE为73.17倍,2026年预测PE为56.34倍[5]
计算机行业周报20260124:Token需求“通胀”:从CPU到云服务-20260124
国联民生证券· 2026-01-24 20:44
报告行业投资评级 - 行业评级为“推荐” [4] 报告核心观点 - 伴随AI驱动的Tokens需求快速提升,涨价趋势正从上游存储、CPU逐步传导至云服务,全球云计算龙头AWS率先提价打破了行业二十年来价格只降不升的惯例,云计算及配套服务厂商有望迎来估值重构 [11][14] - AI Agent大趋势下,CPU的重要性显著提升,其需求与供给之间的矛盾或将延续,CPU可能比GPU更早成为系统瓶颈 [16][25] - 数据库作为云计算产业链景气度提升的重要受益方向,将受益于Agent需求拉动的沙盒数量增长,AI原生数据库是未来技术演进的必然方向 [26][28] 根据相关目录分别总结 1 AWS涨价开启云计算全球涨价趋势 - **云计算成为Tokens需求通胀的下一个方向**:AI需求提升导致产业链出现依次涨价,2025年上半年存储率先涨价,2026年1月CPU(Intel/AMD计划上调价格10-15%)和云计算(AWS将其EC2机器学习容量块价格上调约15%)相继开启涨价趋势 [14] - **云计算涨价有望带动系列配套产品价值重估**:云服务器ECS包括的计算、存储、网络、快照服务等计费项及相关配套都有望受益于涨价趋势 [14] 1.2 CPU:AI Agent大趋势下,具有长期发展前景 - **CPU供需矛盾或将延续,龙头出现短缺**:以英特尔为例,其Intel 10和Intel 7的产能限制限制了满足需求的能力,预计短缺将在2026年第一季度达到顶峰,且公司不打算扩大这些节点的产能 [16] - **DeepSeek的算力工程化优化提升CPU重要性**:DeepSeek在论文中演示将高达1000亿参数的Engram嵌入表完全存储在CPU DRAM中,实验显示这种“存算分离”方案带来的额外推理延迟不到3%,使得模型参数规模不再严格受限于GPU显存 [17] - **CPU效能需求长期提升**:使用英特尔® AMX加速Engram模块中的计算,整体性能可提升至使用AVX-512的1.67倍 [20] - **AI Agent时代CPU需求有望大幅增长,并可能早于GPU成为瓶颈**:研究指出,CPU上的工具处理会显著影响智能代理工作负载的执行延迟(占比最高达90.6%),在大批量处理场景下CPU动态能耗占比可达44%,在进行Agent强化学习时,CPU的效能直接影响GPU利用率及训练收敛速度 [24][25] 1.3 数据库:云计算产业链景气度提升的又一重要受益方向 - **Agent需求拉动数据库计费节点(PCU)数量增长**:据阿里云官网,数据库计算节点按PCU收费,若Cowork类沙盒Agent加速渗透,将带动PCU数量快速增长,为数据库带来显著收入弹性 [26] - **AI原生数据库是未来大势所趋**:阿里云资深副总裁李飞飞表示,从云原生到AI就绪,再到AI原生是技术演进的必然方向,截至2026年1月,阿里云PolarDB已拥有超2万用户,部署规模超300万核,覆盖全球86个可用区 [28][29] 1.4 投资建议 - 报告建议关注三大方向: 1. **云计算**:阿里巴巴、金山云、优刻得、深信服、宏景科技、首都在线、顺网科技、网宿科技、青云科技等 [11][30] 2. **CPU**:海光信息、中国长城、龙芯中科、禾盛新材等 [11][30] 3. **数据库**:星环科技、达梦数据、海量数据、太极股份、超图软件、拓尔思等 [11][30] 2 行业新闻 - **百度发布文心大模型5.0**:参数规模达2.4万亿,采用原生全模态统一建模技术,在权威评测中其能力已超越Gemini-2.5-Pro、GPT-5-High等模型 [32] - **广东省出台AI赋能交通运输政策**:探索无人化技术在邮政快递全场景的创新应用,并推动无人车、无人机与智能快件箱协同配送,广州、深圳等四市为首批试点 [33] - **阿里云PolarDB发布新AI功能**:发布AI数据湖库、模型算子化等新能力,降低构建AI应用复杂度 [34] - **OpenAI 2025年ARR突破200亿美元**:算力规模从2023年的0.2GW增长至2025年的1.9GW(增长9.5倍),收入从20亿美元增至超200亿美元(增长10倍),并计划在ChatGPT免费版引入广告,目标2026年实现10亿美元广告收入 [35] 3 公司新闻 - **汉邦高科**:披露重大资产重组进展,拟发行股份购买安徽驿路微行科技有限公司51%股权,相关审计、评估工作已完成 [2] - **久其软件**:披露2025年业绩预告,预计归属上市公司股东净利润为4000万元-5000万元,实现扭亏为盈,增长原因包括强化AI技术赋能、拓展地方市场等 [38] - **科远智慧**:披露2025年度业绩预告,预计归属上市公司股东净利润为1.3亿元-1.7亿元,但同比下降,主要因计提资产减值准备预计影响归母净利润2.2亿元 [38] - **太极股份**:披露独立董事已取得深交所认可的独立董事培训证明 [37] - **中新赛克**:披露控股股东一致行动人于2026年1月19日至22日期间累计减持公司股份951,600股,占总股本0.5573% [37] - **卫宁健康**:披露拟注销回购股份14,256,400股 [36] 4 本周市场回顾 - **指数表现**:本周(01.19-01.23)沪深300指数下跌0.62%,中小板指数上涨0.87%,创业板指数下跌0.34%,计算机(中信)板块下跌0.46% [1][39] - **个股涨幅前五**:海联讯(28.76%)、金现代(20.67%)、卓易信息(20.25%)、久其软件(15.75%)、优刻得(13.62%) [1][45] - **个股跌幅前五**:石基信息(-11.92%)、*ST汇科(-10.09%)、淳中科技(-8.74%)、科大讯飞(-7.77%)、格尔软件(-5.99%) [1][45]
Agent到底对CPU带来怎样的需求
2026-01-23 23:35
行业与公司 * 行业:人工智能(AI)与计算硬件行业,特别是AI Agent、大模型推理、AI服务器和通用计算服务器领域 [1][2][4][21] * 公司:提及的技术与架构供应商包括英特尔、AMD、ARM、英伟达 [22][23] 核心观点与论据:AI Agent发展对CPU需求的影响 * **Agent数量增加直接推高CPU需求**:每个Agent执行任务时都需要复杂的数据处理和逻辑调度,多Agent系统的任务分配、通信协调和工具调用冲突处理也需要大量计算资源 [1][4] * **CPU用量增长介于线性与指数之间**:增长幅度取决于复杂长程任务的占比,未来几年用量可能接近2倍、4倍的增长,但不会完全达到指数级 [2][12] * **任务特性是影响CPU负载的核心变量**:长时任务(如2-4小时)对CPU负载影响大,而短时频繁任务影响较小 [1][6] 大模型的记忆能力是关键,记忆能力增强(如从1-2小时延长至1-2天)会提升长程任务占比,从而增加CPU需求 [6][7] * **AG类任务对CPU负载非常重**:用户输入约1,000个token,输出1,000-5,000个token,但中间计算过程可能消耗20万至50万个token,导致任务消耗比以往多10倍以上,甚至增长50至100倍 [11] 让AG承担更多实际工作的关键是连续工作的记忆能力,中断会导致效率下降 [11] * **虚拟机技术变化增加CPU需求**:现代AI集群中的虚拟机更注重硬件资源绑定,要求快速启停(1秒内启动)并具备常驻状态或标记点,这使得虚拟机与特定数量的物理核强绑定,增加了对高性能、高数量CPU的需求 [1][5] 核心观点与论据:CPU在AI计算中的角色与优化 * **CPU在大模型推理中起辅助作用**:在预填充阶段,CPU负责处理用户输入文本(规范化、分词等),将其转换为GPU可接受的格式 [2] CPU擅长处理数据搬运、多模态数据协调、集群硬件调度等逻辑密集型任务 [2] * **CPU在Agent推理中作用更为重要**:Agent实现从决策到执行的闭环需要复杂的逻辑引擎来调用工具、拆分需求、任务规划等,这些主要由CPU完成 [2] 例如分析公司股票,需要获取财报、计算指标并生成报告 [2] * **新技术(如Deepseek、Anagram)优化计算,部分工作负载向CPU转移**:这些技术引入类似字典的机制,利用CPU完成部分计算,减少GPU负担,优化了prefill阶段的输入文本处理,提升了查询效率和模型记忆能力 [1][10] * **CPU可用于小语言模型的推理和训练**:原理是将大模型量化到较低比特级别(如INT8或INT4),并将GPU算子转换为适用于CPU运行,但受限于并行能力,通常适用于端侧或边缘侧的小型设备,支持几个B或几十个B的小模型 [18] * **CPU对GPU的高性价比替代目前不现实**:在AI服务器中GPU不可或缺,普通CPU服务器无法替代GPU,在云计算等高复杂度场景仍需依赖GPU [12] 当前趋势是通过补齐AI服务器中的短板来提升性能,而非直接替代 [12] 核心观点与论据:硬件架构与性能考量 * **单个CPU核心支撑的Agent数量有限**:对于观看视频等轻量任务,一个核心可支撑2到5个Agent;对于编代码等稍复杂任务,一个核心可能只能支撑1到2个Agent [9] 随着Agent工作时间变长,每个核心能支撑的Agent数量减少 [9] * **当前瓶颈在于缓存容量,而非核心数量与频率**:L1、L2、L3缓存容量受限,需要通过更新解决,更重要的是增加CPU整体数量,并同步提升IO接口等硬件性能 [13] * **X86架构在软件生态兼容性上目前占优**:在创建虚拟机、调用底层编译器、控制浏览器内容通信等与Agent相关的应用中,X86表现更佳 [14] ARM架构在特定消费终端或移动设备生态中有其优势 [14] * **内存与存储管理增加CPU需求**:DRAM和SSD的冷热数据存储涉及数据通信,大模型需要适应不同存储逻辑和处理基于注意力机制的数据存储,这需要大量CPU计算资源 [2][15] 随着存储设备增加,大量数据的填充、截断、分散到不同设备,以及GPU服务器与其他系统间的数据传输,都需要CPU进行逻辑密集型处理 [17] * **数据向量化操作增加CPU需求**:将数据塞入GPU前需要通过向量化操作优化效率,这些操作通常由CPU完成,拉动对CPU数量和性能的需求 [16] 其他重要内容:市场、优化挑战与服务器趋势 * **高并发场景对CPU优化构成挑战**:即使单个简单任务占用资源极少,但若集中在短时段内(如午间外卖高峰),高并发性导致整体压力大,优化空间有限 [19] 用户规模增长时,CPU性能优化存在上限,优化可能提升60%效能,但在用户集中高峰期,提升比例可能降至40%左右 [20] * **通用计算服务器与AI服务器存在设计区别**:通用计算服务器主要挂载更多存储,而AI服务器因显卡占据空间,存储相对较少 [21] * **CPU供应稳定,主流厂商优势明显**:尽管市场有多个供应商,但在选择通用计算服务器时,稳定性和生态系统是关键,英特尔和AMD凭借成熟技术和生态占据市场主导地位 [22] 通用计算服务器已非常成熟,未来发展趋势仍将注重稳定性、性能及与现有生态的兼容性 [23]
英特尔电话会:CPU需求激增却有单无货!CEO坦言库存耗尽且良率未达标,“我很失望无法满足需求”
华尔街见闻· 2026-01-23 09:29
核心观点 - 英特尔2025年第四季度业绩超出预期,但2026年第一季度指引疲软,主要因制造良率问题和库存耗尽导致供应严重短缺,引发盘后股价暴跌超10% [3][4] - 管理层承认当前运营处于“手停口停”的极限供应状态,但强调长期转型仍在轨道上,并重申重建英特尔是一个耗时多年的过程 [3][7] - 公司认为市场低估了CPU在AI时代的核心价值,AI工作负载的多样化正强化CPU作为“核心指挥官”的角色,并推动传统服务器的强劲更新周期 [5][9] 财务业绩与指引 - **2025年第四季度业绩**:营收137亿美元,位于指引区间高端;非GAAP每股收益0.15美元,远超预期的0.08美元;非GAAP毛利率为37.9% [4][29] - **2026年第一季度指引**:预计营收在117亿至127亿美元之间,中值122亿美元被定义为“处于季节性范围的低端”;预计非GAAP毛利率将下滑至34.5%,每股收益仅能维持盈亏平衡 [4][35] - **2025年全年业绩**:营收529亿美元,同比略有下降;非GAAP每股收益0.42美元,同比增加0.55美元;运营现金流97亿美元,总资本支出177亿美元 [30] - **资本开支策略**:2026年资本开支预计持平或微降,支出结构从厂房建设大幅转向生产工具,以解决迫在眉睫的产能短缺 [5][13][42] 供应短缺与制造挑战 - **库存耗尽**:公司在2025年下半年消耗了大量缓冲库存来支持需求,导致进入2026年时“缓冲库存已经耗尽” [3][7] - **供应最紧张季度**:晶圆生产向服务器产品的产能倾斜始于第三季度,但这部分产能直到第一季度末才能产出,导致第一季度成为供应最紧张的季度 [5][7] - **制造良率问题**:首席执行官陈立武坦言,虽然良率符合内部计划且每月有7%-8%的提升,但“仍低于我想要的水平”,尚未达到行业领先标准 [3][7][45] - **产能分配**:在产能有限的情况下,公司优先将内部晶圆供应分配给高利润的数据中心业务,导致客户端业务收入降幅将更为明显 [10][35] 各业务部门表现与前景 - **数据中心与AI业务**:第四季度营收达到47亿美元,环比大增15%,创下该部门十年来最快的环比增速;但因供应不足错失了“显著更高”的收入 [5][10][32] - **客户端计算业务**:第四季度营收为82亿美元,环比下降4%,尽管AI PC的出货量增长了16% [10][31] - **定制ASIC业务**:成为一大亮点,第四季度年化收入运行率已超过10亿美元,2025年全年增长超过50%,环比增长26% [5][11][33] - **代工业务**:基于最先进18A制程的Core Ultra Series 3已经上市;更先进的14A制程需等待外部客户在2026年下半年至2027年上半年做出坚定的供应商决定,之后才会部署产能资本支出 [3][5][12][44] 战略重点与市场观点 - **CPU在AI时代的角色**:管理层强调,AI工作负载的激增和多样化带来了巨大的产能限制,这反而强化了CPU作为混合AI架构核心、进行推理编排和控制的关键作用 [9][20][22] - **产品路线图**:公司简化了服务器路线图,将资源集中在16通道的Diamond Rapids上,并加速引入将重新引入超线程技术的Rapids产品 [23][60][92] - **代工业务成功定义**:建立世界级代工厂是长期目标,成功的早期指标包括先进封装收入(可能远超10亿美元)以及获得外部客户的产能承诺 [53][54] - **市场需求驱动**:对传统服务器的需求非常强劲,主要驱动力是围绕旧网络升级以与AI系统对话的周期,这被视为一个x86现象 [80][82]
苏姿丰:誓夺AI芯片市场“两位数”份额,预计到2030年AMD营收年增或超35%、利润增超两倍
华尔街见闻· 2025-11-12 18:12
公司财务目标与增长指引 - AMD公布未来三到五年财务目标,预计数据中心芯片年收入在五年内达到1000亿美元,到2030年利润增长两倍以上[1] - 公司预计未来三到五年年均营收复合增长率将超过35%,其中AI数据中心营收将平均增长80%,每股收益届时将增至20美元[1] - 公司财务官预计整体业务年均增长率达35%,数据中心业务年均增长60%,AI数据中心业务年均增长率高达80%,有望在2027年达到数百亿美元销售额[12] - 公司预计未来几年毛利率将在55%至58%之间,优于分析师预期[15] AI数据中心市场前景与竞争格局 - AMD预计到2030年AI数据中心总市场规模将突破1万亿美元,远超今年的约2000亿美元,复合年增长率超过40%[3] - 公司目标是在数据中心AI芯片市场中占据"两位数"份额,目前英伟达在该领域市场份额超过90%[9] - 支撑公司雄心的是"永不满足的"AI芯片需求,以及大型科技公司寻求英伟达替代品的强烈意愿[9] - AI基础设施需求增长不会变平稳而是持续旺盛,客户AI投资并未"趋于稳定",AI计算基础设施需求得不到满足[9] 产品战略与客户合作 - AMD计划推出下一代MI400系列AI芯片于2026年推出,并将提供多个版本以适应不同应用场景[17] - 公司计划推出完整的"机架级"系统,能将72颗芯片协同工作,对标英伟达类似产品[17] - 公司正通过并购加速其软件生态建设,将继续进行AI软件领域的补强型收购[17] - 公司强调了与OpenAI、甲骨文和Meta的长期合作协议,这些合作被视为市场对AMD产品的重要信任票[10] 近期业绩与市场反应 - 公司三季度营收同比增长36%至92.46亿美元,数据中心业务收入同比增长22%至43亿美元,均高于预期[19] - 公司预计四季度营收约为93亿-99亿美元,指引区间中值为96亿美元,高于分析师预期均值92亿美元[19] - 尽管有积极长期展望,AMD股价在金融分析师日活动当天收跌2.65%,在周一反弹超4%后回落[6] - 超过20%的销售增长指引遭投资者冷淡回应,因大部分增长来自个人电脑和服务器处理器,而非最受关注的AI加速器业务[20]
光博会见闻反馈
2025-09-15 09:49
行业与公司 * 光模块行业[2][5] * 国内二梯队光模块厂商如索尔思、剑桥、联特科技[2][6] * 国产光芯片厂商如源杰、长光华芯[2][7][8] * 光纤厂商如长飞光纤、亨通光电、烽火通信、长盈通[18] * 中兴、华为、木兮等超节点解决方案提供商[14][15][16] * 旭创、力讯等光模块厂商[3][13] 核心观点与论据 **光模块行业高增长与需求饱和** * 行业保持高增长 2025下半年至2026年需求非常饱和[2][5] * 1.6T方案涌现 主要受益于英伟达C8X网卡批量导入 可能由CX9网卡开启3.2T需求[2][5] * 迭代周期缩短 从过去4-5年缩短至两年左右 利好头部厂商[2][5] **国内厂商北美市场导入机会** * 二梯队厂商抓住AI光模块高景气度窗口期 积极导入北美市场[2][6] * 北美市场利润高但导入机会稀缺 800G/1.6T需求增长带来机会[2][6] **国产光芯片技术进展** * 源杰50毫瓦、70毫瓦及100毫瓦CW激光器被头部厂商导入[7] * 长光华芯100G EML进展顺利 发布200毫瓦CW光芯片[7][8] * 索尔思展示200G EML技术 缩小与国际厂商差距[8] **新型技术方案** * CPC加可插拔光模块方案由旭创提出 通过铜缆实现短距离高性能传输[3][13] * 获博通、Marvell等海外厂商采用 成为短期内重要竞争者[2][13] * OCS技术关注度高 能显著降低AI训练集群时延[3][12] * 空心光纤技术受关注 降低时延且使数据中心选址自由度提高2.25倍[3][19] **国内超节点发展** * 2025年国内超节点发展迅速 运营商、华为、木兮、中兴等推出解决方案[14] * 中兴展示凌云51.2T SKYUP交换芯片 交换容量达51.2T[15][16] * 天翼SkyOut交换芯片交换容量12.8T 与TH4、TH3性能相当[15] **光纤技术突破** * 长飞光纤展示100公里级别空心光纤链路 衰减值达0.089dB每公里[4][18] * 空心光纤最低损耗达0.05dB每公里 较传统光纤降低30%[19] * 亨通光电突破空心光纤成缆技术 具备全流程能力[18] **价格与供需趋势** * 2026年光模块价格下降幅度预计小于往年[4][20] * 核心物料EMA和CW光源短缺 劳动力紧缺导致价格坚挺[4][20] * 北美推理和应用端需求爆发推动行业发展[4][20] 其他重要内容 **液冷技术发展** * 2025年4月数据中心展上多家企业展示液冷产品 产业准备迎接NV机会[3] **国产算力发展趋势** * 自研GPU和自研交换芯片将成为主流 国产替代尤为重要[16] * 中兴凌云51.2T性能领先NB switch和华为UB Switch 但天翼SkyOut与TH5仍有差距[16][17] **技术路线竞争** * NPU可能比CPU更早落地 对交换机内部产生明显增量需求[9][11] * 阿里巴巴明确表示看好NPU[11] * CPU影响偏长期 商业化进程缓慢[10] **行业格局变化驱动因素** * 空心光纤、OCS、CPC等新技术可能对国内企业业绩产生明显拉动作用[21]
芯江湖•浙大派:一支"严门"子弟的CPU风云录
半导体芯闻· 2025-07-24 18:21
RISC-V行业格局 - 全球三大RISC-V峰会之一在上海张江举办 显示中国在该领域的重要地位 [3] - 行业领袖Jim Keller预测未来五年RISC-V发展速度将超过过去十年 [5] - RISC-V生态已形成完整产业链 包括IP核设计、芯片研发和应用落地等多个环节 [47][53] 中天微发展历程 - 2001年由严晓浪教授创立 定位"中华芯 天下行" 专注嵌入式CPU研发 [14][15] - 2003年整合浙江大学双院资源 突破产教壁垒 开发C-Core系列产品 [17][19] - 2015年引入阿里巴巴战略投资 2018年被阿里全资收购成为平头哥前身 [32] 平头哥技术突破 - 基于中天微技术积累 推出玄铁系列处理器 累计出货达30亿颗 [34] - 由Intel资深专家戚肖宁领导 实现从嵌入式向高性能计算领域拓展 [26][32] - 完成安卓系统适配 推动RISC-V在移动计算领域应用 [41] 新兴企业动态 - 知合计算聚焦RISC-V架构AI智算CPU 推出"通推一体"创新方案 [43] - 芯来科技突破车规ASIL-D认证 客户覆盖300余家厂商 [50][53] - 进迭时空K1芯片量产10万颗 创RISC-V高算力芯片最快量产记录 [55] 人才与技术传承 - 浙江大学严晓浪教授培养大批芯片人才 形成"严门"产业生态 [58] - 技术传承路径清晰 从中天微到平头哥再到多家创业公司 [40][55] - 产学研结合紧密 学术成果快速转化为商业产品 [19][41]
对话季宇:大模型非必须在GPU跑,CPU内存带宽已足够
虎嗅APP· 2025-05-18 21:51
核心观点 - 行云集成电路创始人季宇提出通过CPU内存替代GPU显存运行大模型,可将本地部署成本从百万级降至十万级,挑战行业传统认知 [9][10][19] - 公司定位为技术路线验证者,通过DeepSeek一体机等产品推动大模型从超算竞争转向消费电子级普惠应用 [14][18][25] - 自研GPU的核心逻辑是重构芯片架构,保留DDR内存性能同时剔除冗余组件,进一步降低成本 [23][24] 技术路线创新 - **成本突破**:采用服务器级CPU(12通道DDR5内存)实现1.2TB/s带宽,超过RTX 4090显卡(1TB/s),单机成本从80万GPU投入降至十万级 [13][19] - **架构设计**:计划研发专用计算卡,保留内存通道但去除CPU冗余物理核,最大化性价比 [24] - **软件优化**:通过极致调优使内存方案达到超算级体验,打破"GPU必需"的行业惯性 [21] 产品战略 - **DeepSeek一体机**:定位概念验证产品,采用公版硬件组装(8张H20芯片成本约80万),目标证明低成本路线的可行性 [8][9][14] - **蚁群计划**:用300-400万预算搭建"褐蚁"集群,支持500-1000并发,降低创业团队进入门槛 [25] - **商业逻辑**:模仿英伟达颠覆英特尔的历史路径,通过新场景定义而非性能追赶实现行业变革 [17][18] 行业洞察 - **趋势判断**:大模型需从超算级设备转向消费电子级价格(十万级)才能触发经济循环 [18][25] - **竞争壁垒**:行业惯性导致厂商难突破GPU依赖,但内存方案存在软件优化构建的护城河 [20][21] - **生态构建**:主动放弃硬件门槛,推动技术普惠化以扩大应用生态 [22]