计算机行业周报 20260223-20260227:从国产算力变化到 LPU!DS 新模型前瞻!-20260228

行业投资评级 - 报告对计算机行业评级为“看好” [2] 核心观点 - 报告认为,2026年算力产业的核心关键词是推理,Token消耗总量和技术范式都将围绕推理进行革新,能够提供充足、高性价比推理芯片的厂商将最为受益 [3][4] - 报告重点阐述了推理算力需求的四大趋势,并前瞻了DeepSeek V4模型的预期方向 [3] 根据目录总结 1. Token经济时代,推理算力四大新趋势 - 趋势1:推理算力需求全面加速:春节期间国内头部大模型推理数据大幅增长,例如豆包在除夕当天推理吞吐量达到633亿tokens,辅助用户生成5000万张AI头像及1亿条新春祝福语 [3][5];元宝的月活跃用户已达1.14亿 [6];根据OpenRouter数据,2月9日至15日当周,中国AI模型调用量以4.12万亿Token首次超过美国的2.94万亿Token,随后一周(2月16日至22日)进一步冲高至5.16万亿Token,三周大涨127%,同期美国模型调用量跌至2.7万亿Token,全球调用量前五的模型中中国占据四席 [3][6] - 趋势2:纯推理芯片成为新贵:英伟达以200亿美元收购推理芯片公司Groq,OpenAI与Cerebras达成数十亿美元合作,印证了纯推理芯片的重要性 [3][7][9];未来技术格局将演变为训练使用GPU-HBM组合,推理使用ASIC+LPU-SRAM+SSD组合,专注于推理芯片的厂商将迎来发展机遇 [3][9] - 趋势3:推理系统迎来全方位革新:为适配Agent需求,系统架构可能形成“快反应层”、“慢思考层”、“记忆层”三层网络,其中对多核多线程CPU的需求增加 [3][10][11];在存储层面,通过优化KV缓存层级来缓解带宽瓶颈,例如DeepSeek提出的Dualpath方案,利用Decode节点的闲置带宽来协助Prefill节点读取数据,从而提升系统吞吐量,该方案在测试中使离线推理吞吐量提升1.87倍,在线服务吞吐量平均提升1.96倍 [3][13][30];系统革新同时带动了网卡、交换机需求的提升 [3][13] - 趋势4:国产算力芯片加速突破:华为昇腾950芯片在低精度数据格式支持、向量算力、互联带宽(相比Ascend 910C提升2.5倍至2TB/s)及芯片层级的PD分离(Prefill与Decode场景分离)等方面实现根本性提升,其首款推理芯片Ascend 950PR预计于2026年第一季度推出 [3][17][18];此外,盛合晶微的2.5D封装业务收入快速增长(2025年上半年收入达12.3亿元),侧面印证了国产算力芯片供给能力的持续提升 [3][18][19] 2. 我们在期待怎么样的DeepSeek V4? - 推理和代码能力达到业内领先水准:根据海外科技媒体信息,DeepSeek-V4主打编码能力,内部初步测试结果显示超过Claude和GPT系列,报告认为该预期准确度较高 [22][23] - 长上下文和复杂长任务处理能力(Agent)提升:DeepSeek App近期将上下文处理长度由128K扩展至1M [25];其近期发布的两篇重磅技术论文(Engram和DualPath)为能力突破提供了支持:Engram模块通过存算解耦,将海量KV-Cache移至CPU内存,以较低成本实现参数规模扩大或提升小模型性能 [25][26][29];DualPath方案通过利用Decode节点闲置带宽,有效解决了Agent场景下的存储带宽瓶颈 [29][30] - 国产算力适配:国产算力适配是国产独立模型厂商的重要发展趋势,DeepSeek的Engram和DualPath等技术从工程优化角度提高网络利用率、降低对高性能显存的依赖,为国产化适配提供了高可行性 [22][36] 3. 重点推荐主线 - 报告列出了九大重点投资主线,包括:1) 数字经济领军;2) AIGC应用;3) AIGC算力;4) 数据要素;5) 信创弹性;6) 港股核心;7) 智联汽车;8) 新型工业化;9) 医疗信息化 [3][37][38] - 报告提供了详细的重点公司估值表,涵盖了上述主线中的多家上市公司 [40][41][42]