报告行业投资评级 - 计算机行业投资评级为领先大市 - A(维持)[1] 报告的核心观点 - UltraMem架构解决主流MoE架构推理高额访存问题,推理速度提升2 - 6倍,成本最高降83%,将加速AI应用落地并推动向端侧渗透,刺激推理算力需求 [2][5][6] 根据相关目录分别进行总结 首选股票 - 金山办公(688111.SH)评级为买入 - A;海光信息(688041.SH)评级为买入 - A [2] UltraMem架构优势 - UltraMem在PKM架构基础上对模型结构、value检索方式、稀疏参数优化,保证性能同时提升推理效率 [4] - 优化模型结构,将PKM单个内存层拆分成多个均匀嵌入Transformer层,可并行执行访存和计算操作 [4] - 优化value检索方式,推理时用TDQKR乘法方法选value,精准检索与输入相关内容 [4] - 隐式扩展稀疏参数,引入数倍于物理内存的虚拟内存,提升性能且不提高部署复杂度 [4] 推理成本下降影响 - 截至2024年底,以GPT - 3质量输出为标准,模型推理价格降1200倍;2025年DeepSeek模型使用成本不到o1模型1/25,UltraMem架构使主流稀疏模型推理成本大幅下降 [5] - 模型调用价格是用户选择模型运行应用重要考量因素,厂商竞相降成本将带动AI应用加速落地,促进应用从云端向端侧拓展 [5] 投资建议 - 关注AI应用相关标的,如企业服务领域金蝶国际等,办公领域金山办公等,多模态领域万兴科技等,金融领域新致软件等,教育领域科大讯飞等,医疗领域润达医疗等,其他领域彩讯股份等 [6] - 关注国产算力芯片厂商,如海光信息、寒武纪等 [6] - 关注AI服务器厂商,如四川长虹、神州数码等 [7] - 关注算力云厂商,如青云科技、优刻得等 [7] - 关注端侧硬件厂商,如美格智能、移远通信等 [7]
计算机行业快报:UltraMem架构为推理降本,AI应用全面落地可期
山西证券·2025-02-17 19:44