Workflow
CXL
icon
搜索文档
未知机构:长江电子澜起科技第四call在产业趋势上做配置ramb-20260204
未知机构· 2026-02-04 10:00
纪要涉及的行业或公司 * **公司**:澜起科技 (A股) [1][3]、Rambus (美股) [1][3] * **行业**:服务器/数据中心、内存接口芯片、CXL (Compute Express Link) 技术、AI服务器 [1][2] 核心观点和论据 * **产业趋势持续向上**:尽管Rambus因自身封测品质问题导致Q1业绩指引不及预期并股价大跌,但公司对服务器CPU内存条未来增长及MRDIMM等产品放量给予正面回应,产业趋势未改 [1] * **CXL技术放量可期**:据产业链调研,谷歌TPUv8p有望引入内存池化以拓展内存容量,每张TPU有望额外增加数百GB内存,此举将推动内存池化规模商业化,利好CXL技术放量 [1] * **CXL拓展芯片竞争格局与前景**:该领域主要玩家为澜起科技和Rambus,产品具有高单价、高毛利特征,在产业放量背景下,市场规模和利润增长确定性高 [2] * **内存接口及配套芯片主业增长确定**:在AI服务器高增长背景下,通用服务器市场预计2025年呈现双位数增长,且在Agent趋势下,2026年市场有望进一步增长,AI与通用服务器CPU的高增长将带动内存条市场加速增长,从而确保内存接口及配套芯片主业的确定性增长 [2] * **MRDIMM产品将驱动中期增长**:随着MRDIMM规模起量,其所用的内存接口芯片MRCD及MDB (具有更高单价) 有望迎来规模放量 [3] * **澜起科技产品线拓展与远期展望**:公司近期发布了AEC Retimer,后续Switch芯片也有望正式发布,伴随CXL拓展芯片、MRCD/MDB、PCIe Retimer、PCIe Switch的规模起量,公司远期利润有望达到100-150亿人民币,给予30倍市盈率,目标市值看3000-4500亿人民币 [3] 其他重要内容 * **Rambus短期风险**:因封测品质因素影响一季度产品交付,导致Q1业绩指引不及预期 [1]
Astera Labs (NasdaqGS:ALAB) FY Conference Transcript
2026-01-15 00:17
公司概况 * 公司为Astera Labs,成立于2017年,总部位于加州圣何塞,专注于为机架级AI基础设施提供智能连接解决方案[1] * 公司的智能连接平台整合了CXL、以太网、NVLink、PCIe和UA-Link等半导体技术,并通过Cosmos软件套件将不同组件统一为灵活的系统[1] 核心产品与业务 * **产品组合**:公司提供完整的硬件和软件产品线,以支持机架级连接基础设施[4] * **硬件**: * **Scorpio P和X系列结构交换机**:Scorpio P用于PCI Express连接(通常用于横向扩展应用),Scorpio X用于GPU到GPU的纵向扩展连接[4] * **Aries重定时器**:以板上芯片或有源电缆形式部署,用于横向和纵向扩展应用[5] * **Taurus产品**:用于以太网信号调理,通常作为有源电缆部署[5] * **Leo产品**:通过CXL连接解决AI系统中的内存瓶颈,允许添加DDR5内存[5] * **软件**:Cosmos软件框架,用于连接所有芯片、定制解决方案、优化并收集诊断信息[8] * **产品状态**:所有产品线均已投入生产,并对收入做出有意义的贡献[5] * **核心优势**: * **软件优先的灵活架构**:通过嵌入式微控制器在软件/固件中实现大量处理,使解决方案高度灵活,可根据客户需求优化和定制[7] * **Cosmos软件框架**:整合所有芯片,提供丰富的诊断功能,确保基础设施健康运行[8] * **深厚的客户信任**:与主要超大规模客户建立了超过7-8年的信任关系,能够提前获知客户路线图,从而指导自身产品规划和开发[9] * **市场竞争地位**: * 在重定时器领域具有最大领先优势,是PCIe重定时器的实际首选[10] * 在PCIe交换领域,正从PCIe Gen 5的追赶者(Broadcom是主导者)转向在PCIe Gen 6建立领导地位,率先推出了PCIe 6交换和重定时器产品系列[10] * 提供从重定时器、变速箱、电缆到交换机的完整PCIe产品组合,是客户的一站式商店[11] * 在以太网领域面临份额竞争,客户倾向于多供应商策略[11] 市场前景与客户动态 * **AI支出环境**:对终端客户需求非常强劲充满信心,部署AI系统的客户表示获得了投资回报,订单模式也反映了这一点,没有看到2026或2027年放缓的证据[13][14] * **PCIe纵向扩展交换机(Scorpio X)机遇**: * AWS在re:Invent上宣布转向基于PCIe的交换结构拓扑,这对公司是积极信号[15][16] * 公司在该领域有超过10个客户项目,其中一些已确认为设计获胜,并将在2026年第一季度开始上量[28] * 对PCIe纵向扩展机会比六个月前更加乐观,客户兴趣和项目进展超出预期[28][29] * Scorpio X有望成为公司最大的产品线,最终将超过Scorpio P和重定时器[16] * **UA-Link与NVLink机遇**: * AWS公开支持UA-Link是积极进展,公司认为当前使用PCIe纵向扩展网络的客户将逐步过渡到UA-Link[17] * NVIDIA的NVLink Fusion为公司打开了新市场,这是一个新的总目标市场,公司已有一个超大规模客户在部署[18] * **PCIe作为纵向扩展结构的持久性**:认为PCIe协议将长期存在,已获得的PCIe项目将持续到2027-2028年,客户已在讨论PCIe 8,其作为纵向扩展结构的生命周期可能比投资者认为的更长[30] 技术演进与产品展望 * **共封装光学(CPO)**: * CPO是总目标市场的净增长,因为光学解决方案比铜缆方案昂贵得多[21] * 公司计划开发光学引擎,使Scorpio系列在铜缆I/O之外增加光学I/O能力[22] * 通过收购Xscale获得了关键的光学封装能力[22] * 预计光学将首先在横向扩展网络中部署(可能在2027-2029年),纵向扩展网络的光学应用预计在2028-2029年[26][27] * **PCIe重定时器(Aries)**: * PCIe Gen 6重定时器已全面投产,公司有信心在Gen 6复制Gen 5的领导地位[41] * 从PCIe Gen 5升级到Gen 6,由于数据速率翻倍、信号传输距离缩短,带来了更高的附着率和平均销售价格机会,推动了产品组合从2024到2025,以及2025到2026的增长[42] * 尽管NVIDIA的参考设计减少了重定时器使用,但超大规模客户在定制化部署Grace Blackwell和未来的Vera Rubin平台时增加了更多内容,且PCIe纵向扩展应用是更大的机会[44] * 已在向通用服务器市场发货PCIe重定时器,但尚未达到AI市场的水平,待网络卡和SSD等终端设备升级到Gen 6后,预计将看到更多增长[45] * **变速箱机会**:随着PCIe代际加速(如Gen 5到6、6到7),对变速箱的需求将持续存在,公司凭借交换机领域的专业知识在此方面具有优势[47][48] * **以太网有源电缆(Taurus AEC)**: * 2025年下半年增长强劲,主要由一个领先客户在AI和通用计算应用中的需求驱动,包括整体用量增加和份额增长[49] * 行业从400-gig向800-gig过渡将带来更广阔的机会,公司正与多个客户进行800-gig AEC的样品测试,预计2026年下半年开始量产出货[49][50][51] * 公司的商业模式是提供智能电缆模块,而非整个电缆,这为客户提供了供应链多样性和控制权,是服务于超大规模客户的差异化优势[52][53] * **CXL内存扩展(Leo)**: * 预计2026年将看到CXL开始部署,特别是在通用计算中用于内存数据库等大内存应用,下半年应开始对收入做出有意义的贡献[55] * 客户正在探索将CXL用于AI应用(如KVCache),以解决内存瓶颈,这可能成为2027年的收入贡献来源[56] 财务与战略 * **收入展望**:2025年Scorpio P是主要收入贡献者,2026年将继续增长,同时Scorpio X将开始叠加在Scorpio P之上贡献收入[36][37] * **资本配置与并购**:鉴于市场机会巨大,公司将积极进行有机投资,并考虑进行补强型并购或人才收购,以增强团队实力和知识产权,抓住未来几年的市场机遇[57][58]
榨干GPU性能,中兴Mariana(马里亚纳)突破显存壁垒
量子位· 2025-08-26 13:46
行业背景与挑战 - 大语言模型在行业应用中面临推理效率与显存成本的尖锐矛盾 尤其KV Cache技术成为显存消耗的主要瓶颈 每增加一个token都需要更多显存存储键值向量 制约模型规模扩张和并发能力提升 [1] 现有技术方案局限性 - Nvidia Dynamo项目采用多级缓存算法 将热数据存于显存、温数据在主机内存、冷数据在SSD或远端存储 但存在数据迁移流程复杂和延迟开销问题 [2] - 微软LMCache存储系统兼容vLLM等推理框架 但分布式存储支持度低且空间上限受限 [3] - 阿里巴巴方案将KV Cache扩展到Tair数据库 虽易于扩展存储空间 但读写性能难以满足低延迟需求 [3] 技术创新方案 - CXL高速互联技术凭借高带宽、低延迟和硬件级缓存一致性特性 为破解内存瓶颈提供新方向 但目前业界针对CXL存储加速LLM推理的研究仍较少 [5] - 中兴通讯与华东师范大学联合推出Mariana分布式共享KV存储技术 通过三项核心创新实现比现有方案高1.7倍吞吐量 尾延迟降低23% [6] - 细粒度并发控制方案将锁粒度从节点级降至条目级 通过RDMA_CAS竞争空闲槽位闩锁 显著减少写密集型和高偏斜工作负载下的争用 [8] - 定制化叶子节点数据布局采用分离式存储 Key连续存放可一次性加载至SIMD寄存器 Value与校验和另存内存块 大幅提升查找速度 [10] - 自适应缓存策略通过Count-Min Sketch算法快速感知热点数据 维护按热度排序链表 降低热点数据加载延迟 [11] 性能验证与应用 - Mariana支持将数据分布在远端CPU DRAM及PMem/SSD组成的共享内存池 理论存储空间无上限 [13] - 在vLLM框架测试中 GPU显存仅能存放50% KV数据时 Mariana多级存储方案显著提升大模型推理预加载阶段性能 [15][17] - 该技术通过硬件加速和智能缓存减少KV Cache查找的计算与网络开销 提升读吞吐量 其数据路径针对低延迟优化 延迟远低于需经远端CPU协议栈的解决方案 [19] 技术演进前景 - Mariana设计理念与底层硬件解耦 核心算法可直接从RDMA网络迁移至CXL硬件生态 仅需替换远程访问API即可利用CXL低延迟和一致性优势 [18] - 该技术重新定义大模型推理存储逻辑 使分布式存储在高吞吐与低延迟间找到平衡点 为百亿/千亿参数模型在普通硬件上高效运行奠定基础 [18]
海力士,加速发展CXL
半导体芯闻· 2025-04-23 18:02
SK海力士CXL DRAM产品进展 - 公司已完成基于CXL 2 0的DRAM解决方案CMM-DDR5 96GB产品的客户认证 该技术通过PCIe接口连接CPU GPU和内存 支持大容量超高速计算并具备内存池化功能 [1] - 新产品相比现有DDR5模块容量提升50% 带宽扩大30% 数据处理速度达36GB/秒 可显著降低数据中心总体拥有成本 [1] - 公司正在推进128GB产品的客户认证 该产品采用10nm级第五代(1b)工艺的32Gb DDR5 DRAM 具有优异的功率性能比 [1] CXL生态系统建设 - 公司开发了专用软件HMSDK 通过优化DRAM模块与CMM-DDR5间的交叉阵列扩展带宽 并实现数据智能分配以提升系统性能 [2] - HMSDK已于2023年9月集成至Linux系统 有效提升了采用CXL技术的系统性能 [2] 产品规划 - 公司将加速完成产品认证 建立完善的产品组合以确保及时供货 [2]
海力士,加速发展CXL
半导体芯闻· 2025-04-23 18:02
SK海力士CXL DRAM产品进展 - 公司已完成基于CXL 2.0的DRAM解决方案CMM-DDR5 96GB产品的客户认证 [2] - 该产品采用PCIe接口,具有池化功能,可实现快速数据传输和高效内存利用率 [2] - 与现有DDR5模块相比,容量增加50%,带宽扩大30%,每秒可处理36GB数据 [2] - 产品有助于大幅降低客户建设和运营数据中心的总体拥有成本 [2] - 公司正在与其他客户认证128GB产品,该产品采用10nm级第五代(1b)精细工艺的32Gb DDR5 DRAM [2] SK海力士技术研发与生态系统建设 - 公司开发了专用软件HMSDK,并针对CMM-DDR5产品进行了优化 [2] - HMSDK可通过DRAM模块和CMM-DDR5之间的高效交叉阵列扩展带宽 [2] - 软件能根据数据使用频率将数据重新定位到适当的内存设备,提高系统性能 [2] - HMSDK已于去年9月安装在Linux操作系统上,提升了应用CXL的系统性能 [2] 产品规划与市场策略 - 公司计划尽快完成128GB产品认证 [2] - 将建立能够在适当时机向客户提供产品的产品组合 [2] - 除开发CXL DRAM外,公司还致力于扩展CXL生态系统 [2]