Workflow
UCIe
icon
搜索文档
Synopsys(SNPS) - 2026 Q1 - Earnings Call Transcript
2026-02-26 07:00
财务数据和关键指标变化 - **第一季度业绩**:总收入为24.1亿美元,达到指引区间的高端,主要得益于Ansys交易的时机 [15] - **盈利能力**:第一季度非GAAP营业利润率为42.1%,非GAAP每股收益为3.77美元,超出指引 [13][16] - **现金流与债务**:第一季度自由现金流约为8.22亿美元,季度末现金及短期投资为22亿美元,总债务为100亿美元,已全额偿还43亿美元的定期贷款 [17] - **订单与指引**:期末积压订单为113亿美元,重申全年收入、非GAAP营业利润率和现金流指引,将全年非GAAP每股收益指引上调0.06美元至14.38-14.46美元 [13][17][18] - **第二季度指引**:预计总收入在22.25亿至22.75亿美元之间,非GAAP每股收益在3.11至3.17美元之间 [19] 各条业务线数据和关键指标变化 - **设计自动化**:部门收入约为20亿美元,调整后营业利润率为47.3%,增长动力来自Ansys以及硬件辅助验证的强劲表现,部分被光学解决方案集团剥离所抵消 [16] - **Ansys业务**:第一季度收入约为8.86亿美元,表现强劲,预计全年贡献约29亿美元(按中点计),实现两位数增长 [15][17] - **设计IP**:部门收入为4.07亿美元,同比下降约6%,环比持平,调整后营业利润率为16.2% [16] - **IP业务展望**:2026财年被定位为IP业务的过渡年,预计增长将较为平缓,但会逐季改善,长期增长趋势未变 [11][16][109] 各个市场数据和关键指标变化 - **中国市场**:总收入同比增长约21%,主要得益于Ansys的并表,若剔除Ansys,经典新思科技业务收入同比略有下降 [15] - **中国市场挑战**:实体清单和技术限制的累积影响正在影响客户承诺和需求,对IP业务的影响尤为显著,因为客户可能转向国内代工厂 [67] - **全球市场趋势**:AI基础设施的投入持续推动AI计算领域的设计启动活动保持强劲,但消费电子、汽车和工业等市场的设计启动活动仍然疲软 [4][5] 公司战略和发展方向和行业竞争 - **AI战略定位**:AI并未颠覆公司业务,而是放大了其战略优势,公司正在产品中率先应用AI驱动的设计能力,为客户带来数量级的生产力提升 [5][6] - **数字孪生与系统级工程**:工程转型正从物理测试转向数字孪生,对实现软硬件协同设计的硅到系统解决方案需求巨大,合并后的新思科技与Ansys产品组合对多个行业的创新至关重要 [6][7] - **多芯片系统与先进节点**:在多芯片系统领域势头加速,3DIC Compiler平台获得采用,在2nm及以下的先进节点上,数字流程(包括Fusion Compiler和PrimeTime)在关键流片中实现了100%的使用率 [9] - **IP业务聚焦**:计划将处理器IP解决方案业务出售给格芯,以更专注于扩大在互连和基础IP领域的领导地位 [10] - **Ansys整合与协同**:整合进展顺利,团队正在快速融合,预计2026年上半年将推出首批联合解决方案,目标在第四年实现4亿美元的收入协同效应(年化),在第三年实现4亿美元的成本协同效应(年化) [12][64][65] - **合作伙伴关系**:与英伟达的深度合作包括将产品进行GPU加速以及利用Omniverse平台打造用于物理AI的数字孪生,预计2026年将交付多项产品 [90][92] 管理层对经营环境和未来前景的评论 - **市场环境**:在地缘政治和宏观不确定性持续、中国市场逆风依然存在的背景下,全球团队执行良好 [7] - **AI带来的机遇**:AI是推动系统级和半导体研发投资的巨大趋势,公司的AI产品对客户的成功至关重要 [121] - **长期增长目标**:对EDA业务维持两位数增长、IP业务维持中双位数增长、仿真与分析业务维持两位数增长的长期展望未变 [107] - **2026年定位**:2026年是公司开始兑现新思科技与Ansys合并后的技术承诺的一年,重点是通过推进技术领导力、整合硅到系统工程解决方案、开创AI驱动工程、聚焦IP产品组合以实现增长,以及高效扩展来推动可持续增长和利润率扩张 [4][11][12] 其他重要信息 - **产品进展**:Synopsys.ai客户实现了高达50%的知识辅助加速、高达70%的工作流辅助加速以及高达5倍的正式测试平台生成加速 [8] - **设计成果**:本季度在HPC和汽车客户中获得了超过40个PCIe设计订单,首次演示了PCIe 8.0,并在先进节点和领先代工厂上凭借224G SerDes确立了市场首发地位,获得了10个终身订单 [11] - **股票回购**:董事会已补充现有股票回购计划,授权回购最多20亿美元的普通股 [18] - **行业会议**:将在几周后的新思科技Converge大会上展示更多信息 [7][12] 总结问答环节所有的提问和回答 问题: IP业务下半年增长的信心来源 - 信心源于AI领域强劲的设计启动活动、互连标准演进速度加快(周期缩短至约一半)、以及客户对代工厂可选性的需求,公司产品组合覆盖多家代工厂具有优势 [24] - 收入增长预计更侧重于第四季度 [26] 问题: 为抓住IP机遇的资源配备情况 - 公司拥有正确的技能和人员,挑战在于资源的优先级排序和调度,以确保按时交付,目前进展良好 [28] 问题: 剩余履约义务的季节性及EDA与仿真软件的续订活动 - 积压订单的建立和消耗存在起伏,目前113亿美元的积压订单提供了强有力的能见度和信心 [34] 问题: 硬件验证产品(ZeBu和HAPS)的产品周期展望 - 硬件产品组合包括ZeBu、HAPS以及新推出的EP系列,去年创下纪录,鉴于客户对处理复杂性的需求,预计该业务将继续满足高期望 [35] 问题: 关于确保AI发挥建设性而非颠覆性作用所需的关键能力(如编排、数据存储库、可追溯性) - 公司已规划从L1到L5的智能体工程师路线图,其中包含任务智能体、智能体编排等,数据连续性和可追溯性是实现准确、无“幻觉”工作流的关键,公司结合自研与生态合作(如与英伟达、微软)来推进 [41][42] 问题: Ansys业务的预测性及终端市场假设 - Ansys业务服务于多个市场细分,总体有效市场渗透率仍低,增长机会广阔 [45] - 由于会计政策(ASC 606)和销售团队与财年对齐需要时间,收入确认存在波动性,但正在通过整合产品和统一会计政策来减少影响 [46] 问题: 剥离ARC处理器IP业务的原因 - 许多客户正在利用公司的EDA软件自行开发处理器IP,从IP业务角度看,更大的增长机会在于接口IP,因此将资源集中于此 [53] - 在交易完成前,ARC收入仍包含在财务报告中 [56] 问题: 与Ansys整合的协同效应进展 - 收入协同方面,销售团队已开始交叉销售,目标在第四年实现4亿美元年化收入协同;成本协同方面,目标在第三年实现4亿美元年化成本协同,并正努力加速至第一年和第二年实现 [65] - 首批联合解决方案预计在2026年上半年推出, monetization预计从2027财年开始 [64] 问题: 中国市场的竞争格局 - 中国业务表现符合预期,经典新思科技业务略有下滑,Ansys业务表现良好,限制措施对IP业务影响更大 [67] - 观察到国内竞争对手的出现,但能使用公司技术的客户仍倾向于选择公司产品 [68] 问题: IP交付延迟是否会导致客户流失 - IP销售基于与客户时间表的对齐,公司正优先调配资源以确保关键IP产品按时交付,对下半年增长有信心 [73][74] 问题: IP业务利润率前景及向特许权使用费模式的转变 - 由于今年增长平缓且持续投资开发IP产品,营业利润率将受到压制,长期来看,IP业务利润率将低于公司平均水平,但仍是一个非常好的业务 [75] - 鉴于客户对定制化和加速交付的高需求,公司正积极与客户洽谈基于价值的商业模式,预计2026财年将达成一些协议 [77] 问题: 智能体工程师的货币化方式及其对利润率的影响,以及Ansys广泛客户群带来的风险 - 随着工作流改变,货币化将转向基于价值的方式,客户对此持开放态度 [84] - Ansys被视为业务的增长乘数,其仿真分析在多个工程研发领域的渗透率仍有巨大提升空间,并非一次性现象 [85] 问题: 与英伟达合作的进展及货币化 - 合作包括产品GPU加速和基于Omniverse的数字孪生,预计2026年交付多项产品,GPU加速产品将因性能提升(如15-20倍)带来附加价值 [90][92] 问题: 智能体工程师的当前应用情况(前端 vs. 后端)及客户渗透 - 目前已有多个任务智能体(如形式化验证顾问),正在前端和后端同时推进,前端因客户瓶颈更突出而成为早期重点,更多细节将在Converge大会上公布 [98][99] 问题: GAAP每股收益指引较低的原因 - GAAP与非GAAP之间的主要差异在于摊销计划,以及一次性重组费用 [100] 问题: 2026年兑现技术承诺对2027年及以后增长方向的意义 - 长期增长展望不变:EDA两位数、IP中双位数、仿真与分析两位数增长 [107] - 联合解决方案旨在解决客户当前未满足的需求(如将物理分析融入设计阶段),这将带来增长机会 [108] 问题: 第一季度业绩超预期是否主要来自Ansys,以及全年潜在上行空间的来源 - 第一季度Ansys表现显著强劲,收入达8.86亿美元 [112] - 全年预计所有业务线都将表现强劲 [112] 问题: EDA软件业务增长提升的驱动因素 - EDA软件业务是定期性、可预测的,增长提升取决于客户群:投入AI建设的客户正积极采用新技术;其他客户则与续订周期更相关 [118] - 未来的新机遇在于利用Ansys产品组合创造联合解决方案 [119]
UCIe,万事俱备
半导体行业观察· 2026-02-14 09:37
UCIe 3.0版本发布与技术进步 - 随着Chiplet使用量增加,UCIe联盟发布了3.0版本,延续了自2023年以来每年更新的节奏,该版本将数据速率提高了一倍,改进了可管理性,并涵盖了之前版本中难以处理的三种新情况 [2] - 人工智能数据中心的工作负载对计算能力和带宽的需求规模之大,传统单芯片已无法满足,光罩尺寸限制、良率限制和供电挑战使得将大型器件制造成单芯片不切实际 [2] - UCIe和Bunch of Wires是两种主要的芯片间互连标准,主要面向芯片内部的芯片级连接 [2] UCIe标准演进与市场接受度 - UCIe于2022年发布,全面考虑了芯片互连,涵盖了底层物理信号传输以及其上的协议适配 [3] - 2024年发布的2.0版本引入了新的管理功能,但当时许多功能都是可选的,开发者可自行决定实现哪些功能,这曾引发业界对其复杂性的担忧 [3] - 随着3.0版本发布,业界对采用该技术的抵触情绪有所缓和,引发的争议也较少 [3] UCIe 3.0性能提升:带宽与数据速率 - UCIe-S和UCIe-A的最大允许数据速率已从32 GT/s提升至64 GT/s,但只有2D和2.5D设计的数据速率才会翻倍,此外还提到了48 GT/s的数据速率 [5] - 3D堆叠结构未被纳入此次升级,因为通过硅通孔通信,芯片面积足以容纳信号传输,无需将数据速率提高一倍 [5] - 更高的数据速率是通过使用四分之一速率信号实现的,该技术已扩展到支持48 GT/s和64 GT/s,也称为四倍数据速率信号 [6] - 对于64 Gbps的传输速率,时钟频率为16 Gbps,有两个相位相差90度的时钟在运行,从而在0度、90度、180度和270度处产生边沿来捕获数据 [6] UCIe 3.0关键性能指标 - 48 GT/s的误码率为10⁻¹⁵,而64 GT/s的误码率为10⁻¹²,两者相差三个数量级,但在考虑CRC校验和重放机制的情况下都是可以接受的 [6] - 在较低数据速率下,功耗保持在0.5 pJ/bit以下,更快的设计需要增强均衡,使目标功耗达到0.75 pJ/bit [7] - 新增的带宽无需更改凸起位置即可使用,与之前的版本完全兼容,但更高的速度可能会增加确保信号完整性的难度 [8] 系统设计挑战与复杂性 - 人工智能正在推动前所未有的带宽需求,芯片间的连接分析难度也呈指数级增长 [9] - 随着UCIe向64 Gbps迈进,设计裕量缩小,布线密度增加,信号完整性风险成倍增长,使得系统级收尾比以往更具挑战性 [9] - 异构集成带来了新的复杂性,包括不断增长的功耗和散热需求,以及跨堆叠架构的完整系统级验证 [9] 管理与启动功能改进 - UCIe 2.0引入了更好的启动和优先级管理功能,并在3.0中得到升级,现在可以将多个Chiplet的固件文件合并成一个源文件供所有或部分芯片使用 [10] - 在UCIe 3.0之前,优先级通知事件通过主频段发送,可能被低优先级数据阻塞,且必须经过信任根验证,现在这些消息可以通过边带传输,虽然速度较慢,但可用性更高且不受信任根延迟影响 [10] - 边带的安全保障工作仍在进行中 [11] 边带传输与系统可靠性增强 - 边带的工作频率远低于主频带,其信号传输距离限制已从最大25毫米扩展至100毫米,这允许多个芯片共享同一条线路,实现边带的星型连接 [13] - 两个新的开漏引脚可实现快速降频和紧急关机,一个阈值允许降低运行速度,更高的阈值则会导致所有芯片关机以避免过热损坏 [13] - 这种对快速节流和紧急停机的支持对系统可靠性有重大影响,尤其是在汽车应用领域 [13] 新增用例与功能 - UCIe 3.0涵盖了连续流媒体传输的用例,这类应用以恒定速率生成数据并传输,例如天线生成的数字数据需与片上系统通信 [15] - 通过允许使用一系列时钟频率,设计人员可以在不会与射频通道产生拍频的频率范围内使用UCIe [17] - 新增功能允许链路接收端向发送端请求重新校准,这可以减轻接收漂移数据的负担,并简化初始化过程以降低功耗 [17] - 新增的深度睡眠模式允许在关闭侧带的同时,保持一个小型电路运行以检测何时退出睡眠模式,从而在睡眠期间进一步降低功耗 [18] 协议支持与生态发展 - Arm已在UCIe上提供了其广受欢迎的CHI相干协议,这是通过将CHI芯片间的数据映射到可以通过UCIe传输的flit来实现的 [18][20] - UCIe联盟此前已在UCIe上构建了PCIe和CXL,Arm的加入进一步扩展了协议支持 [18] - 在UCIe出现之前,几乎所有人都在使用定制解决方案,但随着UCIe升级到64Gbps,其普及率预计会更高 [21] - BoW仍将是一个重要因素,尤其是在需要最小接口和最低功耗的设计中,但大多数业界已经转向UCIe或基于UCIe标准的方案 [21]
拥抱Chiplet,大芯片的必经之路
半导体行业观察· 2026-02-12 08:56
Chiplet架构的核心优势与驱动力 - 新型Chiplet架构旨在解决传统单芯片(SoC)在功耗、散热和尺寸上面临的物理极限问题 为高性能计算(HPC)和人工智能(AI)开辟新的发展道路[2] - 相比单芯片处理器 Chiplet架构能以更低的成本提供更高性能 同时能耗降低高达10倍[2] - 传统SoC将所有组件集成在单一芯片上 随着芯片尺寸增大 制造成本增加且良率下降 同时AI工作负载导致大量数据在芯片间传输 消耗大量电力并产生巨大热量[2] Chiplet架构的技术原理与标准 - Chiplet架构采用封装级缩放方法 将组件插入埋藏在基板中的标准互连线 而非直接焊接在芯片上[4] - 通用芯片级互连高速标准(UCIe)于2022年推出 得到了英特尔、AMD、Arm、谷歌云、Meta、微软、高通、三星和台积电等巨头的支持[4] - UCIe提供分层架构 可与PCIe、CXL、NVLink和UALink等其他互连标准兼容[4] Chiplet架构带来的核心益处 - 允许将芯片紧密排列并通过UCIe连接 减少数据传输 从而降低功耗[4] - 赋予用户更大灵活性 可在系统特定位置采用特定处理器 更好地平衡性能与成本 而非被迫使用芯片制造商预先集成的组件[4] - 制造优势显著 较大的单芯片缺陷率高、良率低 而Chiplet架构可轻松更换有缺陷的组件 有助于降低厂商锁定[4] Chiplet架构的性能与扩展性突破 - 芯片间通信即使相邻也会造成延迟和功耗影响 而在封装内部 效率和性能会大大提高[5] - Chiplet技术的核心优势在于能够突破光刻掩模的限制 实现封装级扩展 创造出远超单个整体芯片所能容纳的系统规模[5] - 使用标准设计的芯片构建模块来构建系统 采用像UCIe这样功耗特性更好的芯片间接口 取代传统高功耗的标准芯片间接口[6] Chiplet在HPC与AI领域的应用现状 - 高性能计算领域正在引领Chiplet普及 因为其已触及当前芯片设计的物理极限[5] - Chiplet技术对于超级计算机并不新鲜 已被应用于百亿亿次级(Exascale)系统中 例如橡树岭国家实验室的Frontier超级计算机采用了基于Chiplet的设计 使用AMD EPYC "Trento" CPU 理研的FugakuNEXT超级计算机预计也将采用该技术[6] - AI的蓬勃发展迫使计算机制造商寻求新路径 Chiplet架构为AI和HPC提供了另一种提供所需处理能力的方式 无需为单一需求完全重新设计系统[7] Chiplet架构的设计灵活性与经济效益 - 允许对不同组件采用不同工艺 例如GPU可升级至2纳米或1.4纳米等新工艺 而I/O接口或射频模块可继续使用3纳米或5纳米等现有工艺 从而节省重新设计的额外成本[7] - 使设计者能够专注于其核心优势(“独门秘方”) 从而加快产品上市速度[7] - 支持三维设计 使组件能够堆叠 实现更高的计算密度、更低的数据延迟和功耗 尽管会带来更高成本、更复杂结构和更大散热需求[7] 3D Chiplet技术、市场与生态发展 - 3D技术离现实应用并不遥远 人工智能工厂和人工智能数据中心是这类应用的最大市场 因为它们有能力和财力支持这类创新活动[8] - Chiplet本质上是用于构建计算机的标准化模块 标准对于确保不同公司产品的兼容性至关重要[8] - Chiplet社区和市场虽处发展初期 但核心力量稳固、发展势头强劲 行业成员将齐聚Chiplet峰会[8] UCIe标准的关键作用与行业态度 - 采用UCIe是建立Chiplet标准的核心 也是扩大Chiplet社区规模和范围的关键[8] - UCIe的普及对Chiplet市场是好事 随着其普及 人们相信在芯片上使用UCIe后 也能在其他项目中与其他合作伙伴复用 这很有帮助[9] - 芯片社区中有些供应商对采用UCIe持谨慎态度 他们希望确保在UCIe上的投资能够获得回报[8]
国产半导体 IP “隐形支柱” 最新进展
是说芯语· 2025-12-29 09:52
公司上市进程 - 芯耀辉科技股份有限公司已完成首次公开发行股票并上市的辅导工作,辅导机构为国泰海通证券,辅导工作完成报告已提交[1] - 公司上市辅导进程迅速,从2025年3月签署辅导协议,到4月至11月完成两期辅导[1] 公司背景与市场地位 - 公司成立于2020年6月,由曾担任全球EDA/IP龙头Synopsys中国区副总经理的曾克强创立,旨在打破半导体IP卡脖子局面[3] - 创立时,全球接口IP市场90%以上份额被Synopsys、Cadence等外企垄断,国内芯片设计企业的高速接口IP几乎完全依赖进口[3] - 公司团队由200多位国际顶尖IP人才组成,核心成员平均拥有20年行业经验[3] - 公司已搭建覆盖PCIe、SerDes、HBM等20余种主流协议的全栈IP平台,并实现了5nm先进制程的适配[3] - 公司接口IP在国内12/14nm工艺市场覆盖率超过80%,车规级IP市场份额稳居国内前三[3] - 公司已成为全球接口IP前五名中唯一的中国企业[3] 产品技术与行业价值 - 在AI大模型与数据中心的算力竞赛中,接口IP是芯片的“数据高速公路”,例如公司的112G SerDes IP能将芯片间数据传输速度提升数倍,HBM IP是AI芯片高带宽内存的“连接器”[5] - 这些“隐形组件”直接决定了算力的传输效率与系统协同能力[5] - 公司的UCIe、HBM3E等IP已成为国内Chiplet技术落地的核心支撑[5] - 公司产品已服务华为海思、寒武纪、中芯国际等80余家头部客户[5] - 公司2024年销售额同比增长50%[5] 发展前景与战略意义 - 公司上市辅导完成意味着这家“算力基础设施供应商”将获得资本加持,有助于进一步突破先进制程IP(如3nm)、车规级高可靠性IP等技术瓶颈[5] - 随着Chiplet技术普及、车规级芯片需求爆发,以及国内芯片设计企业“自主可控”意识提升,国产IP的市场空间正在快速打开[5] - 公司的上市进程被视为抢占算力时代话语权的缩影[1]
从芯粒到机柜:聊聊大模型浪潮下的开放互连
半导体行业观察· 2025-12-02 09:37
文章核心观点 - AI大模型发展重心从预训练扩展转向推理时扩展,对基础设施的低延迟和高吞吐提出新要求[8] - 面对NVIDIA私有互连技术的垄断,行业需要拥抱开放互连标准以实现供应链健壮性和技术优化空间[9][10] - 开放互连技术体系UCIe/CXL/UAL/UEC覆盖从芯粒互连到Scale-out网络的全链条,是构建AI基础设施核心竞争力的关键[10] - 阿里云作为中国大陆唯一代表,深度参与UCIe、CXL、UAL等核心标准制定,在开放互连生态中占据有利地位[2][4] 开放互连标准发展背景 - 2019年3月CXL联盟成立,旨在解决异构XPU编程和内存扩展挑战[4] - 2022年3月UCIe联盟成立,致力于建立开放的Die-to-Die互连标准[4] - 2023年7月UEC联盟成立,目标为AI和HPC重建高效开放的以太网[4] - 2024年10月UAL联盟成立,应对模型尺寸和推理上下文增长对Scale-up网络的需求[4] Scaling Law三个阶段 - 预训练扩展:通过增加模型参数、训练数据量和计算资源提升基础模型精度[5] - 后训练扩展:通过微调、RLHF和蒸馏等手段使模型输出更专业和符合人类习惯[5] - 推理时扩展:通过生成更多辅助推理的token提升输出质量,如CoT Prompting和Sampling and Voting[5][6] - 当前扩展重心已转移到推理时扩展,对延时指标和吞吐指标有刚性需求[8] UCIe技术分析 - 基于芯粒的设计通过提升良率、制程节点优化、芯粒复用和市场化四个层面解决成本问题[11][15] - 芯粒设计突破光罩尺寸限制,NVIDIA Blackwell采用2 Die合封,Rubin Ultra采用4 Die合封[14][17] - UCIe物理层目标延时<2ns,先进封装单模组带宽达256GB/s[18][19][23] - UCIe-3D采用混合键合技术,bump pitch仅9μm,远低于2D/2.5D封装的25-55μm[25] - UCIe支持光电共封,为AI集群互连提供低成本、高灵活度解决方案[26][27] CXL技术特性与应用 - CXL 3.2支持64GT/s链路速率,256字节Flit格式,多级交换和全局集成内存等特性[33] - 内存扩展和池化为LLM推理系统提供分层缓存体系,缓解KV Cache存储压力[34][40] - 全局集成内存实现Host间一致性内存访问,为AI基础设施提供内存共享能力[34][39] - CXL在RAG向量数据库中可通过内存池化创建常驻内存数据库,或利用存内计算提升查询效率[40] UAL协议架构 - UAL采用四层协议栈,物理层复用IEEE802.3dj以太网PHY,实现200Gb/s传输速率[43][45] - 支持内存语义操作,避免RDMA编程模式的Doorbell/Interrupt延时开销[44] - 通过Credit-based流控和链路层重传实现无损传输,减少长尾延时[54] - 支持最多1024个节点的超节点Scale-up网络,采用PGAS编程模型实现全局内存空间[50] UEC协议创新 - 短时连接动态创建Packet Delivery Context,解决RDMA网络规模扩展性问题[59] - 多路径和包喷洒技术使同一流中的数据包可走不同路径,提升带宽利用率[62] - 支持乱序包交付与顺序消息交付,提供四种传输模式应对不同场景需求[63] - 拥塞控制综合ECN标识和RTT测量,结合接收端信用控制实现高效管理[64] - 安全子层通过安全域共享密钥和重放攻击防护机制保障数据传输安全[67] Scale-up域边界分析 - 模型参数增长放缓,但KV Cache内存需求持续增加,对内存容量提出更高要求[70][74] - NVIDIA Rubin Ultra显存容量预计达约1TB,算力达100 PFLOPS@FP4[75] - 华为昇腾960算力为4 PFLOPS@FP4,显存288GB,与NVIDIA存在显著差距[75] - 中美AI集群形态差异:美式集群Scale-up域锚定单机柜,中式集群需多机柜扩展[76] - Scale-up集群规模将经历扩大再收缩过程,最终回归单机柜超节点形态[76] CXL未来发展前景 - CXL 3.1引入GIM概念,实现Host间一致性内存访问,功能上接近UAL[77] - PCIe Gen8速率将达256GT/s,但需等到2028年才可能集成到GPU[78] - CXL提供另一种集群组织形态:GPU通过CXL Switch连接CPU,实现统一内存空间[78] - 非NVIDIA GPU集成CXL可实现与Host的UMA,提升带宽利用率[78] - CXL生态系统成熟后,可能成为AI基础设施的重要技术路径[78]
每周股票复盘:和顺石油(603353)拟收购奎芯科技控股权
搜狐财经· 2025-11-23 02:36
股价表现与交易信息 - 截至2025年11月21日收盘,公司股价报收于30.59元,较上周的28.03元上涨9.13% [1] - 11月20日盘中股价触及近一年最高点35.88元,11月21日盘中最低价为30.53元,本周共计2次涨停收盘 [1] - 公司当前最新总市值为52.59亿元,在炼化及贸易板块市值排名17/30,在两市A股市值排名3098/5167 [1] - 因连续三个交易日内收盘价格涨幅偏离值累计达到20%,公司于2025年11月17日登上龙虎榜,为近5个交易日内首次上榜 [2] 股权变动与公司治理 - 实际控制人晏喜明、赵尊铭及其一致行动人赵雄拟通过协议转让方式向陈琬宜合计转让公司6.0000%股份,共计10,314,360股,转让价格为22.932元/股,总金额236,528,903.52元 [3] - 本次权益变动后,实际控制人及其一致行动人持股比例由66.5817%降至60.5817%,不导致公司控制权变更,受让方陈琬宜将成为持股5%以上股东 [3] - 公司将于2025年12月5日召开第三次临时股东会,审议变更经营范围、修订《公司章程》及工商变更登记事项 [8] - 公司拟取消“烟草制品零售”经营范围,修订后的《公司章程》明确公司注册资本为17,190.6万元,经营范围包括成品油批发零售、新能源汽车销售、光伏发电等 [9] 重大资产收购事项 - 公司拟以现金方式收购上海奎芯集成电路设计有限公司不低于34%股权,并通过表决权委托合计控制51%表决权,取得其控制权 [4][8] - 标的公司100%股权价值不高于15.88亿元(增资后估值),预计最终交易金额不高于5.4亿元 [4][8] - 该交易构成关联交易,因标的公司实控人陈琬宜将受让公司6%股份成为关联人,交易尚需签署正式协议并履行后续程序 [8] - 标的公司承诺2025–2028年每年收入分别不低于3亿、4.5亿、6亿、7.5亿元,且归母净利润均为正 [8] 标的公司业务与技术 - 奎芯科技是国内少数具备完整高速接口IP产品矩阵的企业,核心产品为互联接口IP,覆盖UCIe、ONFI、HBM、LPDDR、PCIe等 [4][7] - 核心IP具备面积小、功耗低、多通道灵活设计优势,其中UCIe实现32Gbps速率(行业最高),HBM3支持6.4Gb/s速率,总带宽达819GB [7] - 公司商业模式为“IP授权费+权利金”,2024年IP+Chiplet营收占比超50%,Chiplet潜在市场规模约为IP市场的10倍 [5][7] - 研发团队约占员工总数70%,下游客户包括全球及国内一线固态硬盘存储原厂、AI芯片独角兽企业、汽车电子及消费电子等领域客户,前十大客户对公司营收和利润贡献显著 [4][5][7] 公司转型背景与战略 - 公司主营业务为加油站零售连锁,现金流充足,但受新能源汽车影响,归母净利润近年有所下滑,因此寻求向半导体行业转型升级 [4] - 收购奎芯科技契合公司转型升级方向,半导体IP行业前景广阔,公司目标是成为国产互联IP与Chiplet领域的龙头企业 [4][7]
Chiplet生态系统正在慢慢兴起
半导体芯闻· 2025-07-23 17:59
Chiplet设计的核心观点 - Chiplet设计正从定制化向标准化开放市场过渡,但需先建立完整的生态系统[2] - 细分应用专用Chiplet至关重要,可让客户专注于核心优势领域,其他部分交由专业厂商处理[4] - 行业需要为工程师提供更多工具和能力,帮助他们实现Chiplet集成[4] - 40%业内人士已认同某些接口标准,但热性能数据交换等关键领域仍缺乏统一标准[9] Chiplet的优势 - 可带来三个关键价值:成本效率、定制灵活性和配置可重用性[6] - 使公司能专注于特定领域成为专家,显著提升生产力和产品竞争力[4] - 子系统级解决方案可帮助客户更快将产品推向市场[7] - 物理AI等新兴领域已开始实际应用Chiplet技术[13] 技术挑战 - 热性能数据交换缺乏统一标准,SerDes端口等热点位置信息难以共享[9] - 封装领域存在"狂野西部"现象,各代工厂生态系统封闭且设计规则不统一[9] - HBM作为首个Chiplet并未对所有人开放,存在供应链问题[10] - 2.5D集成带来热、电磁干扰、应力等新问题,需要建立相应模型[8] - 互连结构分析计算成本高,某些情况下需一周时间完成建模[14] 生态系统发展 - 需用"芯片生态系统"替代"芯片市场"概念,涵盖工具、设计基础设施等全方位支持[5] - EDA标准和能力显著进步,多芯片组测试协调能力提升明显[5] - Cadence通过物理AI原型验证了Chiplet生态系统框架[12] - Arm CSA、imec和UCIe等组织正在解决Chiplet不同层面的问题[12] - EDA行业需改进互连级分析,提高性能预测效率[14]
D2D,怎么连?
半导体行业观察· 2025-05-18 11:33
UCIe 2.0标准的核心观点 - UCIe 2.0版本中许多新功能是可选的,这一关键信息在公众讨论中被忽视 [1][2] - 规范允许根据具体需求定制变体,适用于汽车、高性能计算、AI、军事/航空航天等多个领域 [2] - 与PCIe、CXL和NVMe等标准类似,UCIe具有灵活性,无需为不需要的功能使用芯片 [2] UCIe与专有设计的竞争格局 - 当前先进封装项目主要由资金雄厚公司主导,采用专有设计实现内部芯片互操作 [4] - 专有设计占据主导地位,因互操作性并非当前主要问题 [2] - 长期愿景是建立类似软设计IP的通用芯片市场,但需解决即插即用标准问题 [4][6] UCIe 2.0的可选管理功能 - 管理功能包括发现、初始化、固件下载、电源/热管理等9大类,均为可选 [7] - 90%的当前系统实现不关心这些功能,仅10%为未来兼容性考虑 [6] - 最低必需功能支持盲芯片启动,如通道反转等强制性元素也可在定制实现中去除 [9] UCIe与BoW的技术对比 - BoW允许使用收发器,可能减少50%线路数量;UCIe强制每条通道两条线路 [16][17] - UCIe严格规定凸块布局和PHY尺寸,BoW则提供更大设计自由度 [17] - BoW被视为更轻量的架构规范,而UCIe提供更完整的标准化方案 [18] 行业生态发展现状 - 英特尔等公司会在UCIe基础上修改数据链路层以适应特定用例 [15] - 专有解决方案(如NVIDIA的NVLink)仍将在高性能领域保持优势 [21] - 新思科技提供三种UCIe接口IP:合规、兼容和定制版本,满足不同需求 [15] 市场接受度与未来趋势 - 行业更倾向于功能选项清晰分层的标准,而非杂乱无章的变体 [15] - UCIe和BoW的竞争呈现良性态势,IP提供商普遍对两者持开放态度 [20] - 标准化进程较慢可能延迟新功能采用,专有方案仍具迭代速度优势 [20]
Chiplet互连之争:UCIe何以胜出?
半导体芯闻· 2025-05-16 18:08
UCIe 2.0标准特性分析 - UCIe 2.0版本因包含大量新增特性被质疑过于重量级,但多数特性为可选实现,设计者可根据需求定制[1][2] - 标准定义了从汽车到高性能计算、AI等多领域适用方案,但IP提供商需应对支持所有特性的挑战[1] - 90%的当前应用采用封闭系统设计,仅10%用户为未来开放生态提前部署可选功能[6] Chiplet市场现状与愿景 - 当前先进封装产品主要由资金雄厚公司内部开发,chiplet多源于分解的SoC模块(如计算核心、缓存)[3] - 长期目标是建立类似软IP市场的通用chiplet市场,实现跨公司硬硅片即插即用[4] - 开放生态需在参数标准化基础上达成共识,UCIe Consortium正制定相关功能以支持未来市场[5][13] UCIe与BoW标准竞争 - BoW被认为更轻量级,允许收发器使用(半双工)和灵活bump布局,单通道仅需1条线路[15][16] - UCIe强制双线路全双工通道,规定bump物理布局以提升兼容性,但牺牲设计自由度[15][16] - 两者理念差异显著:UCIe强调规范统一性,BoW提供类似Arm AMBA总线的架构灵活性[16] 管理功能设计 - UCIe 2.0新增管理特性(如固件下载、错误报告)均为可选,通过主频带或边带接口实现[7][9] - 最小特性集支持盲die启动,强制通道反转等基础功能在定制设计中可省略以降低复杂度[9][10] - 发现功能采用静态枚举而非动态发现,仅需简单寄存器读取确认chiplet配置[11][12] 行业实施动态 - 英特尔等大厂在内部用例中修改UCIe数据链路层以优化性能,显示标准实际应用中的灵活性[14] - 英伟达等公司仍倾向专有接口(如NVLink),因标准化进程慢于专有方案迭代速度[17][18] - IP提供商推出分级UCIe方案(Compliant/Compatible/Custom)以适应不同功耗与性能需求[13]
Chiplet,刚刚开始!
半导体行业观察· 2025-03-29 09:44
芯片资源管理挑战 - 芯片资源管理不善增加了功率、性能和面积权衡的复杂性,可能导致性能瓶颈、开发成本上升和功耗管理困难[1] - 跨芯片通信的固有延迟比单个芯片内更长,随着芯片数量增加,相互通信的功耗变得更难管理[1] - 系统和处理器供应商通过增加计算密度提高性能,通过提高产量降低成本,但使用第三方芯片优化系统更为困难[1] Chiplet设计方法论 - 许多公司首次尝试chiplet设计时错误地从芯片内部开始工作,而非从系统角度出发,导致在互操作性和通用性方面陷入困境[2] - 正确方法应从系统总线和NoC开始,优化NoC和系统总线及协议(如CHI或AXI),针对具体应用和目标市场调整功率、性能和面积[2] - 所有芯片组的系统总线必须相同,理想情况下I/O互连是通用的,这给IP供应商带来了新的挑战[2] Chiplet市场分类 - Chiplet市场分为专属市场(单一供应商)、本地生态系统(5-7家公司合作)和开放市场(多供应商互连)[3] - 目前95%-99%的chiplet市场属于专属市场,大型制造商追求超越标准的关键性能指标(KPM)[3] - 本地生态系统的例子包括日本和欧洲汽车供应商群体,以及RISC-V公司联盟[3] 芯片分区策略 - 行业正从专属生态系统向本地生态系统过渡,芯片开发人员寻求最佳构建方法[6] - 简化方法包括按技术划分芯片,将模拟部分放在更高工艺节点,处理低工艺节点的能耗问题[6] - 功能分区可构建更大系统而不必将所有组件放在同一SoC上,例如汽车ADAS解决方案中的功能分组[6] Chiplet互操作性挑战 - 实现可互操作的chiplet市场比许多人意识到的更困难,需要良好的验证IP和一致认可的标准[9] - UCIe等标准仅提供最低级别的连接,无法确保芯片间的相互理解,需要更高级别的通信协议[9][10] - 行业初期过于关注物理层接口定义,而忽视了资源管理层面的问题[11][12] 行业发展趋势 - 行业正探索如何在封装中即插即用多供应商chiplet,面临架构设计和资源管理的挑战[12] - 美国政府通过NAPMP计划推动完全自动化的1000个芯片封装设计流程,涉及复杂的启动过程和信任链定义[12] - 代工厂提供的微米间距混合键合技术为3D堆叠chiplet创造了新机会[12]