半导体行业观察

搜索文档
一种新型的超大规模光电混合存算方案
半导体行业观察· 2025-06-29 09:51
核心观点 - 新加坡国立大学团队提出新型2T1M光电混合存算阵列架构 通过光学位元线规避传统电位元线的IR损耗与电容负载问题 实现3750kb阵列规模 在Transformer模型上达到93.3%推理精度 超越传统CIM设计的48.3% 能效提升超3倍达167 TOPS/W [1][7][9] 架构设计与工作原理 - 2T1M架构结合电子与光子技术优势 每个存储单元由两个晶体管和一个调制器组成 采用FeFET执行乘法运算 亚阈值区域展现亚pA级截止电流 保持特性达10年 循环次数超10^7次 [2] - 相比传统RRAM FeFET具有更低截止电流 显著降低静态功耗 在±3V、100μs条件下保持稳定性能 [2] 光电转换与无损求和 - 采用铌酸锂调制器实现电光转换 利用Pockels效应改变折射率 通过MZI单臂集成实现相位偏移累加 完成向量矩阵乘法的无损求和 [4][6] - 铌酸锂波导传播损耗仅0.28dB/cm 光信号传输近乎无损 相位求和方式避免IR压降导致的误差积累 [6] Transformer应用性能 - 在ALBERT模型30000×128词嵌入层中 2T1M架构推理精度达93.3% 与GPU持平 传统CIM架构仅48.3% [9] - 阵列规模达3750kb 为传统CIM架构150倍 功耗效率164TOPS/W 比传统方案提升37倍 [9] - 通过消除矩阵分解和重复外围电路需求 能效提升至167 TOPS/W [1][9] 技术参数对比 - 2T1M架构采用FeFET亚阈值技术 关断电流低至10^-12A 阵列规模30000×128 电压降为0 传统方案需100-300子阵列才能达到同等精度 [12] - 峰值能效164TOPS/W 显著高于对比方案的9.81-13700TOPS/W [12]
一家芯片公司,猛攻英伟达护城河
半导体行业观察· 2025-06-29 09:51
核心观点 - 在AI数据中心快速发展的2024年,Arista Networks凭借其创新的以太网网络解决方案,成为英伟达在AI网络领域的主要竞争对手 [2][25] - Arista从2004年创立之初就专注于为云计算打造简洁、软件驱动的网络系统,这一战略使其在数据中心市场获得成功 [5][6][12] - 随着AI工作负载对网络需求的激增,Arista通过推出高速交换机和优化网络架构,抓住了AI数据中心建设的机遇 [19][20][23] - 尽管面临英伟达等强大对手的竞争,Arista仍在数据中心以太网交换机市场保持领先地位,2025年Q1市场份额达21.3% [26][27] 公司发展历程 - 2004年由Andy Bechtolsheim、David Cheriton和Kenneth Duda联合创立,最初名为Arastra,后更名为Arista Networks [5][12] - 2008年Jayshree Ullal加入并担任CEO,推动公司专注于云计算数据中心市场 [8][9][11] - 2014年成功IPO,首日股价上涨72%,市值达46亿美元 [15] - 2014-2020年收入从5.84亿美元增长至23.2亿美元,年复合增长率25% [16] 技术创新与产品 - 采用"白盒"交换机设计理念,将网络操作系统EOS与硬件分离,提供高度灵活性和可编程性 [13] - EOS操作系统基于Linux内核,支持网络虚拟化和丰富API接口,满足云服务商的定制需求 [13] - 针对AI工作负载推出Etherlink交换机系列,支持400Gbps和800Gbps高速网络,优化大型AI集群性能 [20] - 正在投资1.6T LPO技术以降低AI集群功耗,并探索DPU开发或收购以增强网络卸载能力 [24] 市场表现与竞争格局 - 2025年Q1数据中心以太网交换机销售额达14.8亿美元,市场份额21.3%,同比增长26.4% [23][27] - 赢得Meta等超大规模客户的AI网络试点合同,预计2025年进入全面部署阶段 [21] - 英伟达凭借Spectrum-X解决方案快速崛起,2025年Q1市场份额达21.1%,销售额14.6亿美元 [26][28] - 思科在数据中心市场排名第三,2025年Q1收入12.5亿美元,同比增长17.7% [28] 行业趋势与机遇 - AI训练和推理需求推动数据中心网络投入激增,2025年Q1数据中心以太网销售额69.2亿美元,占比59.1% [27] - 800Gb/s以太网设备首次被统计,2025年Q1销售额3.501亿美元,占市场5.1% [27] - 企业用户正从10G/40G升级至100G/200G/400G网络,推动园区交换机与服务业务增长 [23] - AI基础设施的网络竞争已从带宽与端口的比拼转向生态、战略与系统思维的全面碰撞 [29]
微软自研芯片,凉了?
半导体行业观察· 2025-06-28 10:21
微软自研AI芯片延迟及性能问题 - 微软首款自研AI芯片"Braga"已推迟至少6个月,大规模量产顺延至2025年,原计划2024年部署[1] - 该芯片预计2026年发布时性能将远不及英伟达Blackwell芯片,研发耗时超预期导致竞争力下降[1][3] - 延迟原因包括未预料的设计变更、人员紧张及高离职率(部分团队流失20%成员)[1][3] 微软芯片研发历史与现状 - 公司自2019年开始研发AI芯片,2023年发布的Maia 100(128核Arm CPU)仅用于内部测试,未实际支持AI服务[2] - Maia 100设计定位过时,专注于图像处理而非生成式AI/LLM,早于ChatGPT引发的技术变革[2] - 目前秘密研发三款芯片:Braga(2025)、Braga-R(2026)、Clea(2027),均面向推理场景[3] - 原计划2024年推出的训练专用芯片已被取消[3] 行业竞争格局与英伟达态度 - 微软/谷歌/亚马逊等科技巨头研发自研芯片以减少对英伟达依赖,但英伟达CEO黄仁勋质疑其必要性[2] - 黄仁勋认为多数自研ASIC性能不及商用产品,微软延迟案例可能印证其观点[2] - 微软需等到2027年Clea芯片才可能抗衡英伟达,但届时英伟达或已实现新突破[3] 技术挑战与项目风险 - OpenAI要求新增功能导致Braga芯片模拟测试不稳定,使进度倒退数月[3] - 尽管设计问题导致延迟,微软仍未调整原定发布日期,团队承受高压[3] - 芯片定位与AI技术发展脱节,Maia系列需迭代至Clea才具备竞争力[2][3]
报名中 | 2025 Rambus 北京设计研讨会
半导体行业观察· 2025-06-28 10:21
行业背景与公司定位 - 半导体行业面临数据传输速度和安全性挑战 人工智能 联网车辆 5G和物联网的爆发式增长推动高性能计算和低功耗芯片需求激增 内存带宽与数据处理安全性成为瓶颈 [1] - 接口IP和安全IP技术是行业突破的核心驱动力 直接影响芯片效能 兼容性及抗攻击能力 [1] - Rambus是接口IP和安全IP领域的先驱 成立于1990年 其高速接口技术重新定义内存与系统间数据传输标准 [1] 公司技术与产品优势 - Rambus的DDR内存接口 HBM3/4和PCIe 5/6解决方案显著提升数据中心 边缘计算等场景的性能上限 [1] - 安全IP解决方案包括信任根技术 安全协议引擎 内联密码引擎 后量子密码算法加速器核等 应对复杂网络安全威胁 [1] - 丰富的安全和接口IP解决方案构建强大产品组合 [1] 技术研讨会核心内容 - 会议聚焦AI和汽车两大方向 展示最新接口和安全IP解决方案 包括量子安全加密 信任根 HBM4 GDDR7 PCIe 6.1/7.0 CXL3.1 MIPI等技术 [6] - 上午议程涵盖AI和下一代应用的硅IP 包括内存选择(HBM GDDR LPDDR) PCIe和CXL互连技术 以太网IP布局 MIPI CSI-2传感器技术等 [8][9] - 下午议程深入汽车安全解决方案 探讨智慧联网汽车硬件软件设计趋势 生态系统合作 安全规范 评估方法等 [7][10][11] 会议具体议程 - 上午会议8:30-12:30 包含6场技术演讲 主题涵盖AI训练推理内存选择 PCIe/CXL互连技术 以太网IP布局 自动驾驶传感器技术等 [9] - 下午会议13:30-17:30 包含6场汽车安全专题演讲 内容涉及芯片安全测试 网络安全规范 合规性方法 车规级芯片评估体系等 [11] - 会议提供茶歇和午餐 需提前注册 [4][11] 行业合作伙伴 - 会议汇集多家行业合作伙伴 包括M31 晶心科技 Brightsight ETAS DPLSLab CoMIRA Riscure等机构的技术专家 [2][11]
三星2nm,全面启动
半导体行业观察· 2025-06-28 10:21
三星电子第二代2纳米工艺SF2P进展 工艺技术突破 - 三星已完成第二代2纳米工艺SF2P的基础设计并启动客户推广活动 [1] - SF2P相比第一代2纳米工艺SF2性能提升12% 功耗降低25% 芯片面积缩小8% [2] - SF2P的PDK(工艺设计工具包)已开发至0.9版本 预计下个月完成1.0正式版 [2] 客户合作与商用进展 - 三星与ADTechnology Arm Rebellions联合开发的AI计算芯粒平台确认采用SF2P工艺 [1][3] - 该平台将Rebellions的AI芯片与基于Arm Neoverse V3架构的CPU芯粒集成 通过SF2P生产 [4] - 三星代工部门正积极鼓励DSP公司向客户推广SF2P工艺 已有潜在客户订单项目启动 [3][4] 量产规划与行业影响 - SF2P计划于2025年量产 目前良率与性能已获内部认可 [2][4] - 行业预计2024年多数2纳米芯片设计客户将优先选择SF2P而非第一代SF2工艺 [3] - 三星系统LSI部门的下一代移动AP项目也将采用SF2P工艺 [1][2]
这类芯片,寒冬已过?
半导体行业观察· 2025-06-28 10:21
全球芯片市场复苏信号 - 2025年上半年全球芯片市场释放复苏信号,尤其是内存芯片领域,包括通用DRAM和HBM,市场价格回升、库存去化、订单恢复 [1] - 韩国DRAM出口额自2月起结束同比下滑,连续四个月实现两位数增长:3月增长27.8%,4月增长38%,5月增长36%,6月前20天增长25.5% [2][4] - 6月前20天韩国DRAM出口额达2.69万亿韩元(约19亿美元),同比增长25.5%,不包括HBM等复杂多芯片封装产品 [4] 通用DRAM市场供需紧张 - TrendForce预计第三季度通用型DRAM价格将上涨18–23%,供应受限导致买家难以获得所需产品 [5] - 市场对头部半导体企业自2026年起实现盈利增长的预期增强,通用DRAM周期不会断崖式下滑 [5] - DDR4芯片价格大幅上涨,16Gb DDR4 3200芯片现货价格从5月23日的5.6美元上涨至6月20日的11.5美元,几近翻倍 [7] 三星业绩复苏与HBM布局 - 三星半导体部门第二季度营业利润预计达2万亿韩元,环比翻倍增长,主要受益于通用DRAM价格回升 [6] - 三星向AMD供应HBM3E 12层芯片,但需进入英伟达供应链以在HBM市场站稳脚跟 [6] - 今年以来三星股价上涨12.9%,走势明显改善 [6] SK海力士HBM市场主导地位 - SK海力士第一季度在全球DRAM市场拿下36%的份额,高于三星的34%和美光的25%,主要得益于HBM业务 [11] - SK海力士在HBM领域占据70%的市场份额,市值突破200万亿韩元(1470亿美元) [11][13] - 预计第二季度营业利润达9万亿韩元(66亿美元),HBM3E 12层芯片占HBM出货量一半以上,下半年占比将超80% [15][16] 美光财报与HBM业务增长 - 美光季度营收达93亿美元,环比增长15.5%,同比增长36.6%,调整后每股收益1.91美元,毛利率提升至39% [10] - HBM业务季度收入环比增长约50%,计划2025年底将HBM市场份额提升至23–24% [10] - 预计下一季度营收达104–110亿美元,创历史新高 [10] DDR4与DDR5价格分化 - DDR4芯片价格飙涨,三星/SK海力士3200 MHz DDR4 16Gb芯片现货均价达12.5美元,最高价触及24美元 [7] - DDR5 4800/5000芯片价格上涨9%至6美元左右,首次出现DDR4价格显著高于DDR5的倒挂现象 [7] - 终端厂商因担忧地缘政治与贸易政策影响集中备货,推动DDR4价格飙升 [8] 行业结构性变化 - 三星、美光、SK海力士相继宣布停产DDR4系列,将产品重心转向DDR5与HBM [19] - HBM生产带来更高单位利润,厂商将传统产线转向高附加值产品,加剧通用型DRAM芯片短缺 [20] - 欧美关税政策不明朗,终端厂商囤货避险推高短期价格 [21] 行业周期反转与AI需求 - HBM供不应求,存储厂商宣布HBM库存将在2025年之前售罄,与摩根士丹利此前预测的供给过剩形成鲜明对比 [21] - 英伟达预计GPU出货量2025年达650万台,2026年达750万台,平均售价超40,000美元,推动HBM需求 [22] - 摩根士丹利分析师承认此前判断过于悲观,预计行业周期底部或提前至2026年初 [22] 行业展望 - 从通用型DRAM到HBM,多个维度数据表明芯片寒冬或已过去,新一轮存储周期悄然启动 [24] - 半导体行业供需结构、产品组合与资本流向发生深刻变化,春潮已至 [25]
英特尔CSO,离职!
半导体行业观察· 2025-06-28 10:21
高管变动与战略调整 - 英特尔首席战略官萨夫罗杜・叶博阿-阿芒克瓦将于6月30日离职,其职责包括监督增长计划、战略合作及股权投资等[1][2] - 部分战略职能由新任首席技术与人工智能官萨钦・卡蒂接管,英特尔资本部门将直接向CEO陈立武汇报[2] - 陈立武自2024年3月上任后已精简领导团队,直接监管数据中心、AI芯片及PC芯片部门,并引入新工程负责人[2] 组织架构优化措施 - 计划削减"臃肿、行动迟缓的中层管理架构",强调未来经理的KPI将不再以团队规模为核心[7] - 2024年计划削减5亿美元运营开支,2025年再削减10亿美元以提高运营效率[6] - 将营销职能外包给埃森哲,并逐步关闭汽车芯片业务以聚焦核心客户与数据中心产品[7][8][9] 财务与运营状况 - 2024年公司公布年度净亏损达188亿美元,为1986年以来首次年度净亏损[3] - 加州圣克拉拉总部计划裁员107人,涉及芯片制造部门15%-20%员工,包含物理设计工程师、云软件架构师等关键技术岗位[5][6][7] - 裁员计划7月15日启动,受影响员工将获得60天通知或4周通知附加9周工资福利[6] 管理层改革方向 - CEO陈立武认为需减少管理职位以加快决策速度,解决官僚主义问题[7] - 强调"最优秀领导者能用最少人力完成最多工作"的管理理念[7] - 改革措施源于制造领域长期挑战及在手机芯片、AI芯片领域的战略失误[3]
博通,悄然称霸
半导体行业观察· 2025-06-28 10:21
人工智能基础设施互连架构 - 互连架构是支撑大规模训练和运行数万亿参数模型的关键,涵盖封装内部裸片通信、系统内芯片连接及系统间网络 [1] - 英伟达凭借互连架构技术成为行业巨头,而博通通过商用芯片模式覆盖从以太网架构到芯片封装的全链条技术 [1] - 谷歌TPU大量采用博通知识产权,苹果传闻使用博通方案研发AI服务器芯片 [1] 博通的以太网交换技术 - 博通Tomahawk系列交换机支持高基数连接,TH6芯片达1024Tbps,可减少大规模GPU集群所需交换机数量(如12.8万加速器集群仅需750台TH6) [3] - 以太网技术允许客户选择多供应商方案,英伟达、Marvell和思科也将推出竞争产品 [4] - 博通将Tomahawk 6定位为机架级架构捷径,支持8-576个GPU的扩展连接 [6] 面向扩展的以太网(SUE)与竞争技术 - 博通退出UALink联盟,转向推广SUE栈,与现有交换机兼容 [6] - 以太网已用于英特尔Gaudi系统和AMD未来机架级系统,UALink协议尚处早期阶段 [7] - 专用协议如UALink精简但以太网已成熟可用,支持跨机架扩展 [7] 共封装光学器件(CPO)技术 - 博通CPO技术效率达可插拔器件的35倍,显著降低功耗 [9][10] - 第三代CPO将与Tomahawk 6搭配,提供512个200Gbps光纤端口,2028年计划支持400Gbps通道 [11] - 英伟达在Spectrum和Quantum交换机采用光子技术,但NVLink仍依赖铜缆 [11] 芯片封装与多裸片架构 - 博通3.5D XDSiP技术提供多裸片处理器蓝图,优化混合铜键合(HCB)提升互连速度 [14][15] - 该技术开放授权,类似AMD MI300X设计但优化接口,首批产品预计2026年投产 [15] - 多裸片架构通过不同制程节点(如5nm GPU+6nm I/O)优化成本与效率 [14] 光学集成与加速器连接 - 博通展示64Tb/s光学以太网小芯片,支持512个GPU通过64台512Tbps交换机组成单一扩展系统 [12] - 铜缆传输距离有限,光学器件是跨机架扩展的关键,博通研究加速器直接集成光学方案 [11][12]
英伟达,被谷歌挖了墙角
半导体行业观察· 2025-06-28 10:21
OpenAI转向Google TPU芯片 - OpenAI近期开始使用Google张量处理单元(TPU)驱动ChatGPT等AI产品,此前主要依赖微软和甲骨文提供的NVIDIA GPU [1][2] - 转向TPU的主要动机是削减运营成本,尤其在图像生成平台推出后算力需求激增导致成本高企 [1] - Google未向竞争对手出租最新第七代TPU芯片,使合作更具战略意义,该芯片专为AI推理设计并于2024年4月发布 [1] AI芯片市场竞争格局变化 - NVIDIA GPU因价格高昂且供应紧张,促使市场寻求替代方案,Google TPU被视为更具成本效益的选择 [2] - Google计划将TPU开放给更多云计算基础设施供应商,可能逐步蚕食NVIDIA在AI高性能芯片市场的份额 [2] - OpenAI此前长期依赖微软和甲骨文的NVIDIA GPU资源,甲骨文拥有业内最大NVIDIA GPU库存之一 [2] 行业垂直整合与生态构建 - Google通过TPU硬件、Gemini模型软件及Gmail等平台应用形成完整AI生态闭环,成为最具垂直整合能力的AI公司 [2] - 苹果Apple Intelligence平台训练已采用Google TPU,显示其芯片在行业中的渗透力 [1] 供应链多元化趋势 - OpenAI近期动作显示其供应链策略转向多元化,包括与甲骨文合作"Stargate"项目及此次引入Google TPU [3] - 行业正经历"权力转移",NVIDIA在高端AI芯片市场的垄断地位首次面临实质性挑战 [2][3]
Yole 2025:国产混合键合设备上榜
半导体行业观察· 2025-06-28 10:21
半导体先进封装技术发展 - 混合键合技术是从焊料凸块转向铜-铜直接键合的先进互连工艺,通过无凸点键合实现纳米级精度互联,解决传统微凸点技术在高密度封装中的瓶颈问题 [2] - 2020年全球混合键合设备市场规模达3.2亿美元,预计2027年CoW(D2W)/WoW(W2W)市场规模将分别攀升至2.3亿/5.1亿美元,CAGR高达69%/16% [2] 中国半导体设备产业突破 - 艾科瑞思(ACCURACY)成为Yole报告中首个被收录的中国D2W设备供应商,拓荆科技(Piotech)的W2W设备亦被同步收录,标志中国企业在高端封装领域实现技术突破 [4] - 中国封装设备企业的技术突破为全球半导体封装产业链提供了多元化设备选项,推动行业技术竞争格局向更开放方向演进 [9] AI算力驱动混合键合渗透 - AI算力需求爆发推动混合键合在HBM、3D IC等高端封装场景渗透率提升,预计2028年混合键合在HBM市场渗透率将从2025年的1%跃升至36% [6] 国际巨头技术布局 - 三星计划2025年下半年量产采用长江存储W2W混合键合技术的V10 NAND闪存,实现420-430层堆叠 [8] - 美光加速推进HBM4量产计划,预计2026年推出采用混合键合技术的HBM4产品,2027-2028年量产带宽提高60%以上的HBM4E [8] - SK海力士计划2026年将混合键合技术引入HBM4生产流程,针对20层以上的HBM5明确采用该技术 [8] - 台积电N2节点支持12层HBM4集成,N2P节点互连密度达1000万/mm²;英特尔在CoW领域实现3μm间距突破 [8] - 应用材料收购混合键合D2W领头羊Besi 9%股份以强化合作 [8]