半导体行业观察
搜索文档
RISC-V将重塑这类芯片
半导体行业观察· 2025-08-27 09:33
文章核心观点 - ARM架构在DPU市场已取代英特尔和AMD占据主导地位 但RISC-V凭借其开放可定制特性正成为潜在颠覆者 可能重新定义DPU架构竞争格局 [1][4][12] DPU市场现状与规模 - 全球DPU市场规模预计从2023年15亿美元增长至2032年98亿美元 复合年增长率达22.8% [3] - ARM内核目前占据DPU出货量绝大部分份额 英特尔IPU尚未获得广泛市场吸引力 [3] - 中国正加速自主采用RISC-V DPU作为关键基础设施组件受地缘政治因素推动 [3] RISC-V技术优势 - 提供开放式指令集架构 企业可根据具体工作负载进行定制化设计 [6] - 支持同步多线程技术 每核最多四线程 提升高内存或I/O延迟工作负载吞吐量 [6] - 矢量扩展可映射数据包处理/加密/存储加速 矩阵扩展可编程性覆盖AI推理和安全领域 [7][9] - 避免ARM专利授权费用 保持与Linux/TensorFlow/PyTorch等开源堆栈兼容性 [7] 架构演进路径 - RISC-V实现从标量到矢量再到矩阵的演进 完整覆盖DPU标量控制/可矢量化数据包处理/矩阵密集型任务需求 [9] - 通过融合标量/矢量/矩阵可编程性提供跨越式发展途径 突破ARM标量核心加固定加速器的传统模式 [10] 行业竞争格局重塑 - 超大规模计算企业渴望架构替代方案以优化功耗/性能和自主权 [4][10] - 开放生态系统避免单一供应商垄断 培育多条发展路径 [10] - 主要供应商可设计针对DPU架构优化的定制CPU 无需依赖ARM许可条款和路线图 [10] - AI驱动数据中心架构发展 DPU从网络功能扩展至协调计算/存储/AI流程的全新定位 [11]
英特尔这颗芯片,太猛了
半导体行业观察· 2025-08-27 09:33
X86服务器CPU市场竞争格局 - AMD在2025年上半年X86服务器CPU市场收入份额超过40%,出货量份额超过27% [2] - 英特尔预计在2025年仍将占据X86服务器CPU近60%收入份额和超过72%出货量份额 [2] - 超大规模计算和云构建商加大自研Arm服务器CPU使用力度,加剧X86服务器插槽竞争 [3] 英特尔下一代处理器技术突破 - 英特尔计划2026年推出基于18A制造工艺的Clearwater Rapids至强7 P核处理器和Clearwater Forest至强7 E核处理器 [2] - 18A工艺采用RibbonFET环绕栅极3D晶体管,较英特尔3工艺同功耗性能提升15%,同面积芯片密度提升30% [7] - 18A工艺结合PowerVia背面供电技术,实现晶体管尺寸缩小和功耗降低 [7] - Clearwater Forest采用3D Foveros芯片堆叠技术,通过混合键合连接18A工艺核心芯片与英特尔3工艺基座芯片 [12] 处理器架构性能提升 - Darkmont E核心每时钟指令数较Sierra Glen核心提升17% [16] - 核心解码能力从每周期6条指令提升至9条指令,增幅达50% [18] - 乱序执行引擎宽度从5条指令扩展至8条指令,执行端口数量提升50%至26个 [20] - 内存子系统每周期执行3次加载(提升50%)和2次存储 [22] - 二级缓存带宽达到200GB/秒,是前代产品的两倍 [16] 平台级性能表现 - 双插槽Clearwater Forest平台配备576个核心和1,152MB L3缓存 [24][27] - 平台内存带宽达到1,300GB/秒,配备12个DDR5内存通道运行于8GHz [26] - 提供96条PCI-Express 5.0通道,总带宽1,000GB/秒,其中64条可分配予CXL设备 [26] - 双处理器间通过144条UPI互联链路实现576GB/秒带宽 [26] - 理论浮点运算能力达到59万亿次,具体精度规格未明确披露 [27] 半导体制造工艺演进 - 英特尔18A工艺标志着从FinFET向RibbonFET晶体管架构的根本转变 [7] - 台积电2纳米N2工艺已被AMD用于Zen 6核心流片,预计2026年量产 [4] - 英特尔3D封装技术面临良率挑战,导致Diamond Rapids产品延期至2026年 [3]
半导体营收,直逼1000000000000美金
半导体行业观察· 2025-08-27 09:33
全球半导体市场增长预测 - Counterpoint Research预计全球半导体收入将从2024年到2030年翻一番,达到1万亿美元以上 [1] 增长的核心驱动力:人工智能转型 - 人工智能转型为GenAI、Agentic AI和Physical AI应用构建基础设施和消费终端,是半导体收入增长的主要动力 [1] - 主要的催化剂是先进AI服务器基础设施的发展,其驱动力来自未来AI应用需求的持续快速增长 [3] - 人工智能的大部分价值目前集中在半导体领域,例如超大规模企业、二级云计算提供商以及构建AI基础设施的企业 [4] - 芯片是人工智能经济的支柱,为从云平台、模型、框架到应用程序的一切提供支持 [4] 人工智能发展的三个阶段 - 第一阶段:基础设施部署推动代币消费增长,市场从基于文本的基本应用转向结合文本、图像、音频和视频的多模态GenAI [3] - 第二阶段:支持Agentic AI应用代币生成的指数级增长,从复杂的对话式AI和语义搜索到完全集成的多媒体内容创建,对云端和边缘计算能力、内存和网络能力提出巨大需求 [3][4] - 第三阶段:支持物理人工智能(Physical AI)的出现,推动人形机器人、工业机器人和车辆等自主机器的崛起 [3][4] 人工智能市场的收入结构演变 - 2024年,人工智能市场主要由硬件驱动,约80%的直接收入来自基础设施和边缘计算的半导体 [5] - 市场正在进入一个由人工智能代币经济驱动的新阶段,这将催生一个类似于过去十年移动应用经济增长的应用和服务生态系统 [5] - 下一波人工智能浪潮将释放的最重要价值将是通过提高劳动力生产率和广泛的自动化实现的大幅运营成本节约 [5]
伟大的Linux,面世34周年
半导体行业观察· 2025-08-26 09:28
Linux操作系统发展历程 - 1991年8月25日芬兰计算机科学系学生Linus Torvalds首次公开宣布开发免费操作系统项目 最初被描述为"业余爱好"且规模不及GNU [2] - 初始开发针对Intel 386和486克隆机平台 项目自1991年4月启动 首个0.01版本于1991年9月17日正式发布 [6][7] 技术特性与命名渊源 - 早期Linux具备多线程文件系统特性 且明确不包含Minix代码 但受限于Intel x86平台架构导致不可移植 [6] - 操作系统原名"Freax"为自由(free)与X的混合词 因FTP服务器管理员认为名称不具吸引力 在未获授权情况下于1991年9月1日更名为"Linux" [7] 行业影响与发展前景 - 经过34年发展 Linux成为自由软件社区的重大成功案例 其极佳可移植性与适应性支撑了各类设备生态系统 [7] - 随着Windows 10退役及SteamOS向桌面端扩展 2025年可能成为Linux在消费级市场实现突破的关键年份 [7]
自研AI芯片,可行吗?
半导体行业观察· 2025-08-26 09:28
文章核心观点 - 互联网公司自研AI芯片面临根本性挑战 核心矛盾在于芯片行业本质是制造业而非纯数字产业 需要完全不同的生产资料掌控能力、供应链管理能力和组织文化[4][5][7] - Google TPU成功的关键在于其能融合制造业与数字产业的差异化文化 而其他OTT企业缺乏这种包容性[4][7] - 自研芯片的真正价值不在于短期ROI计算 而在于通过提升研发效率缩短周期来应对AI技术的快速迭代 传统芯片开发周期需24-36个月无法匹配AI发展速度[8][10][12] 行业本质认知 - 芯片行业是伪装成高科技的制造业 最大特征是需要物理生产资料和极长产业链条 与OTT轻资产模式根本不同[5] - 芯片设计数字化部分只是中间产物 最终产品是硅/铜/铝混合的物理实体 涉及下单/备货/库存/检验等实体操作[6] - 制造业反馈环路长达三年才能看清成败 需要几代人积累制造流程经验 与OTT快速组织变化格格不入[6][7] 研发效率瓶颈 - 传统芯片开发流程中从Coding Done到GDS需4个月 GDS到硅片需4-6个月 总周期8-10个月[8][10] - 实际从开工到客户上电需36个月以上 这种速度无法适应AI技术快速演变[10][12] - 现有流程强求100%成功率反而阻碍创新 在不确定环境中应采用饱和攻击策略 接受30%成功率但多项目并行[12] 成本结构分析 - 自研AI芯片初始投资需20亿人民币起步 若量产1万颗则单芯片成本摊薄至20万元 量产10万颗成本仍达2万元[11] - 国内能单代芯片量产超10万颗的企业寥寥无几 盈利模式面临根本挑战[11] - 成本计算不应简单对比Nvidia采购价 需考虑团队长期价值观维持难题 内部服务团队易出现礼乐崩坏[7][11] 破局可能性 - 特斯拉和造车新势力启示在于效率革命 雷军半年推新款对比大众两年周期形成降维打击[12] - 潜在突破点在于将Coding Done到GDS周期从4个月压缩至1个月 去除可靠性测试等传统环节[10][12] - OTT企业擅长系统解构能力可应用于削减后天增加的流程复杂度 但需跨越制造业明坑[9][11][12]
英特尔发出警告,特朗普一意孤行
半导体行业观察· 2025-08-26 09:28
美国政府入股英特尔交易 - 美国政府收购英特尔10%股份 凸显公司战略重要性[2] - 交易可能引发海外客户不安 因与特朗普贸易政策关联[2] - 英特尔76%营收依赖海外市场 2024财年531亿美元总营收中中国大陆占29% 美国占24.5%[2] 交易条款与结构 - 协议包含两步融资:首步57亿美元为芯片法案加速付款 第二步32亿美元关联安全飞地计划[3] - 英特尔发行最多4.33亿股股票 首笔资金到位后发放2.75亿股 1.59亿股托管于安全飞地资金条件满足后[3] - 若未获全额安全飞地资金 对应股份一半归政府 另一半取消[3] 市场与财务影响 - 英特尔股价本月上涨28% 受协议推动[6] - 公司第二季度亏损29亿美元 每股亏损0.67美元 营收129亿美元同比持平[7] - 交易提供即时现金57亿美元 未来付款与政府项目对齐[3] 潜在风险与挑战 - 政府持股可能使英特尔受外国额外法规限制 如外国补贴法[2] - 可能引发投资者 员工 客户 供应商或竞争对手的负面反应[2][3] - 未完成全面财务 税收和会计影响评估 或存在后续问题[3] 政治与行业反应 - 特朗普称交易"零成本" 价值110亿美元 并表示将进行更多类似交易[5][6] - 白宫经济顾问称可能在其他行业推行类似交易[6] - 部分立法者反对交易 认为芯片法案未授权政府购股 可能产生利益冲突[7]
日本芯片设备业,推动大合并?
半导体行业观察· 2025-08-26 09:28
行业现状与挑战 - 日本芯片工具真空部件制造商尚未从人工智能热潮中获益 尽管AI刺激英伟达芯片等硬件投入数十亿美元 [2] - 日本真空部件国内销售额不足1000亿日元(6.8亿美元) 属于利基但关键领域 [2] - 行业存在数十家专业公司竞争 市场高度分散 [2][3] - 小型供应商面临利润率压力 难以要求涨价 客户利润率达30%而部分供应商利润率不足10% [3][4] 公司战略与行动 - 丸前株式会社以90亿日元收购同行KM铝业公司 推动行业整合 [2] - 公司年收入约50亿日元(3450万美元) 在日本真空腔体市场占有7%份额 [3] - 营业利润率显著改善 截至5月的九个月达20% 上一财年仅3% [3] - 潜在目标包括芯片制造最终阶段组件工具商及树脂技术公司 同时关注航空航天和国防领域 [2] 整合障碍与竞争环境 - 私营竞争对手获地方银行强力支持 拒绝出售意愿普遍 [4] - 客户芯片设备公司反对供应商联合 因真空组件定制化可能泄露芯片制造技术 [4] - 外国公司(如台湾国巨)竞购日本资产 寻求获取日本数十年积累的芯片技术 [4] - 丸前拟采用控股结构构建防火墙 解决客户对商业机密泄露的担忧 [4]
印度的芯片狂想曲
半导体行业观察· 2025-08-26 09:28
印度半导体生态系统发展现状 - 印度自2021年12月重启半导体建设计划,四年内批准十个项目,涵盖晶圆制造、封装测试等环节,包括塔塔电子100亿美元晶圆厂和美光科技27.5亿美元ATMP工厂 [1] - 2025年8月新增四个项目,涉及奥里萨邦封装厂、安得拉邦制造厂及旁遮普邦现有工厂扩建,部分初始100亿美元资金已到位但具体金额未披露 [1] 中印半导体战略差异 - 中国采取内向型技术自力更生策略,受美国出口管制刺激,重点自主研发瓶颈技术 [3][5] - 印度吸引美国支柱企业(如苹果、特斯拉)迁移供应链生态,同时鼓励国内企业投资小型制造和封测代工厂 [3] 全球贸易环境与印度机遇 - 印度未加入RCEP或CPTPP等多边协定,但凭借美国贸易政策受益成为前六大回流经济体之一 [6] - 2025年4月新电子元件制造计划可能推动上游半导体投资,马来西亚和新加坡同期表现突出 [6] 联邦与邦级政策协同机制 - 联邦ISM机构审批项目后,各邦(如古吉拉特邦、北方邦)竞相提供额外激励,仅奥里萨邦允许未获批项目享受补贴 [7] - 该模式类似欧盟"欧洲芯片计划"和美国《芯片与科学法案》的协同机制 [7] 各邦竞争格局与成功因素 - 古吉拉特邦因首个专项半导体政策、900平方公里Dholera SIR产业集群及毗邻港口优势成为投资聚集地 [9][10] - 美光科技2023年投资带动供应商生态系统迁移,验证印度半导体商业环境成熟度 [10] - 北方邦虽提供100%成本补贴上限但未吸引大型企业,表明财务激励非唯一决定因素 [11] 技术发展与创新方向 - 印度拥有全球20%芯片设计劳动力,但多遵循跨国公司规范,本土知识产权创造仍不足 [13] - 需聚焦医疗诊断设备、神经接口等新兴领域的技术研发,推动芯片设计与软件集成创新 [12][13] 当前成效与未来挑战 - ISM通过100亿美元资金引导价值链各环节项目,构建弹性供应链而非全生态系统 [14] - 印度半导体供应链从零起步四年后实施效果显著,但需应对区域扩展和价值链提升挑战 [14]
一文看遍热门芯片,Hot chips 2025首日盘点
半导体行业观察· 2025-08-26 09:28
高性能RISC-V处理器Cuzco设计 - Condor Computing开发首款高性能RISC-V核心Cuzco 团队规模仅50名工程师[4] - 设计目标为在相同功耗范围内提供最高性能 符合RISC-V RVA23规范并支持矢量指令[6][14] - 采用12级乱序执行流水线 配备256条目重排序缓冲区(ROB)和8条执行流水线[9][12] - 核心微架构采用基于时间的指令调度技术 通过硬件编译优化指令排序 已申请超过10项专利[16][18][19] - 性能表现方面 SPECint2006测试中每时钟性能达17.5分 较母公司AX65核心提升近一倍[30][31] - 产品形态为最多8核心配置 包含私有L2缓存和共享L3缓存 通过宽CHI总线连接[33] PEZY公司MIMD架构创新 - PEZY Computing专注于多指令多数据(MIMD)CPU设计 采用独特的多线程处理方案[35][38] - SC4s产品采用台积电5nm工艺 芯片面积556平方毫米 集成2048个处理单元(PE)和16384个线程[64][67] - 内存系统配备4个HBM3设备 提供3.2TB/s带宽和96GB容量 内部总线读写带宽分别达12TB/s和6TB/s[72][80] - 系统配置采用AMD EPYC 9555P主机CPU和4个PEZY-SC4s加速卡 90节点系统总计算能力达8.6PFLOPS[84] - 能效表现显著提升 与SC3设计相比DGEMM工作负载功率效率提高2倍以上 Smith-Waterman算法性能提升近4倍[87][90] - 下一代PEZY 5产品已启动设计 采用3nm或更先进工艺 预计2027年发布[92] IBM Power11架构演进 - Power11基于Power10架构优化 采用三星7nm工艺 重点提升速度而非密度[108] - 内存子系统升级为OMI架构 支持32个DDR5内存端口 传输速度达38.4Gbps 目标实现8TB DRAM和1TB/s以上带宽[117][118] - 集成AI功能 在Power10矩阵乘法引擎基础上进一步强化AI处理能力[102][105] - 采用硅中介层堆叠设计 专注于全系统堆栈优化 包括量子安全和系统更新部署[110][114] - 支持外部PCIe加速器 配备自有Spyre加速器技术[121] - 下一代Power Future正在开发中 重点解决带宽和芯片互连挑战[123] 英特尔Clearwater Forest处理器 - 采用英特尔18A工艺和3D封装技术 集成288个能效核心 专注多线程工作负载[125][128] - 架构改进包括前端解码宽度从6宽提升至9宽 后端乱序执行引擎每时钟周期操作数从5个增至8个[134][136] - 执行端口数量达26个 整数和向量执行吞吐量翻倍 存储地址生成能力提升[138] - 内存子系统L2未命中缓冲区容量增加一倍至128条目 二级缓存带宽达400GB/秒[140][142] - 采用3D芯片堆叠设计 CPU芯片位于基础芯片之上 基础芯片基于英特尔3.0工艺 IO芯片采用英特尔7.0工艺[144] - 能效表现显著提升 与Sierra相比机架级每瓦性能提高3.5倍[149] 微软Azure硬件安全创新 - Azure安全系统配备定制安全芯片 集成硬件安全模块(HSM) 支持AES和PKE加密加速[159][168] - 采用Caliptra 2.0开源硅信任根 总门数达1,640,145 包含ECC引擎(270,156门)和RISC-V处理器(117,796门)[176][179] - 安全架构从集中式转变为每服务器集成模式 降低功耗和尺寸要求[164][166] - 支持机密计算技术 保护多租户云环境中的使用中数据[171][173] - 系统规模覆盖70多个Azure区域和400多个数据中心 拥有3.4万名专职安全工程师[153] AMD RDNA 4 GPU架构 - 专注图形处理性能 对光线追踪和机器学习硬件进行重大更新[192] - 光线追踪性能提升约2倍 BVH吞吐量翻倍 增加专用硬件传输器和定向边界框技术[209][217] - 机器学习功能增强 支持FP8精度和结构化稀疏性 动态寄存器分配优化着色器性能[224][220] - 媒体引擎支持AV1编码B帧 显示引擎集成图像锐化功能 内存压缩降低结构带宽占用率25%[205][238] - 采用模块化设计 Navi 48 GPU可分割为更小变体 支持多实例GPU(MIG)功能[235][279] NVIDIA Blackwell架构特性 - 架构覆盖数据中心到移动端 专注FP4 ML计算以最大化性能[246][249] - 神经渲染技术利用机器学习生成帧 降低功耗最高达2倍[253][275] - 配备GDDR7内存 采用PAM3信号技术提高信噪比和时钟速度[266] - 着色器执行重排序技术保持SM满载 整数性能显著提升[260] - AI管理处理器协调图形和机器学习工作负载 支持通用MIG功能提升多客户端性能60%[271][283] Meta图像处理芯片技术 - 开发专用IC加速世界锁定渲染(WRL) 用于AR/VR眼镜应用[287][289] - Orion眼镜系统包含眼镜处理器和外部Puck 处理器采用5nm工艺集成24亿晶体管[299][303] - 显示处理器每眼配备独立芯片 使用片上SRAM存储 无外部存储器[305] - 计算协处理器处理计算机视觉和机器学习 包含57亿晶体管和LPDDR4X内存[308] - 系统注重低功耗设计 延迟敏感计算在眼镜端完成[297][301] Rebellions AI加速器 - REBEL-Quad加速器采用四个HBM3E接口 支持144GB内存 使用UCIe芯片互连技术[312][314] - 封装集成四个计算ASIC和四个硅电容器 基于三星SF4X和CoWoS-S技术[314] - 演示运行Llama 3.3 70B模型 输出速度达35.5毫秒/令牌[322][324] - 采用双PCIe Gen5 x16接口 可能支持PCIe Gen6以匹配行业趋势[314]
AMD CPU路线图,曝光
半导体行业观察· 2025-08-26 09:28
AMD移动CPU路线图泄露 - 西班牙笔记本电脑制造商泄露疑似AMD 2024-2027年移动CPU路线图 涵盖Zen 4、Zen 5和Zen 6微架构处理器[2] - AMD计划整合产品系列 在不同细分市场提供更一致用户体验 积极从英特尔手中夺取市场份额[2] 2024-2025年产品布局 - 顶级游戏笔记本电脑搭载锐龙9 9955HX3D、9955HX或9850HX "Fire Range"处理器 最高配备16个Zen 5核心[5] - 这些CPU本质是锐龙9000系列"Granite Ridge"处理器的BGA封装笔记本版本 将持续服务至2027年[5] 2026年产品迭代 - 代号Gorgon Point处理器将取代高端市场Ryzen AI 300系列"Strix Point"和"Krackan Point"以及Ryzen 8000系列"Hawk Point"[7] - Gorgon Point配备多达12个Zen 5核心和全新NPU NPU性能高达55 TOPS[8] - 采用4nm级制造技术 TDP可配置范围15W至54W 服务于多种类型笔记本电脑[8] - 基于Zen 4的Hawk Point 8C被推向低端主流市场 预计服役至2027年下半年[8] 2027年技术升级 - 代号"Gator Range"锐龙处理器基于Zen 6微架构 配备性能超过40 TOPS的NPU 支持所有Copilot+功能[6] - 基于Zen 6微架构的Medusa Point处理器采用3nm级制造技术 FP10封装 用于2027年高端笔记本电脑[6] - Medusa BB(Medusa Baby)CPU用于2027年下半年主流笔记本电脑[6] - 核心数量预计比前代芯片增加 因采用3nm级制造节点且英特尔竞品核心数大幅提升[7] - 支持Copilot+的NPU将于2027年出现在所有AMD处理器中(低端Ryzen 7020系列除外)[7] 入门级产品策略 - Ryzen 7020系列"Mendocino"处理器继续服务入门级市场 最多配备四个Zen核心和RDNA 2显卡[8] - 公司认为这些CPU与英特尔Twin Lake-N等产品相比具有足够竞争力 更换意义不大[8] 特殊产品线状况 - 路线图未列出Strix Halo处理器的任何替代品 这些部件具有终极内置GPU 幻灯片表明至少要到2027年底才会上市[6]