Workflow
半导体行业观察
icon
搜索文档
两年暴涨261%,博通一路狂飙
半导体行业观察· 2025-09-05 09:07
公众号记得加星标⭐️,第一时间看推送不会错过。 从股票市场上来看,博通过去几个月如同坐上了火箭。 Emarketer 分析师雅各布·伯恩 (Jacob Bourne) 表示:"在大型科技公司竞相推动模型训练和推理发 展的背景下,博通为云计算巨头提供的定制产品占据了有利地位。"他说:"虽然 Nvidia 的 GPU 仍 然是默认选择,但定制硅片可以带来利基性能提升,有助于突破瓶颈。" 从最近的财务数据来看,博通的这个工作完成得不错。 斩获100亿美元AI芯片订单 因为自4月触底以来,博通已上涨逾100%,公司市值增加约7300亿美元,并成为同期纳斯达克100指 数中表现第三好的成分股。而在今天公布了超过预期的财务数据以后,博通股价进一步飙升4%,直 接创下历史新高。 其实在过去两年,博通股价飙升了261%,成为全球第七大市值公司,市值达到1.4万亿美元,也是全 球第二大半导体公司,仅次于英伟达,领先于台积电。 诚然,从芯片公司角度看,博通拥有一切上涨的逻辑。作为生成式人工智能热潮的最大受益者之一, 博通拥有数据中心的超大规模客户正在寻找价格更高的英伟达芯片的替代品。博通帮助设计定制的人 工智能芯片。今年,博通推 ...
这颗芯片,还有机会吗?
半导体行业观察· 2025-09-05 09:07
文章核心观点 - 高性能计算在GenAI推动下走向主流 AI服务器加速器占全球系统支出的一半 GPU因通用性成为首选但非唯一选择 [1] - Pezy Computing专注研发高能效数学加速器 采用独特架构与GPU竞争 获日本NEDO资助 与富士通Monaka Arm CPU并行发展 [2] - Pezy-SC4s芯片采用5nm工艺 2048核心 24.6 TFLOPS FP64性能 3277 GB/s内存带宽 600W功耗 集成RISC-V主机核心 实现能效比41 GFLOPs/W [4][8][30] - 在基因组分析GATK测试中 Pezy-SC3性能达Nvidia H100的2.25倍 SC4预计达2.8倍 高精度能效比媲美Nvidia GPU [29][31] - 日本通过资助Pezy保障技术自主 应对GPU潜在供应风险 未来FugakuNext系统可能采用Pezy加速器 [31][32] Pezy Computing公司发展 - 公司成立15年 专注替代GPU的数学加速器 名称PEZY代表peta/exa/zetta/yotta度量级 体现HPC/AI领域雄心 [2] - 获日本新能源和工业技术发展组织(NEDO)资助 与富士通Monaka Arm CPU开发同属国家战略项目 [2] - 产品线从2011年Pezy-1持续迭代至2026年SC4s及2027年SC5s 工艺从40nm演进至3nm [4] 芯片技术演进 - Pezy-1(2012年): 40nm工艺 512核心 0.64 TFLOPS FP64 45W功耗 [4] - Pezy-SC(2014年): 28nm工艺 1024核心 0.75 TFLOPS FP64 100W功耗 首用于Top500/Green500超算 [4][5] - Pezy-SC2(2017年): 16nm工艺 2048核心 4.1 TFLOPS FP64 180W功耗 L3缓存增至40MB 增加FP16支持 [4][6] - Pezy-SC3(2020年): 7nm工艺 4096核心 19.7 TFLOPS FP64 470W功耗 增加HBM2显存 带宽1228 GB/s [4][7] - Pezy-SC3s(2021年): 7nm工艺 512核心 2.0 TFLOPS FP64 95W功耗 HBM2显存614 GB/s带宽 [4][7] - Pezy-SC4s(2026年): 5nm工艺 2048核心 24.6 TFLOPS FP64 600W功耗 HBM3显存3277 GB/s带宽 集成RISC-V主机核心 [4][8] - Pezy-SC5s(2027年): 3nm工艺 4096核心 41.2 TFLOPS FP64 900W功耗 HBM3E显存6144 GB/s带宽 FP8性能329.6 TFLOPS [4][30] 架构设计特点 - 采用SPMD(单程序多数据)架构变体 支持细粒度多线程 每个PE含8线程 通过显式线程调度避免分支预测和乱序执行 [11][12] - 缓存层次设计: PE具L1指令/数据缓存(各4KB)和暂存器(24KB) 四个PE组成"村落"共享缓存 十六个村落组成"城市"共享L2缓存(32KB指令/64KB数据) 八个城市组成"州"共享64MB L3缓存 [18][22] - 自定义交叉总线提供12 TB/s读取带宽和6 TB/s写入带宽 连接所有处理单元 [22] - 集成RISC-V"Rocket"核心运行Linux系统 减少对外部X86主机依赖 [8][23] 系统与软件生态 - SC4s系统板采用AMD Epyc 9555P主机 配备400Gb/s NDR InfiniBand 四个SC4加速器通过PCIe连接 计划构建90节点测试系统 总计737280个PE 8.6 petaflops FP64性能 [25] - 自研软件堆栈支持PyTorch框架 已移植Google Gemma3、Meta Llama3、阿里巴巴Qwen2、Stable Diffusion 2和Hugging Face HuBert模型 [27][28] 性能对比与竞争优势 - GATK基因组分析: 四块SC3芯片33分钟/样本 八块Nvidia H100 GPU 37分钟/样本 SC3单芯片性能为H100的2.25倍 SC4预计达2.8倍 [29] - 能效比: SC4s达41 GFLOPs/W(FP64) 与Nvidia H200的47.9 GFLOPs/W(FP64)和B200的33.3 GFLOPs/W(FP64)相当 远高于B300的0.89 GFLOPs/W(FP64) [30][31] - 支持多精度计算: FP64/FP32/FP16/BF16(SC4s)及FP8(SC5s) 在非AI HPC模拟中提供比GPU更灵活编程模型 [8][31] 行业战略意义 - 日本政府通过NEDO资助保障技术自主 应对GPU需求过高或出口限制风险 [31] - 未来FugakuNext超算(2029年)可能采用Pezy加速器作为Nvidia GPU的补充或替代 [2][32]
重磅,谷歌TPU,对外销售了
半导体行业观察· 2025-09-05 09:07
谷歌TPU业务战略转变 - 谷歌开始向外部数据中心供应其AI芯片张量处理单元,首次在自有设施以外的纽约数据中心为伦敦公司Floydstack部署TPU [2] - 此举被解读为谷歌数据中心扩张跟不上需求,或通过外部云公司拓展TPU客户群,从而成为英伟达的竞争对手 [2] - 谷歌此前仅通过其云端提供TPU,战略重点在于优化内部服务和降低GPU采购成本 [3] TPU技术优势与生态系统 - TPU是专为AI运算打造的定制芯片,在处理深度学习所需的矩阵运算时拥有低功耗和高速优势 [3] - 谷歌发布了包含TPU硬件、JAX软件及模型流水线解决方案Pathway的完整AI开发流程,使整个流程可在其生态系统内完成 [3] - 第六代Trillium TPU需求强劲,第七代Ironwood TPU每芯片提供4,614 TFLOPS运算能力和192GB HBM容量,是Trillium的6倍,频宽达7.2Tbps,是Trillium的4.5倍,效能功耗比是Trillium的2倍 [7][8] 市场动态与竞争格局 - 过去六个月,围绕谷歌云TPU的开发者活动增长了约96% [4] - 英伟达在AI训练GPU市场份额高达80-90%,在数据中心市场份额高达92% [5] - 谷歌TPU被视为超越中国企业的英伟达芯片最佳替代品,其业务若独立估值可能高达9,000亿美元 [4][6][7] 合作伙伴与客户采用 - Alphabet目前仅与博通合作生产TPU,但正探索与联发科合作由其为Ironwood TPU代工 [8] - AI公司如Anthropic开始招聘TPU核心工程师,xAI在JAX-TPU工具改进下对TPU展现兴趣 [8]
从周期波动到全面进阶:AI浪潮下的存储新机遇——GMIF2025邀您共探破局之道!
半导体行业观察· 2025-09-05 09:07
行业转型趋势 - 存储产业正从周期驱动转向结构性增长 由AI大模型 海量数据与边缘智能加速落地推动[4] - 全球存储市场从容量扩张向更高性能 更高能效与系统协同跃迁 新一代内存与闪存产品快速演进[4] - 2025年H1全球半导体市场规模达3460亿美元 同比增长18.9% 其中半导体存储增长20%[4] 技术发展动向 - 存储技术趋势聚焦CXL Chiplet 近存计算等新型架构 加速从单点优化迈向系统协同[9] - AI应用创新覆盖AI服务器 AI手机 AIPC 智能汽车等前沿场景的存储创新需求[10] - 产业链协同涉及原厂 主控 解决方案厂商 封测 材料与设备企业共建技术市场双引擎[11] 生态与市场格局 - 全球生态联动需重塑供应链本地化 标准共建与跨境协作新范式[12] - 2025年第三季度存储产品价格持续上扬 企业级SSD和高速内存等高附加值品类涨势显著[4] - GMIF2025峰会将于9月24-25日在深圳举办 聚焦AI技术驱动下的存储突破与生态共建[6] 产业平台价值 - GMIF峰会具备交流 展示 合作 传播功能 是展示技术成果和拓展上下游合作的最佳窗口[21] - 对产业人士是把握趋势 链接资源的重要场域 对投资机构是预判行业拐点的信号源[21] - 对媒体与学界是掌握一手资讯 影响产业话语权的核心阵地[22]
瑞萨投资了一家芯片公司:英伟达挑战者
半导体行业观察· 2025-09-05 09:07
公司战略与市场定位 - 公司计划在2026年业务扩大 重点关注机器人和航空航天应用[4] - 公司预计2028年做好IPO准备 并考虑在美国上市[2][5] - 公司已通过股权和政府融资筹集近1亿美元 投资者包括日本瑞萨电子和SBI Holdings[5] 技术优势与产品特性 - 公司芯片Sakura-II在计算能力相当情况下 能效比英伟达H100芯片高出四倍[5] - 芯片设计通过减少内存访问降低能耗 解决"内存墙"技术问题[6] - 芯片可直接在边缘设备(如卫星/智能手机)处理AI工作负载 无需依赖数据中心[2] 商业合作与应用场景 - 公司与美国国防部下属国防创新部门签订原型合同 系日本半导体公司首次加入该项目[3] - 与日本月球任务初创公司ispace合作探索低功耗AI引导的月球着陆和导航[3] - 正与"美国大型航空航天公司"测试芯片在商用飞机运行AI的功能[3] 行业竞争格局 - 边缘AI芯片市场被认定为完全开放的竞争环境 英伟达未占据主导地位[2] - 公司定位为无晶圆厂芯片设计企业 商业模式类似英伟达但规模较小[5] - 芯片专注于特定AI部署流程 与英伟达通用型芯片形成差异化竞争[5]
SEMI:芯片设备销售大增24%
半导体行业观察· 2025-09-05 09:07
全球半导体设备市场整体表现 - 2025年第二季度全球半导体设备营业额达到330.7亿美元,同比增长24%,环比增长3% [2] - 2025年上半年全球半导体设备营收超过650亿美元 [5] - 预计2025年全球半导体设备销售额将创下1255亿美元的新纪录,同比增长7.4% [7] - 预计2026年销售额将进一步增长至1381亿美元 [7] 各地区市场表现 - 中国大陆地区2025年第二季度设备账单额为113.6亿美元,环比增长11%,但同比下降7% [6] - 中国台湾地区2025年第二季度设备账单额为87.7亿美元,环比大幅增长24%,同比激增125% [6] - 韩国地区2025年第二季度设备账单额为59.1亿美元,环比下降23%,但同比增长31% [6] - 日本地区2025年第二季度设备账单额为26.8亿美元,环比增长23%,同比增长67% [6] - 北美地区2025年第二季度设备账单额为27.6亿美元,环比下降6%,同比增长15% [6] - 欧洲和世界其他地区市场表现相对疲软,同比分别下降23%和28% [6] 细分市场增长驱动与预测 - 晶圆厂设备(WFE)市场预计2025年增长6.2%,达到1108亿美元,2026年将进一步扩大至1221亿美元 [10] - 代工和逻辑应用预计2025年增长6.7%至648亿美元,2026年再增长6.6%,受先进节点和2nm GAA生产需求推动 [11] - 半导体测试设备销售额预计2025年飙升23.2%,达到93亿美元 [10] - 组装和封装设备销售额预计2025年增长7.7%,达到54亿美元 [10] - NAND设备市场预计2025年增长42.5%至137亿美元,2026年达150亿美元,由3D NAND创新推动 [11] - DRAM设备市场预计2025年增长6.4%,2026年增长12.1%,受人工智能领域HBM需求强劲驱动 [11] 行业增长主要驱动力 - 市场增长主要由前沿逻辑、先进高带宽存储器相关DRAM应用以及亚洲出货量增长推动 [2] - 人工智能推动的芯片创新需求正在驱动产能扩张和尖端生产投资 [10] - 芯片制造商持续投资产能以支持人工智能浪潮的先进逻辑和内存创新 [5]
陈大同丨芯片往事(续)
半导体行业观察· 2025-09-04 15:31
中国半导体产业发展历程 - 中国半导体产业产值从2000年至今成长上千倍 经历了从低谷到浴血重生的过程[11] - 2014年国务院发布《国家集成电路产业发展推进纲要》 同年成立1280亿元国家集成电路产业基金 标志着产业进入春天[10] - 大基金采用政府资本25%与社会资本75%结合的模式 开创政府引导与市场化运作相结合的集成电路产业投资新路径[10] 半导体产业突破性进展 - 半导体制造代工产能急剧增加 大大缓解了困扰产业多年的产能瓶颈[10] - 80%的02专项支持过的初创企业获得大基金支持 设备材料产业链国产化突飞猛进[11] - 先进工艺从14/12纳米进入到7/6纳米以下 FinFET技术不断取得突破[11] - 长江存储和合肥长鑫分别在NAND FLASH与DRAM领域实现突破 补齐半导体存储领域短板[11] - 2019年科创板设立催生数百家半导体上市公司 各细分领域龙头企业纷纷出现[11] 风险投资行业发展 - 硬科技风险投资2005年左右从硅谷传播到国内 最初一批VC如北极光创投 红杉中国 金沙江创投等都起源于硅谷VC支持[4] - 2008-2014年是半导体投资的严冬 投资半导体的VC屈指可数[12] - 元禾璞华团队管理基金规模超过160亿元 已投资超过200家创业公司 其中上市公司超过50家[13] - 2020-2022年元禾璞华每年上市公司超过10家 连续5年在中国权威PE榜单中名列前茅[13] 豪威科技并购与转型 - 2016年豪威科技总估值19亿美元完成并购 其中贷款8亿美元 股本金11亿美元[27] - 豪威科技采用"设计+代工制造"模式 但面临台积电产能瓶颈和高毛利定价的竞争劣势[33] - 虞仁荣接手后净利润从2017年3亿多元增长到2025年30多亿元[45] - 2019年韦尔半导体成功并购豪威科技和思比科 市值一度接近3000亿元 成为芯片设计第一股[45] 中概股回归浪潮 - 2013年清华紫光全资收购展讯通信 开创半导体中概股通过并购退市回归国内的先河[16] - 之后二年内半导体中概股公司几乎全部回到国内 包括澜起科技 锐迪科等[16] - 利用美中两国半导体市盈率之差 通过资本运作可实现三倍以上获利[17] 产学研结合与教育投资 - 虞仁荣捐款300亿元创立宁波东方理工大学 对标MIT和斯坦福大学[49] - 大学规划十年内在校生规模一万人左右 本硕博比例为4:3:3[56] - 截至2025年8月已联合招收博士生447人 正式签约创校教授100余人 其中院士16名[56] - 2025年首次招收74名本科生 最低录取分数线656分 在浙江省仅次于浙江大学[58] 本土化战略实施 - 豪威科技80%销售额在国内 但产品定义在硅谷 命中率不到40%[40] - 虞仁荣接手后砍掉三分之二研发项目 集中资源于客户急需且有竞争力的产品[43] - 与华虹达成战略合作 产能从每月2000片提高到15000片[43] - 与中芯北方开展背照式CIS工艺联合开发 半年时间开发成功并实现量产[44] - 收购思比科公司填补低端市场短板 利用其极低开发成本和高效率优势[45]
限制外企在中生产芯片,美国的最终目的
半导体行业观察· 2025-09-04 09:24
美国对台积电等芯片制造商出口豁免政策的撤销 - 美国撤销台积电、SK海力士和三星的"已验证最终用户(VEU)"快速出口特权 从12月31日起生效 向台积电南京工厂运送美国产芯片制造工具需获得出口许可证[2] - VEU特权取消政策同时适用于韩国内存芯片制造商SK Hynix和三星 这两家公司均在中国运营存储芯片工厂[2] - 美国商务部工业和安全局宣布为所有外国半导体制造商关闭VEU"拜登时代漏洞" 表明政策全面收紧[2] 政策调整的具体实施方式与影响评估 - 美国商务部打算批准出口许可证申请 允许前VEU参与者在中国运营现有制造设施 但禁止在中国扩大产能或升级技术[3] - 台积电南京工厂对公司总收入的贡献不足3% 占全球产能很小部分 因此政策变化对台积电财务影响"应该很小"[3] - 台积电在中国拥有两家制造工厂 分别位于上海和南京 其中南京工厂更为先进 使用包括应用材料公司和KLA公司在内的美国芯片设备供应商硬件[3] 政策背景与战略意图分析 - 政策变化反映华盛顿加强对中国出口半导体设备和技术的控制 强化美国对中国芯片生产的控制力[3] - 特朗普政府致力于堵塞出口管制漏洞 特别是那些使美国企业处于竞争劣势的漏洞[3] - 从长远看 潜在目标是限制企业扩大在中国供应链足迹的能力 特别是在半导体等战略领域[4] 相关政策动态与市场反应 - 近期VEU逆转可能令人意外 因特朗普政府此前宣布将放松对部分美国人工智能芯片出口的管制[4] - 美国政府曾废除拜登时代的人工智能扩散规则 可能导致先进人工智能芯片出口管制扩大[4] - SK海力士和三星股价受VEU消息影响下跌 而台积电在VEU逆转消息传出后股价持平[5] 企业应对措施与战略调整 - 台积电正在评估形势并采取适当措施 包括与美国政府沟通 致力于确保南京工厂的不间断运营[2] - 台积电、SK海力士和三星今年已对其美国制造计划进行新的投资 响应特朗普政府通过关税威胁吸引半导体供应链转移至美国的努力[4]
关键CXL MXC芯片,澜起发布并送样
半导体行业观察· 2025-09-04 09:24
产品发布与技术规格 - 澜起科技推出基于CXL 3.1 Type 3标准设计的内存扩展控制器芯片M88MX6852 并已向主要客户送样测试[1] - 芯片采用PCIe 6.2物理层接口 支持最高64 GT/s传输速率(x8通道) 可拆分为2个x4端口以适应不同应用场景[4] - 内置双通道DDR5内存控制器 支持速率达8000 MT/s 显著提升主机CPU与后端内存模块数据交换效率[4] - 集成双RISC-V微处理器 分别作为应用处理单元和安全处理单元 支持动态资源配置与硬件级安全管理[4] - 采用25mm x 25mm紧凑型封装 兼容EDSFF(E3.S)和PCIe插卡形态 适用于服务器及边缘计算环境[5] 技术优势与行业意义 - 通过CXL内存池化技术实现内存资源弹性分配 降低数据中心总体拥有成本(TCO)[5] - 芯片全面支持CXL.mem和CXL.io协议 为下一代算力基础设施提供内存池化与共享基础[6] - 高带宽与低延迟特性突破传统内存架构性能瓶颈 满足云计算资源池化需求[5][6] 生态合作与行业反馈 - 三星电子认可芯片的高带宽与内存池化能力 强调其与三星CXL内存解决方案的协同效应[6] - SK海力士称赞芯片符合CXL 3.1标准 认为产品将对下一代系统发展产生重要影响[7] - AMD指出该技术有助于构建异构内存架构 降低数据中心TCO并加速AI场景应用[9] - 英特尔肯定芯片对可扩展内存架构的推动作用 强调其拓展CXL生态系统的价值[10]
AWS科普:什么是芯片?
半导体行业观察· 2025-09-04 09:24
AWS芯片战略与设计理念 - 公司自2015年收购Annapurna Labs后持续为数据中心自研芯片 采用垂直整合和系统优先的开发模式 硬件与软件工程师在芯片设计至服务器部署全流程协作[2] - 芯片开发目标是为特定工作负载定制化设计 而非先构建芯片再集成系统 以此提升性能效率[2] 芯片基础原理与特性 - 计算机芯片由硅基半导体材料构成 内含电子电路 作为电子设备的核心决策单元 不同芯片设计目标差异显著(如智能手机芯片侧重多功能与续航 AI芯片专注数据处理)[4] - 芯片性能依赖超高速数据传输能力 架构需优化组件布局以最小化信息交换距离 即使原子级长度误差也可能导致项目延误数月[4][5] - AWS Trainium芯片专为机器学习训练设计 每秒可完成数万亿次计算 单个芯片计算量相当于人类计数31700年[5] Trainium芯片架构设计 - 芯片设计类比城市规划:脉动阵列作为"市中心" 由数千个计算单元组成网格 以节律性脉动模式并行处理数据 执行浮点乘法和累加计算(MAC运算)[6][7][9] - 数据通过专用路径(数据总线)传输 高流量区域采用"高速公路"式宽总线 低流量区域使用"小巷"式窄总线 工程师需优化路径避免信息瓶颈[11] - 存储单元作为"外围区域"战略布局 频繁访问数据靠近计算核心 中介层位于芯片底部 建立计算核心与内存间电通路 管理电力传输与数据流[13][15] 系统级集成与扩展 - 单台Trainium服务器容纳16块芯片 4台服务器互联构成UltraServer系统 实现64芯片协同工作 显著加速复杂计算[15] - 数十万芯片跨数据中心互联形成全球最强AI训练计算机之一 支撑生成式人工智能发展[15]