Workflow
半导体芯闻
icon
搜索文档
CXL,停滞不前
半导体芯闻· 2025-06-30 18:07
CXL内存技术商业化停滞 - Compute Express Link (CXL)内存技术量产准备已完成 但需求不足导致商业化停滞[1] - 三星电子和SK海力士在CXL和PIM技术商业化方面持续受阻 三星原预计2023年下半年CXL市场激增但客户质量认证未完成 SK海力士PIM技术因生态系统延迟未进入产品阶段[1] - 行业专家强调需建立技术生态系统基础 预测AI内存需求结构将逐渐多元化[1] HBM技术主导市场影响 - 高带宽存储器(HBM)需求强劲 主要受NVIDIA加速器产品推动 封装和键合设备订单集中于HBM发展[2] - HBM的强势推迟了CXL和PIM技术的应用 后者本可在能效和可扩展性方面补充HBM[2] - NVIDIA在AI数据中心GPU市场占据92%份额(2023年数据) 使AMD和博通等竞争对手短期内难以追赶[2] 技术竞争格局变化 - 中国企业技术进步迅速 政府补贴可能推动其率先实现CXL和PIM技术商业化 改变全球竞争格局[2] - 行业呼吁政府通过国家项目支持技术示范基地 确保技术持续发展避免因需求不足导致落后[2] 下一代内存技术前景 - CXL和PIM技术虽具备量产条件 但缺乏客户采用条件阻碍进程 需构建生态系统应对未来机遇[3] - 行业处于等待状态 预期技术范式转变可能使CXL/PIM等下一代方案超越HBM现有方案[3]
HBM 4,三星拼了
半导体芯闻· 2025-06-30 18:07
如果您希望可以时常见面,欢迎标星收藏哦~ 来 源: 内容来自 technews 。 根据韩国中央日报报导,韩国三星正加速其位于京畿道平泽的晶圆厂建设,此计划代表着其在经历 数月新厂建设停滞后,三星准备在高频宽频记忆体(HBM)市场中,重新夺回被SK 海力士(SK hynix)和美光(Micron)抢占的市场占比。 报导指出,过去数月,三星电子已陆续获得平泽市政府颁发的关键核准,尤其针对其P4 厂房, 2025 年已取得多个临时使用许可,最近一次是在6 月初获准。这些许可让三星得以在全面竣工 前,对部分场地进行有限度使用,包括安装设备、进行测试营运或允许受限的工作人员进入。 自2024 年初以来,受芯片需求疲软和内部资本配置考量影响,P4 以及邻近的P5 厂房的建设曾一 度暂停。然而,近期P4 厂区的活动显示,三星正积极扩大生产规模,这与其透过下一代HBM4 产 品重夺记忆体市场领导地位的目标高度一致。而且,为了支持HBM4 的生产,并提升目前约40% 的良率,三星正加码投资,以扩张平泽二期与四期以及华城的17 号线的产能。尽管三星电子发言 人拒绝对此计划发表评论,但市场普遍认为这是其争夺HBM4 市场龙头的关 ...
科技巨头,“反击”英伟达
半导体芯闻· 2025-06-27 18:21
行业格局变化 - 长期主导AI芯片市场的英伟达正面临谷歌、Meta等科技巨头的强势反击,这些公司为降低对英伟达芯片的依赖正加快自研ASIC芯片步伐 [1] - 野村证券预测谷歌2024年TPU出货量150-200万颗,亚马逊AWS ASIC出货量140-150万颗,合计接近英伟达AI GPU年出货量(500-600万颗)的一半 [2] - 业内普遍预测2025年ASIC总出货量将超过英伟达AI GPU,当前AI服务器市场中英伟达份额超80%,ASIC占比仅8%-11%但增速迅猛 [2] ASIC技术优势 - ASIC是为特定AI服务设计的专用芯片,放弃GPU通用性以提升电力效率和成本控制,在相同计算任务下可比GPU节省30%-50%的总体拥有成本(TCO) [1][3] - 谷歌TPU在单位电能下的性能达英伟达GPU的3倍,自研芯片还能规避供应链干扰确保服务与芯片供给同步 [3] - 摩根大通预计2024年全球AI ASIC市场规模达300亿美元(41万亿韩元),未来几年年均增长率超30% [4] 科技巨头动态 - 谷歌2016年率先发布TPU并广泛应用,Meta计划2024Q4推出性能对标英伟达下一代GPU的ASIC芯片"MTIA T-V1",2027年将推出功耗达170kW的"MTIA T-V2" [4][5] - Meta目标2024-2025年出货100-150万颗ASIC,但台积电CoWoS先进封装产能仅30-40万颗,面临产能瓶颈 [5] - 微软、亚马逊等科技巨头也加入ASIC研发战局,形成对英伟达的围剿态势 [4] 英伟达应对策略 - 英伟达开放专有NVLink通信协议,允许其他公司CPU/ASIC与其GPU集成,试图防止客户彻底脱离其生态 [6] - CUDA软件生态系统仍是英伟达核心壁垒,该平台使AI开发效率显著提升,短期内难以被替代 [6] - 半导体业内人士认为科技巨头降低对英伟达依赖是AI产业成熟的必经之路,将加速AI服务创新 [6]
英特尔前CEO基辛格:卸任是被逼的
半导体芯闻· 2025-06-27 18:21
基辛格职业转型 - 前英特尔CEO帕特·基辛格于2024年12月离职后加入硅谷投资基金Playground Global担任普通合伙人,负责半导体领域投资[1][2] - 普通合伙人在投资基金中承担资金分配和投资决策的核心角色[2] - 基辛格透露离职并非主动选择,暗示受第三方(推测为英特尔董事会)决策影响,未完成的计划可能涉及Intel Foundry代工业务投资[4] Playground Global投资策略 - 公司投资组合80%集中于硬件初创企业,显著区别于硅谷其他94%资金投向软件/SaaS的基金[5] - 创始团队包括硬件领域资深人士如Jory Bell(超便携电脑OQO创始人),体现对硬件创业的重视[2][3] - 投资方向聚焦于推动硬件技术革命的深科技领域,例如超导技术初创公司Snowcap Compute[1][5] 半导体行业技术趋势 - 基辛格提出未来计算将呈现传统计算机、AI计算机与量子计算机协同的"三位一体"形态[1] - 超导技术可能彻底改变半导体产业形态,Snowcap Compute为代表案例[1] - 行业投资热点存在明显分化,硬件创新领域仍有较大未被挖掘的空间[2][5]
算力需求井喷,英特尔至强6如何当好胜负手?
半导体芯闻· 2025-06-27 18:21
AI算力架构变革 - AI基础设施正从"GPU为中心"转向"多设备协同"的异构计算架构,传统GPU算力架构面临边际效能递减挑战[2][7] - 大模型负载需要CPU和GPU协同配合,涉及数据采集、清洗、标注、RAG等多个环节,要求企业同步升级两类算力资源[4][5] - 英特尔提出基于异构的四大解决方案:数据预处理CPU流水线(训练性价比提升10%)、投机执行CPU+GPU方案、KVCache QAT压缩优化(Qwen2.5-14B首词延迟下降)、稀疏感知MoE CPU卸载(DeepSeek-R1并发数从11提升至27)[6][7] 至强6处理器技术突破 - 至强6采用模块化设计,I/O与计算模块解耦,支持灵活扩展(最高288核),BIOS框架升级实现性能核与能效核动态调度[10] - 性能飞跃:内存带宽提升2.3倍(12通道DDR5达6400MT/s),PCIe带宽提升1.2倍,跨插槽通信提升1.8倍,支持CXL 2.0[12][13] - 内置硬件加速模块:单个QAT引擎可替代6.8个CPU核心,4个QAT模块释放32核资源;AMX加速器提升AI任务效率[13] - 场景性能:6900系列性能提升2倍,能效比提升1.4倍;云计算场景实现2倍核心密度,60%能效提升,30% TCO节省[13][14] 芯云协同实践 - 英特尔与火山引擎合作推出第四代ECS实例,CPU频率提升20%,网络存储带宽最大提升100%,IOPS/PPS提升30%[18][20] - RAG应用全链路优化:利用AMX加速器使任务耗时最多减少90%,CPU推理吞吐能力提升114%[20][22] - 双单路架构增强稳定性,新增支持Jumbo Frame、TDX机密计算及新型SSD云盘[20] 本地化部署方案 - 推出锐炫GPU+至强CPU的高性价比一体机,提供纯本地部署(数据不出域)和云边协同部署两种架构[24][27] - 锐炫Pro B60配备24GB显存,支持32K-128K token上下文窗口,通过EAP软件封装实现模型"零改造"迁移[28] - 集成Grafana监测系统,提供完整可观测性,支持与企业现有运维体系集成[28]
日本芯片巨头,亏惨了
半导体芯闻· 2025-06-27 18:21
瑞萨电子战略调整 - 公司将2030年销售额和市值目标推迟至2035年 原计划销售额翻倍至200亿美元 市值增长六倍至10万亿日元(约700亿美元) [1] - 股价因战略调整单日下跌12%至1735 5日元 [1] 电力半导体业务重组 - 终止碳化硅(SiC)电力芯片及部分高压硅功率半导体开发 原计划2024年初量产 [2] - 电力半导体业务主管即将离职 [2] - 保留其他硅功率半导体和氮化镓(GaN)产品线 [3] 市场环境变化 - 欧美电动汽车需求不及预期 因补贴结束和车价上涨 [3] - 中国厂商扩大晶圆和芯片产量加剧竞争 内部人士称SiC市场已成"红海" [4] - 与Wolfspeed的10年SiC晶圆采购合同面临2500亿日元亏损计提 相当于公司年均净利润的93% [4] 新战略方向 - 重点转向微控制器业务 计划通过芯片+软件捆绑销售提升系统价值 [5] - 目标使微控制器占公司销售额10%-15% [6] - 参考德州仪器模式 专注GaN产品与模拟芯片组合销售 避开直接竞争 [6] 财务指标调整 - 运营利润率目标下限下调5个百分点至25% [6] - 计划增加研发投入寻求新增长点 [7] - 德州仪器近五年平均营业利润率44% 为瑞萨两倍 市值是瑞萨七倍 [6] 管理层表态 - 总裁柴田英利称需"回归基础" 承认与中国对手正面对抗困难 [2] - 将当前战略调整定义为"有意识的暂停" 强调投资必要性 [7]
停更也不行?博通开始清算老客户!
半导体芯闻· 2025-06-27 18:21
博通对前VMware客户启动审计行动 - 博通于2023年11月停止销售VMware永久授权许可,强制推广包含多个产品的组合SKU,导致客户使用成本大幅上涨300%甚至更高[1] - 博通向拒绝订阅新服务的客户发送"停止及终止使用"信函,要求停止使用所有支持合同终止后的VMware更新(除零日漏洞补丁外)[1][3] - 2025年6月,博通开始对前VMware客户进行正式审计,荷兰某软件供应商收到审计通知,要求3个工作日内回应[3][4] 客户反应与潜在影响 - 被审计公司因续约成本过高(VMware Cloud Foundation和vSphere产品)已停止续约约1年,仅应用过1项关键安全补丁[3][8] - 审计可能导致被查企业面临巨大财务压力,甚至影响薪资谈判和裁员,IT及法务部门承受高压[5] - 部分公司声称即使完全停用VMware仍收到停止使用信函,另有公司在未收到警告信情况下直接被审计[7][8][9] 市场争议与监管呼声 - 博通690亿美元收购VMware的交易虽成功,但其强硬的合规策略引发客户反感,被指"法律和伦理存在问题"[9] - 行业出现要求监管博通行为的呼声,部分客户认为审计行动可能是虚张声势但已实际执行[9]
超40%的代理AI项目,将被取消
半导体芯闻· 2025-06-27 18:21
代理AI行业现状与挑战 - 到2027年底超过40%的代理AI项目将被取消,主要因成本上升、商业价值不明确或缺乏风险控制[1] - 目前多数代理AI项目处于早期实验或概念验证阶段,受炒作驱动且常被误用,忽视大规模部署的真实成本与复杂性[1] - 2025年调查显示19%企业已在自主型AI上重大投资,42%保守投资,8%未投资,31%观望或不确定[1] 代理AI市场乱象 - 厂商普遍存在"智能体洗牌"行为,将AI助手、RPA等现有产品重新包装为自主型AI,实际不具备代理能力[2] - 声称提供代理AI解决方案的厂商中仅约130家具备真正技术实力,远低于市场宣传数量[2] - 多数代理AI项目缺乏实际商业价值或ROI,当前AI模型无法自主完成复杂业务目标或长期遵循复杂指令[2] 代理AI发展潜力 - 到2028年至少15%日常工作决策将由代理AI自动完成(2024年为0%),33%企业软件将集成代理AI(2024年<1%)[2] - 代理AI相比传统自动化工具可带来更高资源效率、更复杂任务自动化及更多商业创新可能性[2] - 技术整合面临高复杂性,需重构工作流程适配代理AI,理想路径是从零开始设计而非改造现有系统[3][4] 企业实施建议 - 应聚焦整体生产力提升而非单任务增强,决策场景用AI智能体,流程自动化用传统工具,简单检索用AI助手[4] - 目标是通过成本、质量、速度与规模的协同提升驱动业务价值[4]
最新一代内存标准,没人用?
半导体芯闻· 2025-06-27 18:21
CXL市场现状 - CXL市场未能在2023年下半年如期启动 与三星电子和英特尔进展不力直接相关 [1][3] - 行业讨论热度明显下降 主要由于市场领头羊三星与英特尔表现疲软 [3] - 英特尔下一代服务器CPU"Diamond Rapids"可能推迟发布 该处理器是首款支持CXL 3 0的关键产品 [3] 技术瓶颈与产业协同 - CXL 3 0技术实现重大突破 支持多处理器共享统一内存池 连接通道更宽更快 [3] - 市场特性要求处理器与内存同步发展 仅内存厂商无法单独推动CXL普及 [4] - 三星电子处于等待状态 需配套处理器才能实现CXL架构的商业化 [4] 厂商战略影响 - CXL技术可能导致处理器和内存整体销量下降 因资源使用效率提升 [7] - 高附加值CXL芯片有助于改善盈利结构 符合半导体行业转型趋势 [7] - 超大规模云服务提供商将成为CXL主要推动力 因资源利用率提升带来显著成本节约 [9] 市场前景预测 - 行业预计CXL市场将在2026年迎来真正爆发 [8] - CXL技术将被视为AI基础设施的核心连接技术 与AI部署形成协同效应 [9] - AI基础设施快速部署将成为内存需求增长的新引擎 [9]
龙芯发布服务器CPU,,杀进GPGPU赛道
半导体芯闻· 2025-06-27 18:21
行业背景与公司战略 - 全球信息产业主要建立在美西方主导的X86和ARM体系之上,2024年中国电子工业利润总额6408亿元,利润率仅4%,远低于苹果公司的937亿美元利润[1] - 公司坚持"三自主"路线:自主指令系统、自主IP核、自主工艺生产,是国内唯一坚持该路线的CPU企业[3] - 通过设计优化弥补工艺不足,已证明是一条可行路径[4] - 已形成三大CPU系列:龙芯3号(桌面/服务器)、龙芯2号(工控/终端)、龙芯1号(嵌入式)[6] 服务器CPU产品 - 推出3C6000系列服务器CPU,采用自主龙架构指令系统,2024年上半年流片成功[8] - 单硅片16核32线程,通过"龙链"技术可实现多硅片封装形成32核64线程(3D6000)和64核128线程(3E6000)[8] - "龙链"技术带宽效率高于英特尔UPI和IFIS,兼容PCIe电气标准[10] - 性能表现:单路3C6000/S的SPEC CPU 2017单核定/浮点分值为5.56/6.93分,多核73.2/58.5分;四路3C6000/D多核定/浮点分达547/412分[12] - 综合性能达到2023年市场主流产品水平,可满足通算、智算、存储等多场景需求[13] 终端/工控CPU产品 - 推出3B6000M/2K3000终端/工控CPU,2024年底流片成功[14] - 3B6000M集成8个LA364E核,主频2.5GHz时SPEC CPU2006单核定点分值30分,支持4K@60fps视频处理[14] - 集成第二代自研GPGPU核心LG200和安全处理器模块[14] - 与3A6000桌面CPU共同形成完整产品线,覆盖桌面、服务器和终端领域[15] GPU产品布局 - 采用GPGPU技术路线(图形+AI),2016年开始研发,第一代LG100 GPU已销售超百万片[17][19] - 第二代LG200 GPGPU集成于2K3000,支持OpenGL4.0/ES3.2,性能提升显著[20][22] - 规划龙芯9号系列显卡:9A1000为入门级,INT8算力40TOPS;9A2000为中高端,INT8算力160TOPS,支持双片互连[23][24][25] - GPU架构从图形为中心转向计算为中心,提升通用计算能力[22] 产业生态与合作 - 48家企业发布基于3C6000的服务器、存储设备等产品,覆盖党政、金融、能源等关键领域[28] - 35家企业发布基于2K3000/3B6000M的工控及终端产品,应用于能源、交通、制造等领域[29] - 构建龙芯加速计算平台,包含四层架构:基础支撑层、驱动与运行时、算子工具层、AI框架应用层[30] 技术路线与未来规划 - AI处理器坚持GPGPU路线,聚焦推理类应用,从端侧做起[29] - 软件生态建设遵循兼容主流、拥抱开源、应用牵引、迭代发展原则[29] - 产品性价比达上一代三倍以上,具备开放市场竞争力[27] - 计划持续提升GPU性能,完善软件生态,支持云边端全领域应用[30]