Workflow
GPU
icon
搜索文档
深入探秘英特尔最新GPU架构
半导体行业观察· 2025-03-20 09:19
英特尔Xe3 GPU架构进展 - 英特尔Xe3硬件设计已完成,软件工作正在进行中,部分进展可在开源存储库中查看[1] - Xe3渲染切片支持最多16个Xe核心,相比前代Xe/Xe2的4核心实现显著扩展[4] - Xe3理论最大配置可达256个Xe核心和32768个FP32通道,超越Nvidia RTX 5090的21760通道[7] - 公司通过增加渲染切片核心数量,向AMD/Nvidia的多核心设计靠拢(如RX 6900XT每引擎10WGP,RTX 4090每GPC含8SM)[8] Xe矢量引擎(XVE)升级 - Xe3 XVE线程容量从8提升至10个,寄存器文件分配更灵活(64KB按32条目块分配)[10] - 记分牌令牌总数从Xe2的128个增至320个,提升内存级并行性[11] - 新增标量寄存器s0,优化收集发送指令效率,扩展线程依赖寄存器支持[13] 指令集与功能增强 - 新增FCVT指令的饱和度修饰符,支持HF8/BF8两种8位浮点格式[14] - XMX单元引入xdpas指令,实现稀疏矩阵运算优化[14] - 光线追踪新增子三角形不透明度剔除(STOC)技术,测试显示性能提升5.9-42.2%[16][17] - STOC硬件支持两级实现:STOC1(嵌入18位)和STOC3(指针扩展至128B叶节点)[18][19] 架构战略方向 - Xe3延续Xe2的能效提升路径,通过延迟容忍设计(如动态寄存器分配)提高核心利用率[21] - 公司持续优化计算架构,与Nvidia(Ampere至Blackwell SM架构稳定)形成差异化发展路径[22] - STOC等创新需开发者适配,但纯软件实现已能带来性能收益,可能推动硬件功能采用[19][22]
2024年GPU市场分析:英伟达主导,AMD销量创新低
半导体行业观察· 2025-03-08 11:39
2024年第四季度台式机独立GPU市场表现 - 2024年Q4台式机独立GPU出货量达840万块,环比增长3.7%(Q3为810万块),但同比下滑11.6%(2023年Q4为950万块)[1] - Nvidia因产能转向数据中心GPU,Q4出货量降至689万块,环比同比均下降[1] - AMD台式机Radeon显卡Q4销量达143万块,为2024年最佳季度表现,但仍低于2023年Q4的181万块[1] 市场份额变动 - Nvidia在Q4失去8%市场份额,AMD增长7%,英特尔增长1.2%[2] - Nvidia仍以82%份额主导市场,AMD占比17%创积极结果[2] 供应链与订单积压 - 因显卡供不应求及新品量产推迟至2025年,供应商Q4末积压大量订单,预计2025年Q1出货量将异常强劲[4] - 新关税或导致2025年Q2台式机AIB出货量季节性下降幅度扩大[4] 2024年全年市场表现 - 2024年台式机独立GPU总出货量3470万台,同比增长11.9%(2023年为3100万台),但低于2022年的3800万台[7] - Nvidia全年出货3020万块,恢复至2022年水平,AMD仅出货442万块创历史最差业绩[9] 产品发布背景 - 2024年行业无重大产品发布,仅Nvidia推出GeForce RTX 40 Super系列更新[7] - AMD和Nvidia均将新一代产品(Radeon RX 9000/GeForce RTX 50)量产推迟至2025年[4][7]