Workflow
RX 9070
icon
搜索文档
深挖英伟达Blackwell
半导体行业观察· 2025-06-30 09:52
Nvidia Blackwell架构核心特点 - 采用750平方毫米巨型芯片设计,集成922亿个晶体管,拥有192个流多处理器(SM) [1] - GB202芯片的SM与GPC比例为1:16,相比前代Ada Lovelace的1:12比例可更低成本增加SM数量 [5] - 取消了子通道切换机制,允许在同一队列中混合不同类型工作负载,提高着色器阵列填充效率 [8] - 采用128位固定长度指令和两级指令缓存设计,L1指令缓存容量提升至约128KB [7][10] - 每个SM分区可跟踪12个波段,寄存器文件容量保持64KB/分区不变 [16] 性能参数对比 - RTX PRO 6000 Blackwell配置188个SM,96GB GDDR7显存,理论带宽1.8TB/s,功耗600W [2] - 相比RTX 5090(170个SM)和AMD RX 9070(28个WGP),在核心数量和显存带宽上具有明显优势 [2][21] - FP32执行流水线重组为32位宽设计,可同时处理INT32和FP32操作避免卡顿 [18] - 每个SM分区每周期可执行16次INT32乘法,是AMD RDNA4的两倍 [18] - 光线追踪性能提升,每个SM的光线三角形相交测试速率提高一倍 [23] 内存子系统 - 采用128KB SM级存储块设计,可在L1缓存和共享内存间灵活分配 [25] - L2缓存延迟130ns,带宽8.7TB/s,相比前代Ada Lovelace有所增加 [49][53] - 显存延迟329ns,L2命中延迟约200ns,略逊于AMD RDNA4的254ns [52] - 总计拥有24MB L1/共享内存容量,是AMD RX 9070(6MB)的四倍 [35] - 地址生成效率优于AMD,单条指令即可完成数组索引转换 [37] 行业竞争格局 - 在高端消费市场缺乏直接竞争对手,AMD RDNA4和Intel Battlemage定位中端 [61] - RTX PRO 6000的FP32吞吐量接近AMD MI300X数据中心GPU [62] - 采用"大核心+高带宽"双重策略,同时增加SM数量和显存带宽 [62] - 芯片面积和功耗达到消费级GPU极限(750mm²/600W) [62] - 尽管面临L2性能等挑战,但凭借规模优势保持市场领先地位 [63][64]
英伟达慌了?传GeForce RTX 50系显卡将大量供货
新浪财经· 2025-04-27 12:27
文章核心观点 NVIDIA RTX 50系显卡供货不足致AMD Radeon RX 9070系列显卡成功销量提升,NVIDIA为应对开始大规模铺货消费级显卡维持市场份额 [1][6] NVIDIA显卡供货情况 - 过去供货少,仅十几张,现到货量达过去数十倍有几百张 [4] - 供货系列从GeForce RTX 5080到GeForce RTX 5060 Ti [4] - GeForce RTX 5090和GeForce RTX 5060 Ti 8GB仍断货,前者需求远超后者 [5] 供货增加原因 - 将部分计算卡产能转移到消费级显卡提高产量 [6] - AMD Radeon RX 9070显卡成功,需维持市场份额 [6]
英伟达RTX 5070,吹过头了?
半导体芯闻· 2025-03-05 18:25
核心观点 - 英伟达RTX 5070显卡性能提升有限,基础性能仅比4070 Super快5-6%,比4070快约20% [12][17] - 功耗表现退步,满载功耗达250W,比4070 Super高出30W(13.5%)[7][19] - AI渲染技术是主要卖点,DLSS 4采用Transformer模型可实现每渲染1帧生成3帧AI插值帧 [21][23] - 价格定位与4070相同(国行4599元),但性价比受AMD RX 9070系列挑战(起售价4499元)[28][16] 产品规格 - CUDA核心数6,144个,介于4070(5,888)和4070 Super(7,168)之间 [6][7] - 采用GDDR7显存,带宽672GB/s,比GDDR6X提升33% [6][7] - 显存容量12GB,满足1080p+/4K基础需求但高分辨率仍受限 [7][10] - 台积电4nm工艺与40系列相同,架构改进有限 [19] 性能表现 - 游戏性能:1440p分辨率下比3070快40-70%,但仅比4070 Super高个位数百分比 [12][17] - 异常案例:《赛博朋克2077》性能比4070 Super快24%,比4070快72% [13] - AI性能:LLaMa 2 7B模型推理首个token延迟优于AMD,但每秒token数次于7900 XT [26] - 温度与噪音:公版满载温度高于5090,双风扇设计可能加剧噪音问题 [8][9] 技术亮点 - DLSS多帧生成(MFG)技术使5070在《赛博朋克2077》中帧率接近4090 [23] - Blackwell架构针对神经负载优化,AI纹理压缩可节省显存占用 [21] - 虚幻5引擎适配:《黑神话悟空》开启DLSS后性能显著提升 [25] 市场竞争 - AMD RX 9070系列定价4499-4999元,宣称性能比7900 GRE提升21-42% [16][28] - 40系列库存压力:4070/Super曾以更低功耗实现同级性能 [27][19] - 市场定位:5070是目前最便宜的支持英伟达4K渲染方案 [4][10]
“老黄骗人”!5070首批评测:说好1/3价格赛4090,实际不如4070Ti
量子位· 2025-03-05 12:21
产品性能与市场反馈 - RTX 5070被网友称为"史上最差的70系列",因其性能未达预期且功耗较高[1][4] - 公司宣称5070性能可媲美RTX 4090,但实测显示其渲染速度不及4080和4070 Ti,仅比4070 Super快3%[3][4][19] - 5070配备12GB GDDR7显存,满足8GB以上标准要求,但功耗达250W,比4070 Super高30W[7][10][11] 技术参数与设计 - 5070 CUDA核心数为6144,介于4070和4070 Super之间,显存带宽672GB/s[7] - 采用双插槽设计,电源连接器改为倾斜设置,散热器设计更新为双风扇同侧布局[11][12] - 散热表现不佳,测试显示5070温度高于包括5090在内的其他显卡[13] 实际性能测试 - 在1440p分辨率下,4090平均比5070快63%,部分游戏如《夺宝奇兵》中5070因12GB显存限制无法正常运行[17][18] - 4K分辨率下表现更差,《赛博朋克2077》平均帧率仅31FPS,《黑神话:悟空》仅25FPS[20][21] - DLSS4 AI超分技术效果未达预期,未能显著提升性能[16][24] 市场竞争与行业动态 - AMD Radeon RX 9070系列即将推出,售价550美元,可能对5070形成直接竞争[26][27] - 英伟达高端产品线问题频发,5090被曝ROP数量缺失4.5%,5080/5090出现黑屏崩溃等严重故障[30][32][35] - 公司回应ROP问题涉及不到0.5%的卡,但用户认为故障率过高[36][37]