Nvidia Aims to Redefine Commerce With AI Chips
英伟达英伟达(US:NVDA) PYMNTS·2024-03-20 07:44

英伟达发布新一代AI芯片B200/GB200 - 公司于3月18日年度开发者大会上发布了B200 GPU及集成两颗B200与一颗Grace CPU的GB200,后者是Blackwell系列AI图形处理器的首款芯片 [1] 芯片性能与能效大幅提升 - B200 GPU拥有2080亿个晶体管,可提供高达20 petaflops的FP4处理能力 [1] - 对于大语言模型推理任务,GB200可将性能提升高达30倍,同时相比前代H100模型,成本和能耗最高可降低25倍 [1] - 在训练1.8万亿参数模型时,新Blackwell架构仅需2000个GPU和4兆瓦电力,而此前需要8000个Hopper GPU和15兆瓦电力 [3] - 在1750亿参数的GPT-3基准测试中,GB200性能比H100提升7倍,训练速度提升4倍 [3] - 新芯片通过将计算精度减半,实现了每秒计算数量比前代翻倍 [4] 技术架构与竞争优势 - B200通过构建最大可行的芯片,并利用高速网络互联两颗芯片,以更高效地协调计算 [4] - 公司主要优势在于其软件生态系统,能使其GPU硬件高效执行AI工作负载,编译器可让研究人员快速在最新GPU上部署模型 [5] - 另一显著优势是其高性能网络,使得大型集群中的GPU能够快速高效地相互通信,这些优势共同实现了对万亿参数模型的高效AI计算 [5] 对商业与零售业的潜在影响 - 芯片分析海量数据的能力可帮助企业更精准预测客户需求,实现更好的库存管理,降低缺货和库存过剩风险 [2] - 处理器可实现实时价格优化,根据需求、竞争和客户行为等因素动态调整价格,帮助企业实现利润最大化并保持竞争力 [6] - 通过实时分析交易,芯片可识别可能表明欺诈活动的可疑模式,有助于防止企业财务损失并保护客户 [7] - 高处理速度为实现个性化和客户画像开辟了新可能,并能实时分析客户浏览行为,为商家提供与购物者互动的窗口 [7] - 能力可用于创建高度定向的广告资产,在最佳时间向正确的客户传递正确的信息,并根据其浏览行为进行调整 [7] - 芯片可能驱动虚拟购物助手,陪伴客户浏览线上商店,帮助搭配服装、比较产品和回答问题,提供更个性化和吸引人的购物体验 [8] 推动AI普及与成本降低 - 得益于“更便宜的推理”,由B200等芯片驱动的AI产品未来可能变得更便宜、更普及 [8] - 从2024年起,更多公司可能开始使用能满足其需求的基础AI模型,从而专注于改进和销售产品 [8] - 这意味着即使是小公司也可能转向AI产品,而无需大量昂贵的GPU,从而降低开发和使用AI工具的成本,使其对企业和消费者更可负担 [8]

Nvidia Aims to Redefine Commerce With AI Chips - Reportify