加速杀入AI芯片战场!亚马逊(AMZN.US)推出新一代自研芯片Trainium 3:提速四倍、能耗降40%,主打性价比

亚马逊AWS加速AI芯片战略 - 亚马逊旗下AWS正加速将其最新一代AI芯片Trainium 3推向市场,旨在硬件领域与英伟达和谷歌竞争 [1] - AWS副总裁表示,Trainium 3已在部分数据中心完成部署,将于本周二正式向客户开放,并计划在明年初启动极快速的规模化部署 [1] - 推出自研芯片是亚马逊在AI领域脱颖而出战略的关键一环,旨在应对其在AI工具开发者群体中主导地位不足的挑战 [1] AI芯片市场竞争加剧 - 亚马逊此举将加剧AI芯片市场的竞争,当前英伟达在该市场占据主导地位,估计拥有80%至90%的份额 [1] - 就在上周,有消息称Meta将在数据中心采用谷歌AI芯片,谷歌最新发布的AI模型也使用其自研芯片完成训练,预示着英伟达将迎来新的竞争 [2] - 亚马逊试图以高性价比吸引企业客户,声称其Trainium系列芯片在支撑AI模型任务时,具备更高的成本效益和运算效率 [2] Trainium 3芯片性能与成本优势 - AWS表示,基于Trainium 3芯片的新款服务器每台包含144颗芯片,计算性能较前代产品提升四倍以上,同时能耗降低40% [2] - 相较于主要采用英伟达GPU的同等系统,其芯片可将AI模型训练和运营成本降低高达50% [2] - Trainium 3的推出距上一代芯片发布仅约一年,按芯片行业标准堪称“极速迭代”,与英伟达每年推出新款芯片的节奏保持同步 [2] Trainium芯片的短板与客户采用情况 - Trainium芯片存在一项关键短板:缺乏英伟达那样丰富的软件生态库,后者能帮助客户快速实现GPU的部署与运行 [3] - 目前投入使用的Trainium芯片大多由AI初创公司Anthropic在多个州的数据中心调配使用 [4] - AWS今年早些时候宣布,已将50多万颗Trainium芯片集群化用于支持Anthropic的最新模型训练,并计划在年底前为Anthropic专属配置100万颗该芯片 [4] - 除了Anthropic,日本大模型公司Karakuri、SplashMusic及Decart等AWS客户也已开始使用第三代芯片与系统,并显著降低了推理成本 [4] 未来芯片规划与兼容性策略 - 亚马逊已着手开发Trainium 4芯片,预计其在标准AI工作负载上的性能将达到Trainium 3的三倍以上 [5] - 值得注意的是,新一代Trainium 4芯片将兼容英伟达技术,实现与该公司服务器和硬件的协同工作 [5] - Trainium 4将采用名为“NVLink Fusion”的高速芯片互连技术,该技术是英伟达的核心技术之一,能帮助AWS构建更强大的AI服务器 [5] - 英伟达首席执行官表示,英伟达与AWS正在共同打造AI工业革命的计算架构 [5] AI模型Nova系列更新与定制化服务 - 在年度用户大会上,亚马逊发布了其主力AI模型系列Nova的更新版本Nova 2,包含一款名为Omni的多模态模型 [6] - 与芯片策略类似,亚马逊在AI模型推广中同样主打“性价比”优势,尽管此前的Nova模型在标准化基准测试中未跻身行业顶尖 [6] - 亚马逊计划允许客户在定制模型时接入更多自有数据,新推出的Nova Forge工具支持专业用户获取未完成训练的模型版本进行定制化开发 [6] - 社交平台Reddit正利用Nova Forge开发一款模型,用于检测平台帖子是否违反安全政策 [7]