开放式训练
搜索文档
亚马逊重磅发布挑战谷歌英伟达:AI芯片Trainium 3更快更节能,四款Nova 2模型,首创“开放式训练”
美股IPO· 2025-12-03 08:57
AWS新一代AI芯片Trainium 3发布 - 首款采用3纳米制程的AWS AI芯片,专为下一代智能体、推理和视频生成应用程序提供最佳代币经济效益[8] - 单颗芯片提供2.52 PFLOPs FP8算力,内存容量较Trainium 2增加1.5倍至144GB HBM3e,内存带宽提升1.7倍至4.9TB/s[8] - 完整配置的Trn3 UltraServer系统可容纳144颗芯片,总算力达362 PFLOPs,提供20.7TB HBM3e内存和706TB/s聚合内存带宽[8] Trainium 3系统性能提升 - Trn3 UltraServer系统相比第二代产品速度提升超过4倍,内存容量增加4倍[8] - 系统能效比前代提高40%,性能功耗比提升4倍,在Amazon Bedrock平台上性能较Trainium 2提升3倍[9] - 每兆瓦输出token数量增加超过5倍,且延迟水平相当,系统可在EC2 UltraClusters 3.0中扩展至数十万颗芯片[9] 下一代芯片Trainium 4规划 - 开发中的Trainium 4将支持英伟达NVLink Fusion高速芯片互联技术,实现与英伟达GPU互操作[10] - 技术兼容性将降低基于英伟达GPU开发的大型AI应用迁移至亚马逊云平台的技术门槛[11] - 按照以往发布节奏,预计在明年的re:Invent大会上获得更多信息[12] Nova 2系列模型发布 - Nova 2 Lite在15项测试中有13项表现优于或持平Claude Haiku 4.5,在17项测试中有11项优于或持平GPT-5 Mini[16] - Nova 2 Pro在16项基准测试中有10项优于或持平Claude Sonnet 4.5,与GPT-5.1的16项测试中有8项更优或持平[16] - Nova 2 Omni是业内首款统一的多模态推理和生成模型,可同时处理多达75万个单词、数小时音频、长视频和数百页文档[18] 创新AI服务推出 - Nova Forge开创"开放式训练"模式,提供对预训练、中期训练和后训练模型检查点的独家访问权限[19] - Nova Act实现浏览器任务自动化突破,在早期客户工作流程中实现90%的可靠性[21] - Hertz使用Nova Act将软件交付速度提高5倍,将数周工作缩短至数小时[23] 市场反应与客户情况 - 新AI芯片消息公布后亚马逊股价日内涨幅扩大到将近2.2%,英伟达涨幅收窄,AMD跌幅扩大至近1.7%[6] - 主要客户Anthropic已使用超过50万颗芯片,AWS计划年底前为其提供100万颗芯片[13] - 除Anthropic外,日本LLM Karakuri、Splashmusic和Decart等客户已在使用第三代Trainium芯片[14] 软件生态建设 - AWS承诺通过AWS Neuron SDK和原生PyTorch集成,让开发者无需更改模型代码即可进行训练和部署[15] - 与英伟达相比,AWS芯片缺乏帮助客户快速部署的深度软件库,目前主要客户仍倾向于使用英伟达芯片[13]