Trainium 3 UltraServers
搜索文档
云计算一哥AWS的新战事:10分钟发布25款新品,全面押注智能体
36氪· 2025-12-04 08:19
文章核心观点 - AWS在re:Invent大会上宣布战略重心从技术突破转向企业级价值落地,推动AI从“助手”向“智能体”进化,以解决企业“高投入、低回报”的焦虑 [1] - 公司通过向下造芯片提升性价比、中间做厚模型打破微调天花板、向上立规矩解决智能体落地失控风险的三层策略来抓住机会 [1] - 大会密集发布近40款新品,覆盖算力、模型和应用三个维度,展示公司在AI堆栈各层面的突破 [1][2] 算力层进展 - 发布Trainium 3 UltraServers,推理能效比前代提升5倍,并预告Trainium 4性能将再提升6倍,彰显摆脱外部算力依赖的决心 [4] - 推出AWS AI Factories,将算力基础设施部署在客户自有数据中心,以满足金融和政企客户对数据主权的敏感需求 [4] - 新发布P6e实例首批搭载英伟达GB300 NVL72系统,同时Trn3未来将兼容英伟达NVlink Fusion技术,保持与英伟达的紧密合作 [4] - AWS全球数据中心网络覆盖38个区域、120个可用区,过去一年新增3.8吉瓦容量,拥有总长超过900万公里的私有网络 [13] 模型层进展 - 补齐Amazon Nova自研模型家族,发布Nova 2系列,其中Nova 2 Omni是业界首个支持文本、图、音、视四种输入并能多模态输出的模型 [6] - Nova 2 Pro在复杂指令遵循上表现激进,公司称其在基准测试中优于GPT-5.1 [6] - 推出Amazon Nova Forge服务,引入“开放训练模型”概念,允许企业在模型预训练最后阶段注入专有数据,解决微调导致模型变笨的痛点 [6] - 索尼集团作为早期客户采用Nova Forge和AgentCore,旨在将合规审查效率提升100倍 [6] 应用层进展 - 将AI Agent作为未来核心,推出AgentCore Policy,基于Cedar语言构建确定性控制系统,可实时拦截违规操作如阻止超过1000美元的自动退款 [7] - 发布Frontier Agents系列,包括能自主修复Bug的Kiro Autonomous Agent、代码提交前自动扫描漏洞的Security Agent和自动诊断根因的DevOps Agent [7] - AgentCore服务SDK自发布几个月以来下载量已超过200万次,显示强劲发展势头 [12] - 公司认为AI正在从技术奇迹转变为生产力工具,未来每家公司内部将涌现数十亿个Agent [18] AWS业务与基础设施概况 - AWS年化收入达1320亿美元,年增长率20%,过去一年收入增长约220亿美元,超过半数《财富》500强公司全年收入 [10] - Amazon S3存储对象数量超过500万亿个,数据量达数百艾字节,平均每秒处理超过2亿次请求 [11] - 连续第三年新增CPU容量中一半以上来自自研Graviton芯片,已部署超过100万枚Trainium芯片 [12][26] - Amazon Bedrock目前支持超过10万个AI推理应用,福特AI 50榜单中85%的企业以及CNBC Disruptor 50榜单中85%的企业运行在AWS上 [12][14]