发布会核心亮点 - 亚马逊云科技在re:Invent 2025大会上以极快节奏发布近40项新产品,重点围绕AI算力、模型平台和AI Agent展开,强调产品的实用性[1][7][9] 算力基础设施 - 自研AI芯片Trainium已部署超过100万颗,并以比业界最快AI芯片快4倍的速度上量[15] - 发布基于3纳米工艺的Trainium3 Ultra Servers,计算性能较Trainium2提升4.4倍,内存带宽提升3.9倍,每兆瓦电力可产出5倍以上AI Tokens[16][18] - 曝光下一代Trainium4芯片,FP4计算性能将提升6倍,内存带宽提升4倍,高带宽内存容量提升2倍[20] - 推出搭载英伟达GB200 NVL72系统的P6e-GB300实例,为超大规模模型训练提供顶级算力[22] - 推出AI Factories产品,允许客户在自有数据中心部署亚马逊云科技AI基础设施,打破公有云与私有数据中心的边界[23] 模型平台与生态 - Amazon Bedrock模型平台坚持开放生态理念,引入包括中国模型Kimi和MiniMax在内的多家模型,助力中国大模型出海[26][28][29] - 发布自研大模型Amazon Nova 2系列,包括主打高性价比的Nova 2 Light、面向复杂任务的Nova 2 Pro和专注语音交互的Nova 2 Sonic[30] - 推出业界首个支持文本、图像、视频、音频四模态统一推理的模型Nova 2 Omni[32][33] - 推出Amazon Nova Forge服务,允许企业通过开放训练模型概念,将私有数据与通用训练数据融合,训练出深度理解企业知识的专属模型(Novella)[38][40][41] AI Agent开发与应用 - 强调AI助手时代正被AI Agent取代,未来每家公司将运行数十亿个Agent[46] - 发布Kiro Autonomous Agent,可自主规划、并行执行复杂开发任务,例如自动分析依赖并生成多个经过测试的Pull Request[50][52] - 推出AWS Security Agent,实现安全左移,能主动审查设计文档、扫描漏洞并发起渗透测试[53][54] - 推出AWS DevOps Agent,作为7x24小时在线超级SRE,快速定位系统根因并提出修复建议[56] - 内部案例显示,6人团队借助Kiro在76天内完成原本需30人18个月的架构重构项目[57] - 提供AWS Transform Custom服务,帮助自动化迁移老旧代码,有客户将2周迁移工作压缩至3天[58][59] - 推出Policy in AgentCore功能,允许用自然语言定义策略,实现Agent行为实时校验与控制[61][62] - 推出AgentCore Evaluations,提供13种预置评估器,自动化评估Agent输出质量,确保符合预期[64][65] 战略路径总结 - 公司战略聚焦于如何将AI大模型和AI Agent“用好”,而非单纯卷大模型,死磕底层架构和应用[68] - 通过三层架构组合拳直击AI价值落地痛点,标志着从AI“技术时代”迈入“价值时代”[69]
云计算一哥10分钟发了25个新品!Kimi和MiniMax首次上桌