Amazon Nova 2
搜索文档
直面AI泡沫争议,亚马逊云科技交出了一份实干答卷
第一财经· 2025-12-24 17:29
文章核心观点 - AI技术正经历从对话机器人到自主智能体(Agent)的范式转移,AI正以“数字化员工”身份嵌入企业核心业务流 [1] - 资本市场在狂热后回归冷静,开始严肃审视AI基础设施的巨额资本支出与短期营收增长不成比例的问题,市场关注点转向AI能否成为成本可控、生产力明确的工具 [1] - 亚马逊云科技通过2025年re:Invent大会,以工程化思维系统性地回应市场对成本与落地性的焦虑,提供了一套从底层基础设施到上层应用、旨在重构AI成本模型与推动规模化落地的解决方案 [1][2] 行业趋势与市场环境 - AI角色发生根本性质变:从被动响应进化为具备自主思考、任务拆解与工具调用能力的智能主体 [1] - 企业AI应用需求转变:从迷信单一超级模型转向寻找适合特定业务场景、性价比最高的模型组合 [11] - 企业面临遗留系统现代化挑战:据艾哲森统计,企业每年约70%的IT预算用于维护遗留系统,形成了高达数万亿美元的“技术债” [24] 基础设施创新:算力与存储 - **存储能力升级**:Amazon S3单个对象最大容量从5TB提升至50TB,简化了千亿参数模型的保存与加载流程 [3] - **向量存储革新**:新发布的Amazon S3 Vectors允许直接存储管理数万亿级向量数据,将存储与查询总体成本降低90% [4] - **向量检索加速**:Amazon OpenSearch Service新增GPU向量索引加速功能,索引创建速度提升10倍,成本仅为原来的四分之一 [4] - **计算双轨策略**:一方面与NVIDIA深度合作,推出搭载GB300 NVL72系统的EC2 P6e实例,并托管NVIDIA的Project Ceiba集群;另一方面加速自研芯片部署以提供极致性价比 [6] - **自研芯片进展**:公司已部署超过100万片自研芯片,其中Trainium2的部署速度达到前代产品的4倍 [7] - **新一代自研芯片性能**:基于Trainium 3的EC2 Trn3 UltraServers相比前代带来4.4倍计算能力和3.9倍内存带宽提升,每兆瓦功耗处理的token数量提升5倍 [9] - **未来芯片规划**:正在研发的Amazon Trainium 4预计将带来6倍的FP4计算性能 [9] - **基础设施新理念**:提出“数据园区即计算机”构建理念,Claude最新模型所依赖的Project Rainier即基于此理念构建 [9] - **混合部署方案**:推出Amazon AI Factories,允许在企业自有数据中心内由公司建设管理隔离的AI基础设施,兼顾安全与效率 [10] 模型生态与战略 - **模型平台规模**:全托管生成式AI服务平台Amazon Bedrock已拥有超过10万家客户 [11] - **模型生态扩展**:平台新增包括Google Gemma 3、NVIDIA Nemotron和OpenAI GPT OSS Safeguard等在内的18款开源模型 [11] - **引入中国领先模型**:平台在已有DeepSeek和阿里千问基础上,正式引入Kimi K2 Thinking和MiniMax M2模型,为出海企业提供全球统一基础设施调用本土优势模型的便利 [13] - **自研模型矩阵发布**:推出全新的Amazon Nova 2系列模型,旨在解决企业具体痛点而非刷榜 [14] - **低成本模型**:Nova 2 Lite专为高频次、低复杂度任务设计,将推理成本压缩到极致,现场演示仅用几分钟就从零构建完整房地产管理系统 [14] - **高性能模型**:Nova 2 Pro专为深度推理等复杂场景,在多项基准测试中强于Claude Sonnet 4.5、GPT 5.1和预览版Gemini 3 Pro [15] - **多模态模型**:Nova 2 Omni为首个统一多模态模型,能同时支持文本、图像、视频和音频输入,并输出文本和图像 [15] - **语音模型**:Nova 2 Sonic能实现毫秒级实时对话体验,适用于呼叫中心等场景 [15] 智能体(Agent)开发与落地 - **标准化开发平台**:推出Amazon Bedrock AgentCore,旨在将Agent开发从“手工艺术”变为标准化工业生产 [16][17] - **多Agent协作范式**:通过“贷款审批”案例展示,将复杂业务流拆解为由Intake、Analyze、Underwriting等多个各司其职的Agent协作完成 [18] - **灵活模型调度**:允许在同一业务流的不同环节,根据成本与性能需求灵活指派不同模型(如Nova 2 Pro、Claude 3.5 Sonnet) [18] - **企业系统集成**:AgentCore能深度连接企业IT系统,如从DynamoDB、S3及第三方API实时查询数据 [19] - **安全与可控性**:引入基于Cedar语言的Policy功能,可设定刚性策略(如“退款超1000元须转人工”)以约束Agent行为 [20] - **质量评估体系**:AgentCore Evaluations内置13种评估器,可从准确性、安全性等多维度对Agent进行自动化测试与量化评估 [20] 企业级应用与生产力工具 - **办公效率套件**:推出Amazon Quick Suite,能穿透企业内部各类办公套件与业务软件,串联分散数据资产,变“人找数据”为“数据找人” [21][22] - **智能客服升级**:Amazon Connect引入Agentic AI能力与Nova 2 Sonic模型,使客服Agent具备理解情绪、处理复杂非线性任务(如退换货)的行动力 [23] - **遗留系统现代化**:推出Amazon Transform,能理解业务逻辑依赖,将遗留代码(如150万行Windows代码)自动迁移至现代云环境,新发布的Custom功能允许通过自然语言自定义转换规则 [24] - **软件开发自动化**:推出Kiro Autonomous Agent、Amazon Security Agent和Amazon DevOps Agent,标志着软件开发向“人定目标、机器实现”的自主化进阶转变 [25][27]
一朵诞生众多独角兽的云,正在用AI落地Agent
36氪· 2025-12-03 21:41
亚马逊云科技AI战略与市场地位 - 公司认为AI Agent将成为AI价值释放的拐点,未来每家公司内部及各个领域都将有数十亿个Agent [10][11][48] - 亚马逊云科技是生成式AI开发的重要平台,其生成式AI开发平台Amazon Bedrock服务了全球超过10万客户,其中50多家企业每天的Token处理量超过1万亿 [6] - 公司营收达1320亿美元,同比增长20%,绝对增长额220亿美元超过《财富》杂志半数以上500强企业的年收入 [7] - 在亚马逊云科技上诞生的独角兽初创企业数量是断层第一,85%的福布斯“2025 AI 50”企业和85%的CNBC“Disruptor 50”企业均运行在其平台上 [6][51] AI基础设施层创新 - 自研AI芯片Amazon Trainium3 UltraServers将计算能力提升至4.4倍,内存带宽提升至3.9倍,每兆瓦功率能处理的Token数量增加至5倍 [27] - 下一代芯片Amazon Trainium 4已开始设计,将提供6倍的FP4计算性能、4倍的内存带宽以及2倍的高内存带宽容量,以支持世界上最大的模型 [31] - 在相同交互延迟下,GPT-oss-120B模型在Trainium3服务器上每兆瓦的Token输出量比Trainium2高出5倍 [29] 模型与推理平台进展 - Amazon Bedrock平台上的模型数量较去年几乎翻了一番,并引入了月之暗面和MiniMax等中国大模型玩家的模型 [32] - 推出自研Amazon Nova 2开源模型系列,包括适用于经济高效场景的Nova 2 Lite、复杂任务处理的Nova 2 Pro以及实时拟人对话的Nova 2 Sonic [35] - 发布业界首款统一的多模态推理和生成模型Amazon Nova 2 Omni,支持文本、图像、视频、语音四个模态的输入及文本和图像的生成 [37] 数据层与模型定制解决方案 - 推出定制模型训练平台Amazon Nova Forge,开创“开放式训练”范式,允许用户在模型训练的每个阶段融入自有专有业务数据以降低预训练门槛 [43] - 传统企业定制模型方法(如外挂RAG或微调)存在模型不理解深层领域知识或训练难度高的问题 [41][42] Agent开发工具与管理 - Agent开发工具Amazon AgentCore SDK发布仅4个月下载量已超过2亿次 [6] - 在Amazon Bedrock AgentCore上推出Gateway(策略控制)和Evaluations(行为评估)两项新服务,用于规范Agent行为和评估其效果 [46][47] - 发布三款前沿Agent:Amazon Kiro Autonomous Agent、Amazon Security Agent和Amazon DevOps Agent,分别承担自主开发、安全评估和故障处理工作 [55][56] 行业应用与客户案例 - 索尼使用大模型将项目合规审查和评估流程效率提高100倍,其模型基于Amazon Nova Forge训练 [4][5] - Adobe推出的AI创意设计生成工具Adobe Firefly已创造290亿个创意资产,其训练数据存储在Amazon S3和Amazon FSx [4][5] - Reddit使用自研的社区管理AI进行内容审核和筛选 [4] - 初创公司Audio Shake利用AI多扬声器分离技术帮助ALS病人克隆本音,是亚马逊云科技平台上的成功案例 [50][51] AI对开发范式与生产力的影响 - Agent技术正深刻改变创业公司组织形式,一份榜单显示33家AI Native公司平均规模仅27人,但单个员工平均产值超过1亿美元 [52] - 公司内部实践表明,使用AI Coding工具Amazon Kiro后,一个原需30人18个月的项目仅用6人76天即完成 [58] - 实现Agent对开发流程的变革需遵循三原则:赋予Agent更多自主性、并行处理任务而非线性、拓展Agent同时处理多任务的能力 [58]