Amazon Nova 2 Omni
搜索文档
一朵诞生众多独角兽的云,正在用AI落地Agent
36氪· 2025-12-04 10:45
文章核心观点 - 亚马逊云科技通过提供从AI基础设施、推理平台、数据层到开发工具的完整“全家桶”服务,正在革新Agent(智能体)的开发与落地,旨在抓住AI价值释放的拐点并推动企业数字化转型 [1][9][19] - 公司以客户需求和技术前沿为创新源头,通过解决Agent落地过程中的一系列新痛点(如成本、数据理解、评估监管等),持续扩展其服务能力,巩固其在生成式AI和云计算领域的领导地位 [8][12][15] - Agent的普及将深刻改变企业运营和开发范式,大幅提升生产力,并催生新的创业组织形式,而亚马逊云科技通过其平台和服务,正成为支撑这场变革的关键基础设施提供商 [37][41][47] 亚马逊云科技的业务表现与市场地位 - 过去一年,亚马逊云科技营收达1320亿美元,同比增长20%,绝对增长额220亿美元超过了半数以上《财富》500强企业的年收入 [6] - 其生成式AI开发平台Amazon Bedrock服务了全球超过10万客户,其中50多家企业每天的Token处理量超过1万亿 [5] - 发布仅4个月的Agent开发工具Amazon AgentCore SDK下载量已超过2亿次 [5] - 在亚马逊云科技上诞生的独角兽初创企业数量处于断层第一的位置 [5] - 全球超过半数的初创企业、85%的福布斯“2025 AI 50”企业以及85%的CNBC“Disruptor 50”企业都运行在亚马逊云科技上 [40] Agent成为AI发展的核心趋势与机遇 - 亚马逊云科技CEO Matt Garman判断,Agent将成为AI价值释放的拐点,未来每家公司内部及各个领域都将有数十亿个Agent [9][10] - Agent通过其自主规划和执行能力,正在加速医疗研发、改善客户服务、提升账单处理效率等 [10] - 麦肯锡2025年11月报告显示,目前仍有32%的企业对AI应用停留在试点阶段,仅7%的企业实现了规模化落地,表明Agent落地仍处初期,市场潜力巨大 [12] 亚马逊云科技的AI基础设施层创新 - 新推出的服务器Amazon Trainium3 UltraServers将计算能力提升至4.4倍,内存带宽提升至3.9倍,每兆瓦功率能处理的Token数量增加至5倍 [21] - 运行OpenAI开源模型GPT-oss-120B时,在相同交互延迟下,Amazon Trainium3 UltraServers每兆瓦的Token输出量比前代高出5倍 [23] - 下一代芯片Amazon Trainium 4已开始设计,预计将提供6倍的FP4计算性能、4倍的内存带宽以及2倍的高内存带宽容量,以支持世界上最大的模型 [25] - 自研AI芯片Amazon Trainium已快速成长为一项价值数十亿美元的业务 [21] 亚马逊云科技的模型推理平台(MaaS) - 生成式AI开发平台Amazon Bedrock上的模型数量相较于去年几乎翻了一番 [26] - 平台上的中国模型玩家数量从原来的2个(Qwen和DeepSeek)增加到了4个,新增了月之暗面和MiniMax的模型 [26] - 推出了全新的自研Amazon Nova 2开源模型系列,包括适用于经济高效场景的Nova 2 Lite、复杂任务处理的Nova 2 Pro,以及实时拟人对话的Nova 2 Sonic [26] - 推出了业界首款统一的多模态推理和生成模型Amazon Nova 2 Omni,支持文本、图像、视频、语音四模态输入及文本和图像生成 [31] 亚马逊云科技的数据层与模型定制解决方案 - 传统企业定制模型方法(如外挂RAG、向量数据库、微调)存在短板,模型难以深入理解领域知识和业务决策所需专业知识 [30] - 推出了模型定制平台Amazon Nova Forge,开创“开放式训练”新范式,允许用户在模型训练的每个阶段(预训练、中期训练、后训练)融入自己的专有业务数据 [32] - 该平台通过开放Nova模型训练检查点的独家访问权限,降低了预训练门槛并提升了定制模型的性能 [32] - 索尼和Reddit的模型是基于Amazon Nova Forge训练而成,Adobe Firefly的训练数据存储在Amazon S3和Amazon FSx [4] 亚马逊云科技的Agent开发与管理工具 - 在Agent开发平台Amazon Bedrock AgentCore上,针对Agent的管理和评估推出了两项新服务:Gateway(策略控制)和Evaluations(行为评估) [35] - Gateway功能允许用户自定义Agent访问数据、调用工具的权限、执行任务的范围和环境,以控制和规范Agent行为 [36] - Evaluations功能如同Agent的绩效考核,允许用户通过自定义体系轻松评估Agent效果 [36] - 推出了三款全新的“前沿Agent”(Frontier Agent),旨在无人类干预情况下长时间工作,进一步解放开发者生产力 [42][44] - Amazon Kiro Autonomous Agent:用于自主开发 - Amazon Security Agent:用于安全评估 - Amazon DevOps Agent:用于解决和预防故障 [45] Agent如何改变开发范式与企业运营 - Agent对生产力的提高正在改变创业公司组织形式,例如“顶尖精益AI Native公司排行榜”中33家公司平均规模仅27人,但单个员工平均产值超过1亿美元 [41] - 亚马逊云科技自身案例:使用AI Coding工具Amazon Kiro,一个原需30人18个月的项目,仅用6人76天就完成架构重建 [47] - 要让Agent变革开发流程,需改变原有工作流:赋予Agent更多自主性;并行处理任务而非线性处理;拓展Agent同时处理更多任务的能力 [47] - “前沿Agent”需具备自主性、可扩展性,并能无人类干预连续长时间工作,以解放开发者生产力 [42] 客户案例与行业应用 - 索尼使用大模型将动画电影项目的合规审查和评估流程效率提高了100倍 [3] - Adobe推出的AI创意设计生成工具Adobe Firefly,今年以来已创造了290亿个创意资产 [3] - Reddit使用自研的社区管理AI对内容进行审核和筛选 [3] - 初创公司Audio Shake(2024年亚马逊云科技独角兽创投大赛冠军)研发的AI多扬声器分离器,被用于帮助ALS(渐冻症)患者分离并克隆本音 [39][40]