Amazon Nova Forge
搜索文档
当亚马逊云科技拿到“麦克”,一年的云计算叙事都被改写了
搜狐财经· 2025-12-04 00:43
作者 | 凌敏、王一鹏 华尔街的分析师们还是有些"功底"的。在 2025 亚马逊云科技 re:Invent 开幕前,奥本海默重申对亚马逊的"跑赢大盘"评级,并强调亚马逊云科技藏有"黄金 机会";摩根大通判断亚马逊云科技的需求趋势依然健康,并预计 2026 年将迎来加速增长。 这些判断的一个重要背景就是,一年一度的"云计算春晚"又来了。当亚马逊云科技再次拿到行业叙事的"麦克",云计算的演进主线被定义得更加具体—— 这一次,亚马逊云科技 CEO Matt Garman 在 Keynote 上的所有发布,几乎都是围绕 Agentic AI 的落地展开。纵观整个 2025 所有来自云计算巨头的发布 会,如此坚决的聚焦与定调十分罕见。 Matt Garman 认为要落地 Agentic AI,并"实现完整 AI 能力",需要四大关键支柱:AI Infra、模型生态、数据基座以及开发者工具。 围绕这四个方向,亚马逊云科技带来一系列重量级新品与功能增强。包括 Amazon Trainium3 UltraServers 和最新 AI 芯片 Amazon Trainium4,第二代自研 大模型 Amazon Nova 2 系列 ...
一朵诞生众多独角兽的云,正在用AI落地Agent
36氪· 2025-12-03 21:41
亚马逊云科技AI战略与市场地位 - 公司认为AI Agent将成为AI价值释放的拐点,未来每家公司内部及各个领域都将有数十亿个Agent [10][11][48] - 亚马逊云科技是生成式AI开发的重要平台,其生成式AI开发平台Amazon Bedrock服务了全球超过10万客户,其中50多家企业每天的Token处理量超过1万亿 [6] - 公司营收达1320亿美元,同比增长20%,绝对增长额220亿美元超过《财富》杂志半数以上500强企业的年收入 [7] - 在亚马逊云科技上诞生的独角兽初创企业数量是断层第一,85%的福布斯“2025 AI 50”企业和85%的CNBC“Disruptor 50”企业均运行在其平台上 [6][51] AI基础设施层创新 - 自研AI芯片Amazon Trainium3 UltraServers将计算能力提升至4.4倍,内存带宽提升至3.9倍,每兆瓦功率能处理的Token数量增加至5倍 [27] - 下一代芯片Amazon Trainium 4已开始设计,将提供6倍的FP4计算性能、4倍的内存带宽以及2倍的高内存带宽容量,以支持世界上最大的模型 [31] - 在相同交互延迟下,GPT-oss-120B模型在Trainium3服务器上每兆瓦的Token输出量比Trainium2高出5倍 [29] 模型与推理平台进展 - Amazon Bedrock平台上的模型数量较去年几乎翻了一番,并引入了月之暗面和MiniMax等中国大模型玩家的模型 [32] - 推出自研Amazon Nova 2开源模型系列,包括适用于经济高效场景的Nova 2 Lite、复杂任务处理的Nova 2 Pro以及实时拟人对话的Nova 2 Sonic [35] - 发布业界首款统一的多模态推理和生成模型Amazon Nova 2 Omni,支持文本、图像、视频、语音四个模态的输入及文本和图像的生成 [37] 数据层与模型定制解决方案 - 推出定制模型训练平台Amazon Nova Forge,开创“开放式训练”范式,允许用户在模型训练的每个阶段融入自有专有业务数据以降低预训练门槛 [43] - 传统企业定制模型方法(如外挂RAG或微调)存在模型不理解深层领域知识或训练难度高的问题 [41][42] Agent开发工具与管理 - Agent开发工具Amazon AgentCore SDK发布仅4个月下载量已超过2亿次 [6] - 在Amazon Bedrock AgentCore上推出Gateway(策略控制)和Evaluations(行为评估)两项新服务,用于规范Agent行为和评估其效果 [46][47] - 发布三款前沿Agent:Amazon Kiro Autonomous Agent、Amazon Security Agent和Amazon DevOps Agent,分别承担自主开发、安全评估和故障处理工作 [55][56] 行业应用与客户案例 - 索尼使用大模型将项目合规审查和评估流程效率提高100倍,其模型基于Amazon Nova Forge训练 [4][5] - Adobe推出的AI创意设计生成工具Adobe Firefly已创造290亿个创意资产,其训练数据存储在Amazon S3和Amazon FSx [4][5] - Reddit使用自研的社区管理AI进行内容审核和筛选 [4] - 初创公司Audio Shake利用AI多扬声器分离技术帮助ALS病人克隆本音,是亚马逊云科技平台上的成功案例 [50][51] AI对开发范式与生产力的影响 - Agent技术正深刻改变创业公司组织形式,一份榜单显示33家AI Native公司平均规模仅27人,但单个员工平均产值超过1亿美元 [52] - 公司内部实践表明,使用AI Coding工具Amazon Kiro后,一个原需30人18个月的项目仅用6人76天即完成 [58] - 实现Agent对开发流程的变革需遵循三原则:赋予Agent更多自主性、并行处理任务而非线性、拓展Agent同时处理多任务的能力 [58]
云巨头锁定AI Agent未来现金流 直击2025 re:Invent
美股研究社· 2025-12-03 19:42
北京时间12月3日凌晨,2025 re:Invent如期到来,亚马逊云科技在这场技术盛宴上揭开了"Agentic AI"时代的帷幕。 其首席执行官Matt Garman在大会上披露了一组数据, 亚马逊云科技年收入达到1,320亿美元,仅去年一年就增长了大约220亿美元。 得益于AI基础设施的强劲需求以及客户持续加速上云进程,亚马逊云科技第三季度净销售额(Net sales)达到330亿美元,同比增长20%,创下 自2022年以来最高增速!同时,全年资本支出预期上调至1250亿美元。 营收高增速和不断加大的基建投入,不仅让市场看到了这家公司对AI行业的影响力与日俱增,也从行业层面证明了AI Agent时代已来。 对此,Matt Garman判断,Agent技术正处于关键转折点,从"技术奇迹"转变为能提供实际业务价值的实用工具。未来将出现数十亿AI Agent,为企业提效10倍以上。 这意味着市场对基础设施的要求被推向历史新高。为此,亚马逊云科技用从芯片、模型、数据到Agent的全面变革,构建AI业务价值实现的完 整闭环,来迎接这一轮的增长周期。 看 见 亚 马 逊 云 科 技 的 A I " 野 心 " 在短短 ...
云计算一哥10分钟发了25个新品!Kimi和MiniMax首次上桌
量子位· 2025-12-03 10:38
发布会核心亮点 - 亚马逊云科技在re:Invent 2025大会上以极快节奏发布近40项新产品,重点围绕AI算力、模型平台和AI Agent展开,强调产品的实用性[1][7][9] 算力基础设施 - 自研AI芯片Trainium已部署超过100万颗,并以比业界最快AI芯片快4倍的速度上量[15] - 发布基于3纳米工艺的Trainium3 Ultra Servers,计算性能较Trainium2提升4.4倍,内存带宽提升3.9倍,每兆瓦电力可产出5倍以上AI Tokens[16][18] - 曝光下一代Trainium4芯片,FP4计算性能将提升6倍,内存带宽提升4倍,高带宽内存容量提升2倍[20] - 推出搭载英伟达GB200 NVL72系统的P6e-GB300实例,为超大规模模型训练提供顶级算力[22] - 推出AI Factories产品,允许客户在自有数据中心部署亚马逊云科技AI基础设施,打破公有云与私有数据中心的边界[23] 模型平台与生态 - Amazon Bedrock模型平台坚持开放生态理念,引入包括中国模型Kimi和MiniMax在内的多家模型,助力中国大模型出海[26][28][29] - 发布自研大模型Amazon Nova 2系列,包括主打高性价比的Nova 2 Light、面向复杂任务的Nova 2 Pro和专注语音交互的Nova 2 Sonic[30] - 推出业界首个支持文本、图像、视频、音频四模态统一推理的模型Nova 2 Omni[32][33] - 推出Amazon Nova Forge服务,允许企业通过开放训练模型概念,将私有数据与通用训练数据融合,训练出深度理解企业知识的专属模型(Novella)[38][40][41] AI Agent开发与应用 - 强调AI助手时代正被AI Agent取代,未来每家公司将运行数十亿个Agent[46] - 发布Kiro Autonomous Agent,可自主规划、并行执行复杂开发任务,例如自动分析依赖并生成多个经过测试的Pull Request[50][52] - 推出AWS Security Agent,实现安全左移,能主动审查设计文档、扫描漏洞并发起渗透测试[53][54] - 推出AWS DevOps Agent,作为7x24小时在线超级SRE,快速定位系统根因并提出修复建议[56] - 内部案例显示,6人团队借助Kiro在76天内完成原本需30人18个月的架构重构项目[57] - 提供AWS Transform Custom服务,帮助自动化迁移老旧代码,有客户将2周迁移工作压缩至3天[58][59] - 推出Policy in AgentCore功能,允许用自然语言定义策略,实现Agent行为实时校验与控制[61][62] - 推出AgentCore Evaluations,提供13种预置评估器,自动化评估Agent输出质量,确保符合预期[64][65] 战略路径总结 - 公司战略聚焦于如何将AI大模型和AI Agent“用好”,而非单纯卷大模型,死磕底层架构和应用[68] - 通过三层架构组合拳直击AI价值落地痛点,标志着从AI“技术时代”迈入“价值时代”[69]
AWS Powers Sony's Enterprise AI and Engagement Platforms
Businesswire· 2025-12-03 00:00
索尼与AWS的AI合作核心观点 - 索尼集团正利用亚马逊AWS全面的人工智能服务加速其企业级AI应用并构建粉丝互动平台旨在通过技术在其多元化业务组合中创造更深层次的情感连接[1] - 该合作旨在赋能索尼全球员工加快创新提升运营效率同时在其所有运营公司中建立粉丝与创作者之间更深层次的互动关系[2] - 索尼首席数字官表示此次合作能充分利用数据和AI的力量在粉丝与创作者之间建立新的纽带是塑造娱乐业未来的重要一步[7][8] - AWS首席执行官指出索尼正在用数据和AI重塑其业务此次合作已从支持游戏体验扩展到帮助索尼以前所未有的规模传递情感连接目前有57000名员工使用AI代理[8] 索尼企业AI平台 - 索尼内部企业AI平台为其整个集团公司的员工提供生成式AI和代理AI服务[3] - 该平台基于AWS的Amazon Bedrock AgentCore帮助索尼无缝构建部署和管理AI代理同时提供企业级安全性可观察性和可扩展性[3] - 平台目前每日处理15万次推理请求预计几年内将增长300倍协助员工起草内容回复查询预测检测欺诈头脑风暴和开发新想法[3] - 索尼还利用Amazon Nova Forge计划为其多样化的业务和运营构建尖端AI基于早期结果通过Nova Forge开发的AI模型有望将其审查评估流程效率提升100倍[4] 索尼互动平台 - 索尼互动平台是索尼集团业务战略的核心该平台整合了Sony Data Ocean这一综合数据平台可处理来自索尼集团公司500多种数据集的最高760TB数据[5] - Sony Data Ocean基于包括Amazon SageMaker在内的AWS服务提供AI增强的洞察帮助兴趣相投的粉丝相互联系并为内容创作者提供有关受众趋势的宝贵见解[5] - 该平台利用索尼互动娱乐PlayStation在线服务的核心后端功能扩展了PlayStation基础设施的核心功能如账户支付数据能力和安全性旨在简化业务运营和客户体验[6] - 平台目标是在各种娱乐类别和服务中建立粉丝与创作者之间有意义的连接[6] AWS的AI能力与行业影响 - AWS拥有最全面的AI能力和全球基础设施足迹致力于通过近二十年的技术普及使各种规模和行业的组织都能使用云计算和生成式AI[9] - AWS在AWS re:Invent上宣布了AWS Transform中新的代理AI功能扩展了客户大规模快速现代化遗留应用程序和代码的能力以实现AI的全部价值[12] - AWS与HUMAIN扩大合作计划在利雅得一个被称为“AI区域”的数据中心设施中提供部署和管理高达15万个AI加速器以推动全球AI创新[13]