Workflow
Amazon Transform
icon
搜索文档
直面AI泡沫争议,亚马逊云科技交出了一份实干答卷
第一财经· 2025-12-24 17:29
文章核心观点 - AI技术正经历从对话机器人到自主智能体(Agent)的范式转移,AI正以“数字化员工”身份嵌入企业核心业务流 [1] - 资本市场在狂热后回归冷静,开始严肃审视AI基础设施的巨额资本支出与短期营收增长不成比例的问题,市场关注点转向AI能否成为成本可控、生产力明确的工具 [1] - 亚马逊云科技通过2025年re:Invent大会,以工程化思维系统性地回应市场对成本与落地性的焦虑,提供了一套从底层基础设施到上层应用、旨在重构AI成本模型与推动规模化落地的解决方案 [1][2] 行业趋势与市场环境 - AI角色发生根本性质变:从被动响应进化为具备自主思考、任务拆解与工具调用能力的智能主体 [1] - 企业AI应用需求转变:从迷信单一超级模型转向寻找适合特定业务场景、性价比最高的模型组合 [11] - 企业面临遗留系统现代化挑战:据艾哲森统计,企业每年约70%的IT预算用于维护遗留系统,形成了高达数万亿美元的“技术债” [24] 基础设施创新:算力与存储 - **存储能力升级**:Amazon S3单个对象最大容量从5TB提升至50TB,简化了千亿参数模型的保存与加载流程 [3] - **向量存储革新**:新发布的Amazon S3 Vectors允许直接存储管理数万亿级向量数据,将存储与查询总体成本降低90% [4] - **向量检索加速**:Amazon OpenSearch Service新增GPU向量索引加速功能,索引创建速度提升10倍,成本仅为原来的四分之一 [4] - **计算双轨策略**:一方面与NVIDIA深度合作,推出搭载GB300 NVL72系统的EC2 P6e实例,并托管NVIDIA的Project Ceiba集群;另一方面加速自研芯片部署以提供极致性价比 [6] - **自研芯片进展**:公司已部署超过100万片自研芯片,其中Trainium2的部署速度达到前代产品的4倍 [7] - **新一代自研芯片性能**:基于Trainium 3的EC2 Trn3 UltraServers相比前代带来4.4倍计算能力和3.9倍内存带宽提升,每兆瓦功耗处理的token数量提升5倍 [9] - **未来芯片规划**:正在研发的Amazon Trainium 4预计将带来6倍的FP4计算性能 [9] - **基础设施新理念**:提出“数据园区即计算机”构建理念,Claude最新模型所依赖的Project Rainier即基于此理念构建 [9] - **混合部署方案**:推出Amazon AI Factories,允许在企业自有数据中心内由公司建设管理隔离的AI基础设施,兼顾安全与效率 [10] 模型生态与战略 - **模型平台规模**:全托管生成式AI服务平台Amazon Bedrock已拥有超过10万家客户 [11] - **模型生态扩展**:平台新增包括Google Gemma 3、NVIDIA Nemotron和OpenAI GPT OSS Safeguard等在内的18款开源模型 [11] - **引入中国领先模型**:平台在已有DeepSeek和阿里千问基础上,正式引入Kimi K2 Thinking和MiniMax M2模型,为出海企业提供全球统一基础设施调用本土优势模型的便利 [13] - **自研模型矩阵发布**:推出全新的Amazon Nova 2系列模型,旨在解决企业具体痛点而非刷榜 [14] - **低成本模型**:Nova 2 Lite专为高频次、低复杂度任务设计,将推理成本压缩到极致,现场演示仅用几分钟就从零构建完整房地产管理系统 [14] - **高性能模型**:Nova 2 Pro专为深度推理等复杂场景,在多项基准测试中强于Claude Sonnet 4.5、GPT 5.1和预览版Gemini 3 Pro [15] - **多模态模型**:Nova 2 Omni为首个统一多模态模型,能同时支持文本、图像、视频和音频输入,并输出文本和图像 [15] - **语音模型**:Nova 2 Sonic能实现毫秒级实时对话体验,适用于呼叫中心等场景 [15] 智能体(Agent)开发与落地 - **标准化开发平台**:推出Amazon Bedrock AgentCore,旨在将Agent开发从“手工艺术”变为标准化工业生产 [16][17] - **多Agent协作范式**:通过“贷款审批”案例展示,将复杂业务流拆解为由Intake、Analyze、Underwriting等多个各司其职的Agent协作完成 [18] - **灵活模型调度**:允许在同一业务流的不同环节,根据成本与性能需求灵活指派不同模型(如Nova 2 Pro、Claude 3.5 Sonnet) [18] - **企业系统集成**:AgentCore能深度连接企业IT系统,如从DynamoDB、S3及第三方API实时查询数据 [19] - **安全与可控性**:引入基于Cedar语言的Policy功能,可设定刚性策略(如“退款超1000元须转人工”)以约束Agent行为 [20] - **质量评估体系**:AgentCore Evaluations内置13种评估器,可从准确性、安全性等多维度对Agent进行自动化测试与量化评估 [20] 企业级应用与生产力工具 - **办公效率套件**:推出Amazon Quick Suite,能穿透企业内部各类办公套件与业务软件,串联分散数据资产,变“人找数据”为“数据找人” [21][22] - **智能客服升级**:Amazon Connect引入Agentic AI能力与Nova 2 Sonic模型,使客服Agent具备理解情绪、处理复杂非线性任务(如退换货)的行动力 [23] - **遗留系统现代化**:推出Amazon Transform,能理解业务逻辑依赖,将遗留代码(如150万行Windows代码)自动迁移至现代云环境,新发布的Custom功能允许通过自然语言自定义转换规则 [24] - **软件开发自动化**:推出Kiro Autonomous Agent、Amazon Security Agent和Amazon DevOps Agent,标志着软件开发向“人定目标、机器实现”的自主化进阶转变 [25][27]
“云计算春晚”又来了!不止自研AI芯片和模型,亚马逊云科技回答了一个核心问题
钛媒体APP· 2025-12-03 14:59
文章核心观点 - AI产业正经历从技术奇观到实际价值创造的关键拐点,AI Agent的出现是这一转变的核心驱动力[5][6] - 大模型商业化的成功不能仅依赖芯片或模型的单点优势,而需要在硬件与软件的每一层进行端到端优化[1] - 亚马逊云科技的核心战略是构建面向Agentic AI时代的完整技术栈,从底层基础设施、芯片、模型到上层工具链和平台,以帮助企业将AI价值落地[6][38] AI基础设施与芯片 - 公司全球数据中心网络覆盖38个区域、120个可用区,过去一年新增3.8吉瓦数据中心容量,规模位居全球首位[5] - 公司是运行GPU的最佳场所,OpenAI等大型企业正在使用拥有数十万颗GPU的EC2 UltraServers集群,并即将升级至GB300系列[7][8] - 推出“客户专属私有区域”AI Factories,客户可在自有数据中心内部署独享的AI基础设施,并访问最新Nvidia GPU和核心AI服务[10] - 自研AI芯片Trainium已部署超过100万颗,Trainium 2成为全球性能最强的推理系统之一,Bedrock上大部分推理任务由Trainium驱动[10][11] - Trainium 3正式可用,采用3纳米工艺,计算能力较Trainium 2提升4.4倍,内存带宽提升3.9倍,每兆瓦功耗可处理的AI tokens数量提升5倍[13] - 下一代芯片Trainium 4已进入深度设计阶段,FP4计算性能预计提升6倍,内存带宽提升4倍,高带宽内存容量提升2倍[16] 模型生态与策略 - 公司认为未来不会出现单一主导模型,策略是持续扩展模型范围,Bedrock平台上的模型数量较去年几乎翻番[17] - 自研模型Amazon Nova系列升级至Nova 2,包括Light、Pro、Sonic和Omni四个版本,覆盖从快速推理到复杂多模态任务的不同场景[20] - 引入开放式训练模型Nova Forge,企业可在模型训练阶段注入专有数据,获得兼具通用能力和行业理解的专属模型[21][23] - 开源模型生态进一步扩展,新引入Google Gemma MiniMax M2、kimi k2、NVIDIA Nemotron以及Mistral AI的最新权重模型[18] AI Agent平台与工具 - 推出Amazon Bedrock AgentCore平台,提供Serverless安全运行时环境,支持Agent间相互调用和隔离式记忆机制,可部署数千并发会话[25][26] - 推出Policy in AgentCore系统,通过自然语言定义可实时执行的策略,确保Agent行为可控与可审计[28] - 推出AgentCore Evaluations功能,支持对正确性、有用性等维度进行自动评估,并将结果在CloudWatch中统一呈现[29] 内部实践与效率提升 - 发布Kiro开发环境,可将自然语言指令转化为可执行代码,公司内部已全面采用Kiro作为官方AI开发环境[34] - Kiro帮助公司一个大型重构项目从原计划30名开发者、18个月缩短至6名开发者、76天完成[34] - 基于Kiro经验推出Kiro自主Agent、Amazon Security Agent和Amazon DevOps Agent,覆盖软件生命周期核心环节[35][36] 业务规模与增长 - 公司业务规模达1320亿美元,同比增长速度加快至20%,过去一年业务营收新增220亿美元[4] - Bedrock平台客户数量同比增长超过两倍,已有逾50家客户单日处理的token数量突破1万亿[17]
对话亚马逊云科技全球技术总经理Shaown Nandi:Agentic AI如何重构企业生产力
钛媒体APP· 2025-07-03 18:43
从大模型到Agent的产业拐点 - 2025年AI产业主旋律是大模型退居幕后,Agent站上C位,技术演进趋缓、市场需求转向执行、经济价值关注ROI三重拐点叠加[2] - 产业焦点从模型参数转向工作流编排与人机责任边界定义,Agent成为AI落地的阶段性答案[2] - Gartner预测到2028年15%日常工作决策将由Agentic AI自主完成,2024年该比例几乎为零[2] Agentic AI的定义与演进 - AI Agent是能替代人类进行推理、任务规划和执行的自主软件系统,由LLM提供"大脑",具备记忆系统和工具访问能力[3] - AI技术发展阶段:从预测AI(欺诈检测)到助手AI(聊天机器人),再到当前兴起的Agentic AI[3] - Transformer模型、海量数据与无限算力结合创造了Agentic AI发展的特殊条件[5] 亚马逊云科技的Agent战略 - 亚马逊云科技CEO称Agentic AI可能成为下一个数十亿美元规模业务,已成立直接向CEO汇报的Agent团队[2] - 财富500强企业中75%工作负载仍运行在本地,预示大规模云迁移需求[5] - 公司推出Amazon Transform(迁移任务)和Amazon Q Developer(软件开发)等垂直领域Agent[10] 企业级Agent的核心要素 - 统一AI就绪基础设施需满足安全性、稳定性、灵活性、技术领先性四要素[8] - 数据治理是关键:企业数据决定Agent的视野高度、能力范畴与决策效果,需打破数据孤岛[8][9] - 开发策略需平衡短期预期与长期影响,选择主流开放的技术栈与长期合作伙伴[9][10] 商业模式创新与行业影响 - Agentic AI将推动产品服务创新和商业模式革新,如Uber、Netflix式的范式转移[6] - 企业需从成本优化转向利用Agentic AI提升用户体验、革新商业模式并获取高额回报[6] - 初创公司如Cursor(代码编辑器)、Perplexity(搜索引擎)已通过AI集成创造新商业形态[6] 技术实施与生态协同 - 企业级应用优先考虑安全性与韧性,C端产品更侧重用户体验[7] - 亚马逊云科技通过Amazon Bedrock提供基础设施、数据库和计算能力支持合作伙伴开发[11] - 市场需更多Agent选择,生态协同将加速整体发展[11]