Amazon DevOps Agent
搜索文档
AI 越用越亏本,企业哪里做错了?
搜狐财经· 2025-12-03 22:44
2025 年,走向尾声。回顾 2025,这既是「AI 泡沫论」兴起的一年,也是「AI 效用论」兴起的一年。两种论调表面矛盾,实则有一致的内核。 AI 产业规模的扩大,并没有 100% 充分转化为效用、价值。无论是消费端的应用场景,还是企业端的效率、回报,都落后于市场的超高期待。 AI 产品范式有着极简的内核,完全端到端的输入和输出。但到企业场景下,大模型能力的内核依然影响着它的应用效率,用户常常需要花较多时间精力去 构建应用,进行繁琐的效果评估、安全审查、上下文同步等工作,这里付出的成本,甚至可能比原有的工作流程效率更低。 在 2025 年亚马逊云科技 re:Invent 大会上,CEO Matt Garman 指出了这一行业共识:AI 要从「技术奇迹」转变为能提供实际业务价值的实用工具,企业需要 在生产环境中以低成本、可控、规模化的方式部署和使用模型。当下 AI 应用的堵点不是「智能能力」,而是「工程化的能力」。 如何重新思考 AI 的应用范式,提升核心效率,成为了讨论焦点。亚马逊云科技宣示了他们的长期目标,是为企业搭建一套可定制的 AI 框架,创造一个开 放、安全、可控、可扩展的 AI 操作系统。 Age ...
AI 越用越亏本,企业哪里做错了?
虎嗅APP· 2025-12-03 22:31
2025 年,走向尾声。回顾 2025,这既是「AI 泡沫论」兴起的一年,也是「AI 效用论」兴起的一 年。两种论调表面矛盾,实则有一致的内核。 AI 产业规模的扩大,并没有 100% 充分转化为效用、价值。无论是消费端的应用场景,还是企业端 的效率、回报,都落后于市场的超高期待。 AI 产品范式有着极简的内核,完全端到端的输入和输出。但到企业场景下,大模型能力的内核依然 影响着它的应用效率,用户常常需要花较多时间精力去构建应用,进行繁琐的效果评估、安全审查、 上下文同步等工作,这里付出的成本,甚至可能比原有的工作流程效率更低。 在 2025 年亚马逊云科技 re:Invent 大会上,CEO Matt Garman 指出了这一行业共识: AI 要从「技 术奇迹」转变为能提供实际业务价值的实用工具 ,企业需要在生产环境中以低成本、可控、规模化 的方式部署和使用模型。当下 AI 应用的堵点不是「智能能力」,而是「工程化的能力」。 | | | 0 | | | | | 0 | | | | 0 | | | 9 | | --- | --- | --- | --- | --- | --- | --- | --- | -- ...
数十亿AI员工上岗倒计时!云计算一哥“没有魔法,只有真能解决问题的Agent”
新浪财经· 2025-12-03 21:24
当AI炒作退潮,谁在真正交付价值?云计算一哥打响价值落地之战! 作者 | 李水青 AI的价值实现路径,正从"模型能力展示"转向"Agent实际部署"。 亚马逊云科技CEO马特·加曼(Matt Garman)在今日凌晨举办的2025 re:Invent主题演讲中直言:"Agent的出现使我们在AI轨迹上发生了变化——从一个技 术奇迹的时代,转向真正获得价值的时代。" 他的判断基于一组反差强烈的数据:一方面,生成式AI引发全球狂欢,Amazon Bedrock已服务超过10万家企业,其中50多家客户处理了超1万亿tokens; 另一方面,许多企业仍未看到AI投资带来相匹配的业务回报。 ▲Garman在讲解Amazon Bedrock落地情况 "Agent是企业从AI投资中获得实质性商业回报的地方。"Garman揭示了一个关键转折点,"我相信,在未来每个公司内部和每个可以想象的领域都会有数 十亿的Agent。" 一场重新定义AI价值实现的竞赛已经打响。在亚马逊云科技2025 re:Invent的舞台上,AI芯片性能飙涨600%,构建AI Agent的四大技术支柱同步升级, Agent部署的全栈战争已经升级……到底什 ...
“云计算春晚”又来了!不止自研AI芯片和模型,亚马逊云科技回答了一个核心问题
钛媒体APP· 2025-12-03 14:59
文章核心观点 - AI产业正经历从技术奇观到实际价值创造的关键拐点,AI Agent的出现是这一转变的核心驱动力[5][6] - 大模型商业化的成功不能仅依赖芯片或模型的单点优势,而需要在硬件与软件的每一层进行端到端优化[1] - 亚马逊云科技的核心战略是构建面向Agentic AI时代的完整技术栈,从底层基础设施、芯片、模型到上层工具链和平台,以帮助企业将AI价值落地[6][38] AI基础设施与芯片 - 公司全球数据中心网络覆盖38个区域、120个可用区,过去一年新增3.8吉瓦数据中心容量,规模位居全球首位[5] - 公司是运行GPU的最佳场所,OpenAI等大型企业正在使用拥有数十万颗GPU的EC2 UltraServers集群,并即将升级至GB300系列[7][8] - 推出“客户专属私有区域”AI Factories,客户可在自有数据中心内部署独享的AI基础设施,并访问最新Nvidia GPU和核心AI服务[10] - 自研AI芯片Trainium已部署超过100万颗,Trainium 2成为全球性能最强的推理系统之一,Bedrock上大部分推理任务由Trainium驱动[10][11] - Trainium 3正式可用,采用3纳米工艺,计算能力较Trainium 2提升4.4倍,内存带宽提升3.9倍,每兆瓦功耗可处理的AI tokens数量提升5倍[13] - 下一代芯片Trainium 4已进入深度设计阶段,FP4计算性能预计提升6倍,内存带宽提升4倍,高带宽内存容量提升2倍[16] 模型生态与策略 - 公司认为未来不会出现单一主导模型,策略是持续扩展模型范围,Bedrock平台上的模型数量较去年几乎翻番[17] - 自研模型Amazon Nova系列升级至Nova 2,包括Light、Pro、Sonic和Omni四个版本,覆盖从快速推理到复杂多模态任务的不同场景[20] - 引入开放式训练模型Nova Forge,企业可在模型训练阶段注入专有数据,获得兼具通用能力和行业理解的专属模型[21][23] - 开源模型生态进一步扩展,新引入Google Gemma MiniMax M2、kimi k2、NVIDIA Nemotron以及Mistral AI的最新权重模型[18] AI Agent平台与工具 - 推出Amazon Bedrock AgentCore平台,提供Serverless安全运行时环境,支持Agent间相互调用和隔离式记忆机制,可部署数千并发会话[25][26] - 推出Policy in AgentCore系统,通过自然语言定义可实时执行的策略,确保Agent行为可控与可审计[28] - 推出AgentCore Evaluations功能,支持对正确性、有用性等维度进行自动评估,并将结果在CloudWatch中统一呈现[29] 内部实践与效率提升 - 发布Kiro开发环境,可将自然语言指令转化为可执行代码,公司内部已全面采用Kiro作为官方AI开发环境[34] - Kiro帮助公司一个大型重构项目从原计划30名开发者、18个月缩短至6名开发者、76天完成[34] - 基于Kiro经验推出Kiro自主Agent、Amazon Security Agent和Amazon DevOps Agent,覆盖软件生命周期核心环节[35][36] 业务规模与增长 - 公司业务规模达1320亿美元,同比增长速度加快至20%,过去一年业务营收新增220亿美元[4] - Bedrock平台客户数量同比增长超过两倍,已有逾50家客户单日处理的token数量突破1万亿[17]