Workflow
Amazon SageMaker AI
icon
搜索文档
让 Agent 真正进入企业核心业务系统,到底还缺什么?
钛媒体APP· 2025-12-05 09:48
AI Agent平台发展趋势 - 产业焦点正从大模型竞争转向能自主思考执行并解决实际问题的AI Agent平台竞争[1] - Agent被视为将进入企业核心生产系统的下一代通用能力[1] - 行业正从单个任务自动化迈向推动整个行业加速发展的协作模式[6] AWS Agentic AI平台核心组件 - Strands Agent SDK采用模型驱动方法让LLM自主处理任何场景省去预设工作流程和复杂协调代码[1] - Strands Agent SDK已开源新增支持TypeScript和边缘设备五个月下载量超500万次[2] - Amazon Bedrock AgentCore解决Agent在生产环境稳定安全大规模部署问题具备从0到数千并发能力[2] - AgentCore Identity通过几行代码实现AWS应用与SlackZoom等第三方应用无缝身份访问管理[2] AI Agent技术架构 - 每个Agent由三个关键组件构成模型负责推理规划执行代码定义身份和能力工具让Agent活起来[3] - AgentCore Memory推出情景记忆功能使AI Agent能记住并从过去经历中学习越丰富越智能[5] - 工具范畴包括后端API知识库与数据库访问权限代码解释器网页浏览器等实际操作支持[3] 模型训练与优化技术 - Bedrock RFT自动化所有复杂RL流程让开发者无需理解奖励建模策略优化就能使用RLAIF[5] - SageMaker AI推出无服务器模型定制功能不再需要繁琐的基础设施准备[5] - Nova Forge开放训练模型计划提供中间检查点访问允许混合专有与基础训练数据[5][6] - SageMaker HyperPod Checkpointless Training故障恢复从数小时缩短到数分钟节省高达40%训练成本[6]
亚马逊Agent全家桶爆更,连甩9个大招,锁定最强智能体平台
36氪· 2025-12-04 08:21
文章核心观点 - 亚马逊云科技在AWS re:Invent大会上发布多项AI智能体开发新工具,旨在成为构建和运行智能体的最佳平台[1] - 公司通过增强智能体框架、平台功能、模型定制效率和自动化可靠性,加速智能体从开发到大规模生产部署的进程[3][18][32] Strands Agents SDK智能体框架更新 - Strands Agents SDK新增对TypeScript编程语言的支持,提供类型安全和现代编程范式,简化全栈智能体应用构建[4][6] - 框架新增对边缘设备的支持,使开发者能构建在汽车、游戏、机器人等小型设备上运行的自主式AI智能体[6] - 该开源框架自发布以来下载量已达到529.9万次[4] Amazon Bedrock AgentCore智能体平台创新 - AgentCore平台新增策略功能,允许企业用自然语言为智能体的工具使用设定边界,例如设定报销金额超过1000美元时自动拒绝退款[13] - 平台新增评估功能,提供13种预置评估器覆盖正确性、安全性等质量维度,帮助开发者持续检测智能体行为质量[13] - 新增情景记忆功能,包含短期和长期记忆,让智能体能从过往交互经验中学习并优化决策,例如根据用户历史行为调整服务策略[13][15][16] - 该平台迄今开发者下载量已超过200万次[11] Amazon Bedrock与SageMaker AI模型定制功能 - Amazon Bedrock推出强化微调功能,平均可提升模型66%的准确率,初期支持Amazon Nova 2 Lite模型[21][23] - SageMaker AI新增模型定制功能,提供智能体驱动和自主引导两种模式,支持基于AI反馈的强化学习等先进定制技术[24][26] - 新功能支持Amazon Nova、Llama、Qwen、DeepSeek、gpt-oss等热门开源模型[26] SageMaker HyperPod训练效率提升 - SageMaker HyperPod推出无检查点训练功能,可在数分钟内自动从基础设施故障中恢复,传统基于检查点的恢复方式耗时最长可达1小时[28][29] - 该功能使包含成千上万张AI加速器的集群训练效率最高可达95%,最高可降低40%训练成本[28][29][31] Amazon Nova Act自动化服务 - Amazon Nova Act正式版全面可用,旨在实现生产环境用户界面工作流程自动化,能够大规模提供超过90%的任务可靠性[32][35] - 服务基于定制的Amazon Nova 2 Lite模型,具备Web质量保证测试、数据录入、数据提取和结账流程等核心功能[35] - 在REAL Bench V2基准测试中得分为72.9,高于Claude Haiku 4.5的67.4分[37]
AWS Simplifies Model Customization to Help Customers Build Faster, More Efficient AI Agents
Businesswire· 2025-12-04 02:30
新产品发布 - 亚马逊云科技在AWS re:Invent大会上宣布了Amazon Bedrock和Amazon SageMaker AI的新功能 [1] - 新功能包括Amazon Bedrock中的强化学习微调以及Amazon SageMaker AI中基于强化学习的无服务器模型定制 [1] 产品功能与优势 - 新的Amazon Bedrock和Amazon SageMaker AI功能为客户提供了先进的模型定制技术 [1] - Amazon Bedrock中的强化学习微调使客户能更轻松地针对特定用例定制模型并提高准确性 [1] - Amazon SageMaker AI将高级模型定制工作流程从数月缩短至数天,加速了AI开发并让新解决方案更快上市 [1] 公司背景与市场地位 - 亚马逊云科技拥有近二十年的技术普及历史,为数百万客户提供服务 [1] - 亚马逊云科技通过使各种规模和行业的组织都能使用云计算和生成式AI,建立了历史上增长最快的企业技术业务之一 [1] - 亚马逊云科技拥有最全面的AI能力和全球基础设施覆盖,赋能构建者将宏大构想变为现实 [1]
Deepgram Launches Streaming Speech, Text, and Voice Agents on Amazon SageMaker AI
Businesswire· 2025-12-01 11:00
核心观点 - Deepgram作为语音AI平台 宣布其流式语音转文本 文本转语音及语音代理API与亚马逊SageMaker AI实现原生集成 使企业能够在AWS工作流中直接部署和扩展低延迟语音应用 [1][2] 产品与技术整合 - 该集成将Deepgram的流式语音模型作为Amazon SageMaker AI的实时端点提供 无需定制管道或编排 即可实现亚秒级延迟的语音转文本 文本转语音和语音代理功能 [1][2] - 通过SageMaker API进行原生流式传输 意味着无需变通方案即可获得清晰的实时推理 该集成能为呼叫中心 交易大厅和实时分析等高规模用例提供亚秒级延迟和企业级可靠性 [3] - 该解决方案构建于AWS之上 支持通过`InvokeEndpointWithResponseStream`实现流式响应 并将数据保留在AWS内部 客户可将其部署在亚马逊虚拟私有云中或作为托管服务 以满足严格的数据驻留和合规要求 [4] 市场与客户价值 - 此次集成使团队能够在现有AWS工作流中构建 部署和扩展语音驱动应用 同时保持AWS环境的安全与合规优势 [1] - 该集成移除了部署实时语音功能的复杂性 让AWS客户能专注于创新而非基础设施 通过将先进的语音模型直接带入企业已运营的AWS环境 极大简化了企业创建变革性语音体验的流程 [5] - 超过20万名开发者因Deepgram无与伦比的准确性 低延迟和定价 而使用其语音原生基础模型 这些模型可通过云API或自托管/本地API访问 [7] 合作伙伴关系 - Deepgram与AWS建立了牢固的合作关系 是AWS生成式AI能力合作伙伴 并与AWS签署了多年期战略合作协议 以加速企业采用 [5] - AWS SageMaker总经理表示 此集成是Deepgram通过AWS服务使生成式AI更易获取和强大 从而扩大市场覆盖范围的典范 同时使双方客户能够构建复杂的语音应用 [6] 公司背景与行业地位 - Deepgram自称是全球最真实 最实时的语音AI平台 提供语音转文本 文本转语音及完整的语音转语音功能 所有这些都由其企业级运行时提供支持 [1][7] - 客户包括构建语音产品或平台的技术独立软件供应商 与大型企业合作的联合销售合作伙伴 以及解决内部用例的企业 [7] - 公司已处理超过5万年的音频 转录了超过1万亿个单词 声称全球没有比其更懂语音的组织 [7] 近期动态与行业认可 - 该集成将于2025年12月1日至5日在拉斯维加斯AWS re:Invent大会的Deepgram 690号展位进行现场演示 [7] - Deepgram的Aura-2文本转语音模型被TMC的《CUSTOMER》杂志评为2025年客户体验创新奖获奖者 [9][11] - Deepgram在VapiCon 2025上推出了Flux 这是全球首个专为实时语音代理设计的对话式语音识别模型 与传统自动语音识别不同 它经过训练以理解对话的细微差别 [12]
AWS is spending $50B build AI infrastructure for the US government
TechCrunch· 2025-11-25 03:10
AWS对美国政府的AI基础设施投资 - AWS宣布投资500亿美元为美国政府建设专用的AI高性能计算基础设施,旨在扩大联邦机构对AWS AI服务的访问 [1] - 该项目将新增13吉瓦的计算能力,并计划于2026年破土动工 [2] - 政府机构将获得包括Amazon SageMaker AI、模型定制、Amazon Bedrock、模型部署以及Anthropic的Claude聊天机器人等产品的扩展访问权限 [2] 投资战略意义与公司背景 - 该投资旨在消除技术障碍,使联邦机构能够从网络安全到药物发现等关键任务中加速推进,巩固美国在AI时代的领导地位 [3] - AWS自2011年开始为美国政府构建云基础设施,并于2014年推出首个处理机密工作负载的气隙商业云AWS Top Secret-East,2017年推出可访问所有安全分类级别的AWS Secret Region [4] 行业竞争态势 - 科技巨头过去一年加大向美国政府推销AI服务的力度,OpenAI于1月推出专供联邦政府机构的ChatGPT版本,并于8月达成协议以每年1美元的价格提供企业版ChatGPT [6] - Anthropic同样以每年1美元的价格向美国政府提供其Claude聊天机器人的企业版,而谷歌随后推出的"Google for Government"首年收费仅为47美分 [7]
Amazon to invest up to $50B to build AI infrastructure for US government agencies
Fox Business· 2025-11-25 00:21
投资计划与规模 - 公司宣布首次为美国政府构建和部署专用人工智能及高性能计算计划 [1] - 该计划承诺投资高达500亿美元以扩展联邦政府客户的人工智能和超级计算能力 [1] - 投资将于2026年启动,通过建设采用先进计算和网络技术的数据中心,增加近1.3吉瓦的人工智能和超级计算容量 [2] 技术能力与服务 - 联邦机构将获得对全面人工智能服务的访问权限,包括用于模型训练和定制的Amazon SageMaker AI、用于模型和智能体部署的Amazon Bedrock、Anthropic Claude、Amazon Nova以及AWS Trainium AI芯片和英伟达人工智能基础设施 [5] - 人工智能和超级计算可将需要数周手动分析的国防和情报工作流程自动化,通过以前所未有的规模处理卫星图像、传感器数据和历史模式来自动检测威胁并生成应对计划 [9] - 人工智能驱动的模拟和建模数据将使机构能够在数小时内完成以往需要数周或数月才能完成的任务 [8] 战略意义与影响 - 此项投资旨在消除阻碍政府发展的技术壁垒,进一步巩固美国在人工智能时代的领导地位 [5] - 该计划将从根本上改变联邦机构利用超级计算的方式,使其能够加速从网络安全到药物发现等关键任务 [3] - 投资支持白宫的人工智能行动计划,并部署在位于美国境内的安全人工智能和云基础设施上 [12] 政府业务基础 - 自十多年前推出政府云解决方案以来,公司已为超过11,000个政府机构提供支持 [12] - 公司于2011年通过AWS GovCloud(美国西部)构建了首个专门满足政府安全与合规要求的基础设施 [13] - 公司在2014年创建了首个经认证可支持机密工作负载的气隙商用云,并于2017年通过推出AWS Secret Region成为首个获得美国所有政府数据分类认证的云提供商 [14]
Will Strong AWS Performance Improve Amazon's Q3 Results?
ZACKS· 2025-10-30 02:46
AWS第三季度业绩预期 - 亚马逊2025年第三季度财报预计于10月30日发布,其强劲的云服务产品可能推动业绩增长[1] - AWS第三季度销售额模型预测为324.9亿美元,显示出18.4%的强劲同比增长[1][7] AWS历史业绩与市场地位 - 第二季度AWS收入为308亿美元,同比增长17.5%,营业利润达到101亿美元,同比增长8.8%[2] - AWS在2025年第二季度以30%的市场份额保持市场领导地位,领先于微软Azure的20%和谷歌云的13%[2] 代理AI战略举措 - 7月在纽约AWS峰会上推出的Amazon Bedrock AgentCore企业级平台,使企业能够大规模部署和运营安全的AI代理[4] - AWS通过生成式AI创新中心额外投入1亿美元专门用于促进代理AI开发,以抓住市场需求[4][7] 模型产品组合扩展 - Amazon Bedrock在季度内增加了阿里巴巴的通义千问3基础模型和DeepSeek-V3.1模型,增强了编码、数学和推理任务的能力[5] - AWS在Amazon SageMaker AI中引入了Amazon Nova定制功能,使客户能够针对特定用例微调基础模型,实现更高的准确性和灵活性[5] 基础设施投资与产能 - 管理层指引资本支出将维持在第二季度建立的314亿美元的季度步伐,投资主要指向AI相关基础设施,包括数据中心容量、定制Trainium芯片和增强的冷却系统[6] - 积极的投资策略旨在解决管理层承认的限制增长潜力的供应限制问题[6] 增长驱动因素总结 - 代理AI的发展势头、扩展的模型产品以及基础设施瓶颈的解决为AWS在2025年第三季度取得稳定业绩创造了有利条件[8]
Amazon Set to Report Q3 Earnings: Should Investors Buy the Stock?
ZACKS· 2025-10-29 01:56
业绩预期与发布安排 - 公司计划于10月30日公布2025年第三季度财报 [1] - 第三季度净销售额预期区间为1740亿至1795亿美元,同比增长10%-13%,其中外汇汇率预计产生约130个基点的不利影响 [1] - 市场对第三季度净销售额的一致预期为1778.8亿美元,同比增长11.96% [1] - 市场对第三季度每股收益的一致预期为1.58美元,同比增长10.49% [2] - 市场对当前季度、下一季度、本年度及下一年度的每股收益预期呈现逐季上调趋势,当前分别为1.58美元、1.91美元、6.84美元和7.68美元 [3] 盈利预测与历史表现 - 公司的盈利惊喜历史表现优异,上一季度盈利超出市场预期26.32% [6] - 在过去四个季度中,公司每个季度的盈利均超出市场预期,平均惊喜幅度达22.98% [6] - 预测模型显示公司本次财报可能再次超出预期,因其拥有+12.61%的盈利ESP和Zacks第二级排名 [7] 亚马逊云服务增长动力 - AWS在第二季度收入达308.7亿美元,同比增长17.5% [11] - 第三季度AWS收入预计将增长18.4%至324.9亿美元,主要受人工智能基础设施投资驱动 [11][12] - 公司在第三季度推出了多项AI创新,包括Amazon Bedrock AgentCore以及向AWS生成式AI创新中心追加1亿美元投资 [13] - AWS在9月扩展了其模型产品,新增了Qwen 3基础模型和DeepSeek-V3.1 [13] 广告业务发展 - 广告业务在第二季度产生156.9亿美元收入,同比增长23% [14] - 公司推出了广告创新,使Amazon Marketing Cloud可直接通过广告控制台访问,并提供了无代码模板和AI辅助功能 [14] - 广告平台受益于Prime Video、直播体育和其他娱乐资产的全漏斗能力扩展,在美国拥有超过3亿消费者的平均广告支持受众规模 [15] 电子商务与会员服务 - 夏季Prime会员日首次延长至4天,覆盖26个国家,实现创纪录销售额,美国电子商务销售额达241亿美元 [16] - 会员日第三天销售额较2024年同期跃升165% [16] - 公司宣布Prime大促日将于10月7-8日回归,为第三季度内的假日购物季提供催化剂 [17] - 第三方卖家服务预计为另一增长驱动力,模型预期该部分收入达417亿美元,同比增长10.2% [18] 实体店与杂货业务扩张 - 实体店销售额预计为55.3亿美元,同比增长5.9% [19] - 公司在2025年8月执行了其最重要的杂货扩张之一,在超过1000个城市推出生鲜杂货当日达服务,并计划在年底前覆盖超过2300个地点 [19] - 对于订单满25美元的Prime会员,生鲜杂货当日达服务免费,早期试点市场数据显示客户参与度强劲 [20] 在线商店表现与AI应用 - 在线商店收入预计为663亿美元,同比增长8% [21] - 公司推出了生成式AI工具来提升购物体验,包括将产品摘要和评论转换为音频片段的功能以及自动 listing 优化能力 [21] - AI驱动的购物功能,如Rufus购物助手和AI购物指南,简化了产品研究并提高了转化率 [22] 股价表现与估值 - 公司股价年内上涨3.6%,同期零售-批发板块和标普500指数分别上涨7.7%和18.3% [23] - 公司目前交易于远期12个月市销率3.14倍,高于行业平均的2.23倍,显示估值较高 [27]
亚马逊云科技宣布接入OpenAI开放权重模型
搜狐财经· 2025-08-06 18:30
亚马逊云科技与OpenAI合作 - 亚马逊云科技宣布通过Amazon Bedrock和Amazon SageMaker AI平台提供OpenAI开放权重模型的访问服务 [1] - 此次合作旨在帮助客户快速构建生成式人工智能应用 [1] OpenAI模型技术特点 - OpenAI发布两款开放权重基础模型gpt-oss-120b与gpt-oss-20b [3] - 模型设计为低成本选项 支持本地运行、工具使用和思维链处理 [3] - 模型适合开发者和研究人员定制应用 [3] 战略意义与行业影响 - 开放权重模型将在生成式AI未来发展中扮演重要作用 [3] - 亚马逊云科技致力于成为运行AI模型的最佳平台 [3] - 合作是亚马逊云科技将前沿AI技术带给全球组织的自然延伸 [3] - 亚马逊云科技广泛的客户基础将为OpenAI先进技术获取方式带来变革性转变 [3]
企业落地AI,只靠DeepSeek还不够
虎嗅APP· 2025-03-11 18:38
DeepSeek-R1的技术特点与行业影响 - DeepSeek-R1凭借"认知预判"架构实现生成质量与推理速度的平衡,成为增速最快的大模型[1] - 单代AI技术"领先有效期"缩短至12-18个月,对企业形成频繁技术冲击[2] - 模型易产生"幻觉"源于其深度思考机制,需结合其他模型实现最佳效果[4] - 面临生成式AI"不可能三角"挑战:准确率、性能、成本难以同时优化[4] 企业级AI应用的核心痛点 - 企业需持续跟踪最新技术同时保证落地效果,形成双重压力[2] - AI应用搭建涉及训练部署等复杂环节,易导致高投入低回报[5] - 80%企业缺乏机器学习专家和数据科学家团队[9] - 技术迭代速度超过落地进程,导致"技术落地即过时"[11] 云计算厂商的解决方案优势 - 亚马逊云科技推出全球首个全托管DeepSeek-R1商用模型[7] - 云端优势体现为:更准确(180+可选模型)、更强性能(云原生架构)、更低成本(灵活计算资源)[8] - 提供模型蒸馏、安全防护、数据加密等开箱即用工具[7] - 资本支出达263亿美元(2024Q4),重点投入AI基础设施[16] 多模型战略实施路径 - 2027年80%中国企业将采用多模型策略应对功能需求[11] - Amazon Bedrock支持高低模型组合(如DeepSeek-R1+Nova)[11][12] - Nova模型性价比超Gemini 1.5 Flash,适用于客服/内容生成等场景[12] - 通过Marketplace实现"高级-中级-Good Enough"模型分层部署[11] 生产落地支持体系 - Amazon SageMaker提供集成开发环境加速模型部署[13] - "自动推理检查"功能有效抑制模型幻觉问题[13] - 92%行业领先企业计划增加云预算,63%增幅超6%[14] - 专门设计Tranium2 AI芯片强化训练推理能力[16] 云计算厂商的战略定位 - 构建聚合平台而非单一产品,专注客户需求实现[16] - 通过生态合作引入Anthropic/Cohere等50个云原生模型[10] - 保持技术绝对优势同时推动开放多赢生态[17] - 资本支出持续领跑全球云基础设施市场[16]