Agentic AI

搜索文档
专访AWS大中华区总裁储瑞松:Agentic AI在爆发前夜
21世纪经济报道· 2025-07-22 18:09
Agentic AI技术发展 - Agentic AI具备感知、推理、决策与执行能力,成为全球科技巨头重点押注方向[1] - OpenAI推出ChatGPT Agent,xAI发布Grok 4,强调多智能体协同、原生联网、超大上下文能力[1] - 技术要素已集齐:大模型推理能力、标准协议支撑、低幻觉高效率运行、多智能体协同[3] - MCP协议成为Agent访问企业数据与调用API的通用接口[3] - 过去两年推理成本下降280倍,每百万token成本大幅降低[4] - 大模型幻觉率一年内降低50%,最领先模型幻觉率低于1%,结合RAG后可降至0.3%[4] 云厂商战略转型 - AWS发布Amazon Bedrock AgentCore、AI Agents Marketplace、Amazon S3 Vectors等关键产品,建立"智能体即服务"基础设施[2] - 云厂商角色从算力服务商变为智能服务商,从底层基础设施扩展为AI Agent新阵地[3] - 未来竞争焦点在于让Agent真正跑起来并在真实世界"做成事",而非仅比较模型强弱[3] - AWS引入Automated Reasoning Checks技术,通过数理逻辑判断拒绝幻觉结果[5] 行业应用进展 - 软件开发领域效率成倍提升,Amazon Q Developer支持从需求文档到部署全流程自动化[8] - 先进企业已实现90%新代码由AI生成,研发效率显著领先[14] - 编程工作从传统团队模式转向"产品经理+AI开发者"一对一协作[13] - 企业分为Speed 1(主动拥抱AI)和Speed 2(观望犹豫)两类,落地节奏差异显著[9][10] 市场预测与趋势 - Gartner预测到2028年代理型AI自主决策比例将从0%升至15%,企业软件应用比例从不足1%增至33%[2] - 技术采用曲线显示早期采用者已通过AI实现业务价值,观望企业可能丧失竞争力[14] - AWS在中国服务近万家客户,涵盖出海、入华及本土创新企业[14] - 多智能体协同开发代码量从3000行缩减至20行,技术门槛大幅降低[7]
2025 Agentic AI应用构建实践指南报告
搜狐财经· 2025-07-20 16:08
Agentic AI核心概念与技术演进 - Agentic AI是基于大语言模型(LLM)的自主软件系统,通过感知、推理、规划与工具调用能力实现复杂任务自动化执行,技术演进从规则引擎发展到目标导向架构 [1][22] - 核心能力包括自然语言理解与推理(支持模糊指令逻辑分析)、自主规划与工具集成(通过思维链/树状思维分解任务)、记忆机制与闭环反馈(短期/长期记忆结合RAG技术) [3][25][28][31] - 系统分类:单Agent适用于特定领域简单任务(响应快、成本低),多Agent通过"主管-协作者"模型处理复杂任务(如投资分析、赛事诊断) [36][38] 技术架构与前沿技术 - 关键技术模块包括目标定义与任务管理(ReAct框架形成闭环)、环境交互与沙箱技术(硬件级虚拟化隔离)、多Agent通信协议(A2A/MCP协议标准化工具连接) [3][32] - 前沿技术包含Agentic RAG系统(动态获取最新数据)、Computer Use/Browser Use(自动化流程操作)、端到端训练内化模型能力 [4][25] 构建方案与场景适配 - 亚马逊云科技提供三类方案:专用Agent(Amazon Q,开箱即用)、全托管服务(Amazon Bedrock Agents,快速集成)、完全自建Agent(Strands Agents,深度定制) [1][12] - 选择依据包括任务确定性(专用Agent适合标准化流程)、灵活性需求(自建Agent满足特殊业务流程) [1] 行业应用案例与价值验证 - 金蝶国际:优化ERP系统智能提单流程,员工通过自然语言描述需求实现自动化单据提交 [1][12] - Formula 1:赛事根因分析从数周缩短至几小时,通过Agent分析日志数据提升诊断效率 [2][12] - 制造业:采购合同关键条款识别与物流单信息提取减少人工错误,金融领域:整合市场数据生成可视化决策报告 [4] 未来趋势与挑战 - 趋势:模型能力内化减少外部依赖、标准化协议推动"AgentOS"生态形成、通用与垂直场景分化(个人助理vs专业领域) [4][26] - 挑战:复杂任务推理链断裂、多Agent协同中的上下文丢失、幻觉问题需结合RAG提升输出可信度 [4][38] 市场前景 - 到2028年企业软件应用中33%将集成Agentic AI技术,技术发展推动各行业智能化变革 [26][5]
This Magnificent Artificial Intelligence (AI) Stock Is Down 50%. Buy the Dip, or Run for the Hills?
The Motley Fool· 2025-07-20 15:35
公司概况 - SoundHound AI是一家专注于语音人工智能和自主语音代理技术的公司 其核心技术包括"语音转语义"和"深度语义理解" 能够实时理解用户意图[3] - 公司在汽车和餐饮行业建立了稳固地位 现代和Stellantis等汽车制造商使用其车载语音助手 快餐连锁店将其技术应用于免下车点餐、电话订餐和自助终端[4] - 2024年以8000万美元收购Amelia后 公司业务扩展至医疗保健、保险和金融服务等面向消费者的行业[5] 技术发展 - 通过收购Amelia获得对话智能技术 将语音识别与对话智能相结合 转型为自主语音代理技术公司[6] - 推出Amelia 7.0平台 该平台能理解意图、进行推理、自然交互并自主完成任务 在中断或重新表述情况下表现优异[7] - 平台可与企业系统(ERP、CRM、银行系统等)集成 执行行业特定任务 如医疗预约安排、金融交易处理等[8][9] 财务表现 - 第一季度收入增长151% 但尚未实现盈利 毛利率承压[10] - GAAP毛利率降至36.5% 调整后毛利率为50.8% 主要受Amelia低利润率遗留合同和摊销成本影响[10] - 目标是将毛利率恢复至70%以上 2023年第四季度曾达到该水平[11] 市场机遇与挑战 - 语音AI和AI代理交叉领域市场潜力巨大 公司市值不足50亿美元 若成为主要参与者有较大增长空间[15] - 面临来自资源更丰富、用户基础更大的大型企业的竞争[12] - 股价从高点下跌超50% 但估值仍不便宜 未来表现取决于执行能力[1][12][13] 战略定位 - 公司定位为高增长潜力标的 适合能承受波动的长期投资者[16] - 成功关键在于执行能力 若成为领先的代理AI公司 当前股价下跌可能成为买入机会[13] - 技术优势并非唯一决定因素 历史案例显示市场地位和商业策略同样重要[14]
AI大家说 | Kimi K2:全球首个完全开源的Agentic模型
红杉汇· 2025-07-18 20:24
模型架构与技术特点 - 采用稀疏MoE架构,拥有1万亿总参数量,激活参数为320亿,包含384个专家,每个token选择8个专家进行计算,并设置1个共享专家提高通用性 [4] - 使用改进的MuonClip优化器,在15.5万亿tokens预训练规模下保持稳定,避免大模型常见的"训练崩溃"问题 [7] - 最大上下文长度达128K,擅长处理长文档理解、长对话及大规模检索任务 [8] 性能表现与基准测试 - 在SWE Bench Verified、Tau2、AceBench等测试中取得开源模型SOTA成绩,代码、Agent、数学推理能力领先 [8] - LiveCodeBench编程基准测试准确率53.7%,超越GPT-4.1(44.7%),OJBench得分27.1% [19] - SWE-bench Verified单次尝试准确率65.8%,超越多数开源模型 [21] - Tau2-bench加权平均值66.1%,AceBench英文测试准确率80.1%,MMLU-Pro多语言测试进入领先梯队 [25] 开源与商业化 - 模型权重和代码发布于Hugging Face与Github,采用MIT许可证,支持免费使用与修改 [24] - API定价为4元/百万输入tokens和16元/百万输出tokens,成本优势显著 [24] - 海外平台如OpenRouter、Cline、Visual Studio Code已宣布接入 [12] 行业影响与评价 - 英伟达创始人黄仁勋评价其为"全球最优秀推理模型之一",开源价值获全球认可 [9] - Hugging Face联合创始人称赞其突破闭源限制,《自然》期刊称其引发"DeepSeek时刻" [13][14] - Perplexity CEO计划基于K2进行后训练,科技媒体评价其"成本低廉、性能卓越" [12][16] 应用场景 - 擅长前端开发,可生成3D场景代码,支持粒子系统、可视化等复杂交互 [20] - 能自动解析13万行数据,生成统计图表与回归模型报告,适用于数据分析 [22] - 在EQ-Bench3情商测试与Creative Writing v3创意写作测试中登顶 [25]
为什么2025成了Agent落地元年?
虎嗅APP· 2025-07-18 18:20
行业趋势与格局演变 - 2023年生成式AI领域呈现"百模大战"格局,融资和刷榜是主要特征,但2024年市场迅速收敛至少数玩家的资本与技术持久战 [2] - 行业关注点从模型性能转向落地价值,核心命题转变为如何将大模型能力转化为业务生产力 [2] - Agent成为大模型落地的关键解决方案,AWS将其作为推动千行百业业务重构的核心技术 [3][4] Agent技术崛起驱动因素 - 大模型发布会普遍强调工具调用能力指标,如Kimi K2、Grok 4、Minimax M2和OpenAI最新ChatGPT Agent均聚焦多工具集成 [6] - Agentic AI爆发两大原因:Agent编排框架成熟(CrewAI/LangGraph/LlamaIndex)和标准化协议出现(MCP/A2A) [10] - LangChain调查显示超50%公司已部署Agent,80%正在研发;Gartner预测2028年33%企业软件将采用Agentic AI [10] AWS Agent解决方案架构 - Amazon Bedrock AgentCore提供七大模块降低构建门槛:Runtime(无服务器环境)、Memory(记忆系统)、Observability(可观测性)、Identity(身份管理)、Gateway(网关服务)、Browser(浏览器功能)、Code Interpreter(代码解释器) [15][16][17][18] - 解决方案支持按需组合使用,兼容主流AI框架与协议(MCP/A2A),内置企业级安全管控 [19] - 针对企业级需求推出S3 Vectors向量数据库(成本降低90%)、Amazon Nova模型定制功能、AI IDE产品Kiro(规范驱动开发/智能代理钩子) [22][25][26] 技术落地与商业化进展 - AWS Marketplace已上架上百种AI Agents & Tools,支持自然语言搜索直接部署 [11] - 当前Agent供需存在缺口,通用性Agent难以解决行业独特问题,需解决六大核心挑战:安全扩展、记忆系统、权限细化、复杂工作流工具、资源发现、交互追溯 [12] - S3 Vectors创新性实现冷热数据分层存储(低频存S3/高频存OpenSearch),支持10,000索引/数千万向量规模 [23][24] 行业变革特征 - 本轮AI浪潮区别于历史的关键在于:模型通用能力+基础设施成熟度(框架/数据库/接口/工具链)推动Agent从概念验证走向规模化落地 [29] - 技术革命本质体现为通过AWS等平台降低定制化门槛,使Agent成为各行业企业的专属解决方案 [30]
大厂入局“围猎”AI Agent,谁能先闯出路?
第一财经· 2025-07-18 17:21
行业动态 - 2025年被创业公司密集占据的Agent赛道迎来头部大厂下场,OpenAI发布ChatGPT Agent产品,融合Operator、DeepResearch和ChatGPT能力,团队合并为20到35人[1] - 亚马逊云科技发布Bedrock AgentCore服务,提供构建、部署和管理AI Agent的核心组件,其AGI实验室开发的Nova Act已能自主完成购物等复杂任务[1] - 中国一级市场对Agent赛道出现分歧,金沙江创投朱啸虎认为大模型会"吃"掉90%的Agent,将当前创业者比作面临淘汰的早期个人站长[2] 技术竞争 - ChatGPT Agent采用OpenAI o3同系列专用模型,使用端到端训练方法,区别于其他产品的多模型工程化组合[4] - 定价方面GPT Plus套餐每月20美元,与创业公司Manus基础计划每月19美元相比无明显价格优势[4] - 行业存在同质化、速度慢、技术缺乏代际差等问题,但专用模型迭代将成为技术门槛核心[10] 商业模式 - OpenAI计划开发电子商务功能,测试ChatGPT内部集成结账系统,可能对交易抽取约2%分成[5] - 亚马逊向生成式AI技术创新中心追加1亿美元投资,与Meta合作支持初创企业利用Llama模型[5] - 单纯依赖工具收费的路径将面临营收压力,行业将从"概念炒作"迈入"实用主义"[10] 市场格局 - 通用类Agent领域进入成熟期,成为大厂赛道,而具备交付能力的垂类Agent仍存创业机会[5] - 当前Agent产品普遍面临用户黏性不足问题,收费后用户流失严重[8] - Gartner预测到2027年底40%的Agentic AI项目将被取消,主要因成本高和商业价值有限[8] 行业挑战 - Gartner指出存在"智能体包装"现象,仅19%公司对Agentic AI进行大量投资,42%持保守态度[9] - 部署障碍包括数据格式不兼容、系统接口老旧、权限流程漫长等AI1.0时代遗留问题[9] - 行业加速迈入分化路口,平台化能力将倒逼中小创业者向垂直场景深耕[10]
华泰证券今日早参-20250718
华泰证券· 2025-07-18 14:14
核心观点 - Agentic AI将带来Token调用量10倍以上增长,从而带来算力需求100倍以上提升,目前市场对于算力需求有较大的预期差,未来算力需求空间广阔;预计三季度开始关税将推高美国通胀,幅度可能不及此前预期,但关税对通胀传导的持续性可能超预期;国内债券ETF规模或可达万亿级别,信用债ETF规模占比应超过一半;看好AI需求持续驱动台积电先进节点收入增长以及公司先进制程领域的技术护城河;预计百度搜索产品AI改造在2025年内对核心广告收入增长有压力,其自动驾驶业务海外入局或打开中长期成长空间;英伟达获准恢复H20芯片对华出口,投资者需关注美国出口管制政策及中国高端芯片自主研发进展;看好特步国际中长期竞争优势和发展 [2][4][7][9][10][11][12] 科技/计算机 - 推理和Token调用量之间不是线性关系,多Agent协作和多工具调用带来Token消耗量倍数增长;Token的增长与算力硬件需求之间也不是线性关系,Token量增长10倍,所需算力量可能增长100倍;Agentic AI将带来Token调用量10倍以上增长,从而带来算力需求100倍以上提升,目前市场对算力需求预期差大,未来算力需求空间广阔 [2] 电子 - ASML二季度业绩符合指引,新签订单环比大幅提升,逻辑客户订单环比降幅较大;ASML指引3Q25收入为74 - 79亿欧元,中位数同比+2.5%,环比-0.5%,低于市场预期,2025年收入增长15%,约325亿欧元,毛利率约52%,EUV业务增长30%;人工智能需求强劲,HBM及DDR5带动存储需求保持强劲,宏观经济和地缘政治带来的不确定性增加,无法确认2026年成长性;预计国内先进制程、存储扩产需求旺盛,半导体国产化加速,光刻机环节国产化亟需突破 [3] 宏观 - 年初以来美国显著提高对全球关税,但因关税落地存在时滞、贸易重构、库存、需求偏弱等因素,关税对通胀传导暂不显著;预计三季度开始关税将推高美国通胀,幅度可能不及此前预期,但传导持续性可能超预期;联储可能在9月降息,4季度后移民政策滞后影响及“大美丽”法案宽松效应可能与关税传导一起推高通胀水平,2026年货币政策不确定性上升 [4] 金工 - 提出LLMRouter - GRU神经网络,将大语言模型对新闻舆情的情感分析能力引入AI量价模型,构建“舆情分诊台”;该结构通过对原有神经网络轻量级改造,基于市场情绪动态选择稀疏专家路由,实现“情绪分域,量价建模”;实证表明该模型能有效融合另类舆情信息与量价数据,提升指数增强组合表现,在回测区间2022 - 12 - 30至2025 - 06 - 30内,舆情覆盖度高的300增强年化超额提升达3.0pct,信息比率与最大回撤也有明显改善 [5] 固定收益 - 2025年信用债ETF高速增长,截至7月15日,总规模达2591亿元,在债券ETF市场中占比高达60%;目前上市交易的信用债ETF共21只,包括1只短融、1只城投债、1只公司债、8只基准做市信用债和10只科创债ETF;未来国内债券ETF规模或可达万亿级别,信用债ETF规模占比应超过一半,品类可进一步丰富,如更多期限、细分策略、挂钩境外如南向通债券ETF、跨市场信用债ETF等 [7] 重点公司 瀚蓝环境 - 为环保运营龙头企业,主要从事固废处理、燃气、供水和污水处理等业务;2025年5月底完成收购粤丰环保,垃圾焚烧处理产能达97590吨/日,跃居全国第三,瀚蓝和粤丰资产均以广东省内为主,盈利能力较好,合并后运营规模增加,考虑财务费用等成本后测算EPS增厚21%,“瀚蓝模式”赋能下粤丰资产盈利提升空间明显,看好内生增长和并购整合驱动业绩持续成长,维持买入评级 [8] 台积电 - 2Q25收入USD30.07bn,环比+17.8%,超过指引上限,主要因3/5nm需求强劲;毛利率58.6%,环比-0.2pct,接近指引上限的59.0%,海外晶圆厂的稀释以及新台币升值不利因素部分被产能利用率提升及成本改善措施所抵消;预计3Q25收入318 - 330亿美元,中位数环比+8%,高于彭博一致预期2%,预计3Q25毛利率55.5% - 57.5%,中位数环比下降2.1pct,低于彭博一致预期0.7pct;上调2025年收入指引,同比增长约30%,维持2025年资本开支预期为380 - 420亿美元,中位数同比增长34%;看好AI需求持续驱动先进节点收入增长以及公司先进制程领域的技术护城河,上调2025 - 2027收入预测1.9%/1.7%/1.1%,考虑汇率影响,调整归母净利润预测0.6%/-1.6%/-1.9%至1528/1820/2156十亿新台币,上调目标价到300美元,维持买入评级 [9] 百度集团 - 预计百度持续推进的搜索产品AI改造或将在2025年内持续对核心的广告收入增长带来一定压力;伴随AI转型实践逐步迈入深水区,用户侧数据亦逐步出现边际改善趋势,建议持续关注改造进展及用户反馈;近期公司自动驾驶业务在海外市场的积极入局或为其打开可观的中长期成长空间,建议持续关注公司与海外平台业务合作进展及商业化变现节奏,维持“买入”评级 [10] 英伟达 - 获准恢复H20芯片对华出口,受此利好消息驱动,7月15日收盘时股价涨4.0%,提振了整体半导体板块的市场情绪,当日博通、SMCI、美光、VRT和CRWV等相关标的亦表现强劲;7月16日举办的第三届北京链博会上正式发布RTX PRO 6000D,市场普遍猜测该产品即为此前传闻中的B40型号,预计这款芯片的内存配置将沿用原RTX Pro 6000的设计,搭载96GB GDDR7,而非采用HBM技术,且不集成NVLink互联,跟游戏显卡的架构更接近,Financial Times预计最快将于今年9月面市;竞争对手AMD也获准恢复MI308芯片对华出口,其股价在同日上涨6.4%;投资者需持续关注美国出口管制政策的动态演变及其“朝令夕改”对半导体板块带来的影响,以及中国在高端芯片自主研发领域的突破性进展,上调目标价至195美元 [11] 特步国际 - 公司公布2Q25及1H25运营情况,主品牌2Q25流水同比低单位数增长,索康尼2Q25流水同比增长超20%,环比放缓,25H1主品牌取得中单位数增长,索康尼同比增长超30%;中长期看,公司通过加速布局主品牌DTC战略,拓宽索康尼产品矩阵,拓展专业户外运动打造第二增长曲线,看好公司中长期的竞争优势和发展,维持“买入”评级 [12] 评级变动 | 公司/个股 | 代码 | 目标价(元) | 评级调整 | 2025EPS(元) | 2026EPS(元) | 2027EPS(元) | 日期 | | --- | --- | --- | --- | --- | --- | --- | --- | | 哈原工 | KAP | 58.91 | 买入(首次) | 2502.61 | 3369.83 | 4438.86 | 2025 - 07 - 14 | | 石英股份 | 603688 | 37.30 | 增持(首次) | 0.62 | 0.92 | 1.25 | 2025 - 07 - 14 | | 古茗 | 1364 | 35.27 | 买入(首次) | 0.88 | 1.07 | 1.28 | 2025 - 07 - 13 | [13]
AI/R Company Accelerates Oracle Fusion Apps AI Agent Studio Implementation
GlobeNewswire News Room· 2025-07-18 03:51
战略合作 - AI/R宣布战略计划帮助Oracle Fusion Cloud Applications客户快速实施并最大化Oracle AI Agent Studio功能[1] - 基于Oracle 2025年3月发布的AI Agent Studio平台,公司定位为企业实现业务流程AI转型的首选实施合作伙伴[1] 技术平台 - Oracle AI Agent Studio是综合性平台,支持客户零成本创建、扩展、部署和管理企业级AI代理[2] - 平台包含50+预置AI代理,通过用户友好工具和预制模板降低AI代理创建门槛[2] - 平台核心能力包括原生Fusion集成、复杂工作流代理团队编排、预制代理修改扩展性,以及支持Oracle优化和第三方大语言模型选择[4] 实施优势 - AI/R凭借6,000+AI与数字化转型专家团队,以及25年Oracle战略合作积累的产品知识提供独特价值[3] - 专有平台AI Cockpit、AI/SmartEngineering、AI/AgentsBuilder与Oracle AI Agent Studio形成协同,加速财务、HR、供应链等领域的实施[3] - 实施方法论强调为业务用户简化AI代理创建,同时确保测试验证与安全框架,推动从部门试点到企业级部署的跨越[5] 行业影响 - 该合作代表企业自动化和智能流程优化范式的转变,将释放代理式AI在全业务生态的变革潜力[4] - AI代理正成为企业运营转型的核心,实施重点在于连接技术能力与实际商业成果,帮助客户获得可衡量的投资回报和竞争优势[5] 公司背景 - AI/R总部位于加州,是专注代理式AI软件工程的企业,通过专有AI平台和战略合作伙伴生态系统推动行业革命[6] - 公司使命是将AI革命普及化,在提升数字化转型标准的同时增强人类智能[6]
Token推动计算Compute需求:非线形增长
华泰证券· 2025-07-17 18:46
报告行业投资评级 - 科技行业评级为增持(维持),计算机行业评级为增持(维持) [6] 报告的核心观点 - 未来算力需求中存在Token调用量随推理扩展倍数增长、算力需求随Token增长倍数增长两个倍数关系,共同决定推理端未来算力需求广阔,目前市场存在较大预期差,长期看好算力需求持续快速增长 [89][90] 根据相关目录分别进行总结 New Scaling:不止于预训练,三条Scaling推动算力需求增长 - 市场认为预训练Scaling law可能见顶,但考虑后训练Scaling和推理Scaling,AI对算力需求仍有大量空间 [10] 从三条Scaling law的差异看为什么算力需求将继续增长 - 预训练和后训练Scaling属训练阶段,推理Scaling属推理阶段 [11] - 预训练Scaling性能和数据、参数量相关,后训练Scaling利用微调等技术提高模型能力和领域特异性,推理Scaling性能与推理时间相关 [13] 推理Scaling的必要性和算力消耗量化 - 推理Scaling能大幅提高模型回答困难问题能力,是通往Agentic AI的重要路径 [15] - 预训练受训练数据约束,推理Scaling能提高模型性能,特别是困难问题方面 [15] - 推理模型的Token消耗可能是传统模型的10倍左右 [18] Grok系列模型的发展对应了三条Scaling曲线 - Grok系列模型发展历程对应三条Scaling曲线,Grok 3对应预训练阶段的Scaling law,Grok 4对应后训练与推理过程的Scaling law [19] - Grok 4在HLE测评集上的突破证明了推理Scaling的有效性 [22] 从Deep Research看Agentic对Token量的影响 - Deep Research是“Agentic化”的AI Search,以其为研究Agentic AI的抓手,分析Token量变化并拓展到广泛Agentic AI场景进行量化 [28] - Agentic AI与狭义AI Agent存在差异,前者涉及多流程多工具调用,任务更复杂 [32] Deep Research是研究Agentic AI的重要抓手之一 - AI Search成为Token消耗的重要组成,Google Token量增长可能源于搜索业务 [34] - Deep Research产品是AI Search的Agent路径拓展,被多家厂商竞相推出 [37] Deep Research的Token多在哪?基于底层系统设计视角的分析 - 以Anthropic的Deep Research系统设计为例,其将任务分配给多个Agent,带来成倍Token消耗 [41] - 搜索过程是迭代式的,Token量进一步增加 [44] 从Search到Research,量化Agentic的Token影响 - Anthropic Deep Research的Token消耗达到聊天的15倍 [46] - Google/OpenAI Deep Research的Token消耗量可能接近聊天的50倍 [50] - Agent使用和多工具调用能进一步提升Grok 4在HLE测试中的结果 [55] Deep Research在Agentic AI中并不复杂,真实Token量会更高 - Deep Research任务相对简单,普遍的Agentic AI会有更高Token消耗量,未来Token量增长可能是指数增长 [57][58] Token量的增长会带来算力需求的非线性增长 - 算力需求增长远高于Token量的增长,Token量增长10倍,所需算力量可能增长百倍 [60] 延迟和吞吐量是推理过程中两个重要指标 - 延迟和吞吐量是推理过程的关键指标,相互关联,分别决定用户使用体验和厂商总任务处理量 [61] 为什么延迟和吞吐量互相制约?中间变量——批处理 - 为提升吞吐量需进行批处理,延迟随批量大小线性增长,吞吐量随批量增长先增后缓,两者相互制约 [68] 模型厂商的帕累托最优需要追求“量价”的平衡 - 模型/AI应用厂商需追求用户使用量与AI服务质量之间的平衡,实现收益最大化 [74] 增加硬件是实现模型最优收益边界前移的重要方式 - 增加硬件可减少模型服务延迟,实现模型最优收益边界前移,算力需求增长与Token增长呈倍数关系 [81][82] 总结:两个倍数关系决定未来推理算力需求空间广阔 - 未来算力需求中Token调用量随推理扩展倍数增长,算力需求随Token增长倍数增长,决定推理端未来算力需求广阔 [89] 产业链相关公司 - 海外算力链涉及PCB、铜互联、光模块光器件光芯片相关公司,国内算力链涉及中芯国际、寒武纪等公司 [92]
昨晚,云计算一哥打造了一套Agent落地的「金铲子」
机器之心· 2025-07-17 17:31
多智能体AI技术趋势 - 多智能体技术成为大模型发展的下一个重要方向,Grok 4、Kimi K2等产品已展示其自主理解环境、规划行动和利用工具解决复杂问题的能力[1][2] - 大语言模型(LLM)正进入重大版本迭代阶段,新技术落地速度超预期,亚马逊云科技已推出Agentic AI全套解决方案[3][4] - AI Agent具备任务规划、长期记忆和自主学习能力,将深刻改变软件构建方式和人机交互模式[6][7] 亚马逊Agentic AI技术架构 - 推出Amazon Bedrock AgentCore架构,包含7项核心服务,支持企业级安全Agent的构建与部署[13][14] - 提供端到端开发工具链:Runtime(隔离环境)、Memory(记忆管理)、Observability(可视化调试)等七大组件[18][23] - 该架构显著降低AI应用部署成本,使智能化产品首次具备大规模实用性[20][21] 模型生态建设 - Amazon Bedrock托管模型厂商从7家增至12家,新增TwelveLabs等支持文本/音视频/编程多模态能力[24] - Nova基础模型家族6个月内新增8款模型,包括浏览器操作型Nova Act(任务完成率>90%)和语音模型Nova Sonic[29][34] - 平台支持10000+客户使用Nova系列模型,形成从轻量级到高性能的完整产品链[30][31] 多Agent协作开发 - Strands Agents SDK升级至V1.0,支持MCP和A2A协议,将复杂开发工作从数月缩短至数小时[38][39] - 引入四大协作原语:Agents-as-Tools(任务委派)、Swarms(自组织团队)等,实现从串联到主动协作的跨越[41][42] - 新增会话管理器和异步执行能力,满足生产环境大规模部署需求[44] 数据与成本优化 - 推出原生向量存储服务S3 Vectors,降低90%存储成本同时保持亚秒级查询性能[48][50] - 集成Amazon Bedrock知识库支持低成本RAG应用开发,联动OpenSearch实现分层向量策略[52] - 构建Agent应用市场,提供即插即用解决方案加速AI战略落地[53][55] 应用场景革新 - 开发工具Kiro实现规范驱动开发,自动生成任务/测试/文档,结构化流程提升交付效率[56][57] - 通过Amazon Q、Bedrock Agents、Strands Agents三大工具覆盖企业全场景Agent部署需求[58] - 技术成熟度领先行业,提供唯一支持自动推理检查的幻觉防护机制和跨模型安全评估API[66]