Agent Toolkit
搜索文档
NVIDIA Corporation (NVDA) Unveils Agent Toolkit For Creating Specialized AI Agents
Yahoo Finance· 2026-03-21 20:43
公司战略与定位 - 公司是人工智能计算领域的绝对领导者 提供涵盖硬件、软件和服务的全栈平台 用于AI开发、训练和推理 [5] - 公司已完成转型 从GPU制造商转变为AI基础设施公司 其技术正推动生成式AI、大语言模型和物理AI(机器人)的发展 [5] - 公司正积极拓展AI能力并巩固跨行业合作伙伴关系 旨在抓住预计到2027年将超过1万亿美元的计算需求 [4] 新产品发布 - 公司于3月16日发布了Agent Toolkit 这是一个新的开源软件平台 专为构建自主企业级AI智能体而设计 [1] - Agent Toolkit包含OpenShell开源运行时 提供基于策略的安全、网络和隐私控制 [1] - 该工具包包含开源模型和软件 例如NVIDIA Nemotron系列中的NVIDIA AI-Q和NVIDIA cuOpt 供企业和开发者构建可扩展生产力的工具 [3] - 开发者可利用该工具包创建能够自主行动的专业化AI智能体 NVIDIA AI-Q能帮助开发者构建感知、推理并基于企业知识采取行动的定制化AI智能体 [3] 市场拓展与合作 - 公司正与主要的汽车和云服务公司建立合作伙伴关系 以扩大市场覆盖范围 [4]
英伟达押注OpenClaw并添加安全层,详解NemoClaw工作原理
搜狐财经· 2026-03-18 06:02
核心观点 - 英伟达在GTC大会上宣布推出NemoClaw堆栈,旨在通过增强隐私和安全性来加强并推广OpenClaw智能体平台,将OpenClaw定位为个人AI的基础,并预示企业AI智能体的发展将加速软件和知识工作的代际转变 [2][4] - 公司同时成立了Nemotron联盟,联合多家AI实验室和开发者,通过共享资源与计算来推进开源AI模型的发展,旨在加速AI进展并加强开放的生态系统 [5][6] 产品发布:NemoClaw与OpenShell - NemoClaw是一个新的软件堆栈,专为加强OpenClaw智能体平台而构建,旨在解决OpenClaw因自主能力和访问用户信息而带来的重大安全风险问题 [2][6] - NemoClaw集成了英伟达新推出的开源运行时OpenShell,该运行时通过执行基于组织策略的防护措施、将模型沙盒化来增强数据隐私和智能体安全性,并提高智能体的可扩展性 [3][6] - OpenShell由英伟达与CrowdStrike、思科和微软安全等安全公司合作构建,以确保其与其他网络安全工具的兼容性 [3][7] - NemoClaw可通过单个命令安装,在任何平台上运行,并允许在本地系统上使用任何编码智能体,包括英伟达自己的Nemotron开放模型系列 [3] - 通过隐私路由器,NemoClaw允许智能体结合使用云端的前沿模型和本地模型,帮助在隐私防护措施内训练智能体完成任务 [3] 战略定位与行业愿景 - 英伟达将OpenClaw视为个人AI的基础,并与OpenClaw创始人合作,称该智能体平台是“历史上最重要的软件发布” [2] - 公司CEO黄仁勋提出,OpenClaw预示了一条新路径:智能体即服务,而非传统的软件即服务 [5] - 推进企业AI智能体将“加速软件和知识工作的代际转变”,企业软件的下一阶段将完全关于专业化智能体 [4] - 英伟达的新Vera Rubin基础设施旨在支持这种智能体AI驱动,据称将在过程中降低成本 [4] - 英伟达希望额外的安全性能让OpenClaw智能体更受欢迎、更易于访问,风险比目前更小,从而让企业更安心地使用AI智能体为员工完成以前不会采取的行动 [3] 生态合作与开发者支持 - 开发者即日起可访问英伟达的Agent Toolkit和OpenShell,可与LangChain一起使用,或直接从GitHub下载以在本地运行 [5] - 企业可以通过AWS、Google Cloud和Microsoft Azure等云提供商创建和部署AI智能体 [5] - 英伟达成立了Nemotron联盟,初始成员包括Thinking Machines Lab、Perplexity、Cursor、Mistral AI和Sarvam等模型开发者和AI实验室 [5][7] - 联盟旨在通过共享资源和计算推进开源AI,加速AI模型进展,将智能扩展到任何单一模型之外,并加强开放的生态系统 [6][7] - 作为合作首例,Mistral AI和英伟达将共同开发一个在英伟达DGX™云上训练的开放模型并开源结果,该模型也将成为英伟达即将推出的Nemotron 4模型系列的基础 [5]
黄仁勋的Token经济学
经济观察报· 2026-03-17 22:23
文章核心观点 - 英伟达CEO黄仁勋在GTC大会的演讲核心并非仅是提出万亿美元的AI基础设施需求预期,而是阐述了一套新的商业逻辑:数据中心正从训练模型的场所转变为生产Token的工厂,这背后是AI推理需求爆发、Token分层定价以及硬件架构革新共同驱动的商业模式变革 [1][4] GTC大会与市场反应 - 2025年3月16日至19日,英伟达在美国圣何塞举行GTC大会,黄仁勋发表超过两小时主题演讲 [2] - 黄仁勋预测,到2027年全球AI基础设施相关需求将达到1万亿美元,并认为实际需求可能更高,产品将供不应求 [2] - 此预测发布后,英伟达美股股价瞬时跳涨超过4% [2] - 然而A股算力产业链股票在次日开盘后集体下跌,天孚通信收盘跌幅超10%,长光华芯收盘跌幅达9.72%,多数龙头股回吐了近5日涨幅 [2] - 市场落差源于时间尺度差异,黄仁勋讲的是未来需求,且下一代Feynman芯片架构要到2028年才上市,同时A股电子板块当时平均市盈率约82倍,市场存在估值担忧 [3] Token工厂:新的商业逻辑 - Token是大语言模型处理信息的基本单位,一个汉字大约对应一到两个Token [6] - AI消耗Token的量级自2022年底ChatGPT上线后经历了数次跳跃:ChatGPT使AI学会生成内容;o1模型使AI学会推理和反思;Claude Code使AI能执行复杂任务,单任务消耗Token量比简单对话多出好几个数量级 [7] - AI工作分为训练和推理两个阶段,过去全球购买GPU主要用于训练,现在重心已向推理转移 [8] - 推理服务商的业务规模过去一年增长了100倍,国内推理服务器在出货金额上占比已接近60% [8] - Token尚未形成统一市场定价体系,黄仁勋提出了未来可能出现的五档分层定价:免费层、中等层(每百万Token约3美元)、高级层(每百万Token约6美元)、高速层(每百万Token约45美元)、顶级层(每百万Token约150美元) [9] - Token价格取决于模型大小、上下文长度和响应速度,顶级层定价对应的是AI能处理此前无法完成的任务,例如一次性读完一整份合同或整个代码库 [9] 数据中心经济模型的变革 - 数据中心受电力限制,在固定功率下,单位电力产出Token最多的运营者生产成本最低 [11] - 黄仁勋展示了一组数据:同一个1吉瓦(GW)的数据中心,使用当前Blackwell架构年营收约300亿美元,换用新一代Vera Rubin架构约1500亿美元,再加上Groq LPU推理加速器后可达约3000亿美元,同一数据中心换设备后营收可相差10倍 [11] - 英伟达2026财年全年营收2159亿美元,其中数据中心业务贡献1937亿美元 [12] - 万亿美元需求预期的逻辑在于:客户现有数据中心未被充分利用,换上新一代设备后,在同等电力条件下可通过生产更多、更贵的Token使收入翻数倍 [12] - 未来企业CEO将密切关注其“Token工厂”的效能,因为这直接关系到收入 [13] - 随着工程师日常广泛使用AI工具,企业为员工使用AI的开销将大到需要单独列预算,黄仁勋预测未来每位工程师入职时获得的年度Token预算金额大约相当于其基础薪资的一半 [13][14][15] 硬件架构:Vera Rubin平台与Groq LPU - GTC大会上正式发布了Vera Rubin平台,这是一个完整的系统而非单一芯片,采用百分之百液冷设计,安装时间从两天压缩到两小时 [17] - Vera Rubin核心机架NVL72集成72颗Rubin GPU和36颗Vera CPU,通过NVLink 6相连,与上一代Blackwell相比,每瓦推理吞吐量最高提升10倍,单Token成本降至十分之一 [17] - 同时发布了全新88核Vera CPU,为AI智能体场景优化,微软CEO确认首批Vera Rubin机架已在Azure上运行 [18] - Vera Rubin在处理高并发Token生成(如每秒超过400个Token)时存在带宽短板,此缺口由Groq公司的LPU技术补足 [19] - Groq LPU与GPU是两种不同的芯片:GPU内存大(如Rubin GPU有288GB)、算力强,适合复杂计算;LPU内存小(仅500MB)但读写速度极快,在生成Token的速度和延迟上远优于GPU [19] - 英伟达通过Dynamo推理调度软件实现“解耦推理”:将需要大量算力和内存的上下文理解交给Vera Rubin处理,将对延迟敏感的Token生成交给Groq LPU,两者通过以太网协同工作,延迟减少约一半 [19] - 这套组合在高速层(45美元/百万Token)和顶级层(150美元/百万Token)实现了相比上一代35倍的性能提升 [20] - 从更长维度看,同一个1GW数据中心,Token生成速率可在两年内从每秒2200万提升到7亿 [20] - 黄仁勋建议客户:若以高吞吐批量推理为主,可完全使用Vera Rubin;若有大量编程、实时交互需求,可将25%的数据中心算力配置Groq LPU [20] - Groq 3 LPU由三星代工,已在量产,预计2025年第三季度出货 [21] 软件生态与未来路线 - 软件方面,英伟达发布了企业级智能体平台NemoClaw,为近期火爆的开源项目OpenClaw增加企业安全层 [21] - OpenClaw在几周内成为GitHub上增长最快的开源项目,黄仁勋将其地位抬升至与Linux同级,称其为智能体计算机的操作系统 [21] - Adobe、Salesforce、SAP等17家企业软件公司已宣布采用英伟达的Agent Toolkit [21] - 路线图方面,英伟达预告了2028年上市的下一代Feynman架构,首次同时支持铜缆和CPO(共封装光学)两种互连方式 [21] - 2025年是CUDA诞生20周年,英伟达目前60%的业务来自全球前五大云服务商,另外40%分布在主权AI、企业、工业、机器人等领域 [21] 其他领域合作 - GTC大会上,英伟达宣布了与Uber、比亚迪、吉利、现代、日产、五十铃在自动驾驶领域的合作 [22] - 受此消息推动,港股汽车板块在3月17日集体走强,吉利汽车盘中一度涨超5%,最终收涨4.55% [22]
“AI牛市叙事”再掀巨浪! 黄仁勋抛出万亿美元AI宏图,英伟达扬帆起航冲6万亿美元市值
智通财经· 2026-03-17 14:12
公司战略与愿景 - 公司正从单一的AI GPU供应商,彻底重构为“AI工厂”或“AI基础设施总包商”,其竞争单位已从单颗芯片升级为整座AI工厂 [1][4][9][11] - 公司CEO黄仁勋在GTC大会上将AI算力基础设施的营收机遇上调,预计到2027年至少达到1万亿美元,远高于此前提出的到2026年5000亿美元的目标 [1][4][10][13] - 公司旨在定义下一代“AI工厂”的生产函数,核心指标从训练峰值性能转向单位电力下的token产出、单token成本及首次生产时间 [4][5][10] 财务与市场预期 - 华尔街分析师平均目标价显示,公司股价未来12个月内有51%的上行潜力,目标价达273美元,对应市值约6.6万亿美元,最乐观目标价高达360美元 [1][12] - 高盛等机构认为,公司提出的万亿美元营收前景为市场提供了长周期需求背书,缓解了投资者对“AI资本开支可能在2026年见顶”的担忧 [13][14] - 截至新闻发布时,公司股价收于183.220美元,市值约4.45万亿美元,市场预期其市值将突破5万亿美元并迈向更高点位 [1][12] 产品与技术路线图 - 公司正式推出基于Blackwell架构的下一代平台Vera Rubin,并预告了Feynman架构的路线图,下一代平台将引入Rosa CPU、LP40 LPU等新组件 [5][7] - 在硬件层面,公司将CPU、GPU、LPU、DPU、网络交换芯片和存储架构整合成平台级系统,推出了Vera CPU、Rubin GPU、NVLink 6 Switch、Groq 3 LPU等产品 [6] - Vera Rubin NVL72平台相比Blackwell可实现最高10倍的每瓦推理吞吐,单token成本降至十分之一,训练大规模模型所需GPU数量可降至四分之一 [5] - 公司通过收购Groq获得技术授权,推出LPU AI推理算力基础设施系统,并将AI推理拆分为prefill(由Vera Rubin负责)和decode(由Groq AI芯片负责)两段,采用异构计算方案 [2][6][14] - 官方数据显示,Vera Rubin与LPX协同可实现最高35倍的每兆瓦推理吞吐,并为万亿参数模型带来最高10倍的营收机会 [14] 软件与生态系统 - 公司推出Dynamo 1.0,将其定义为AI工厂的推理操作系统,官方称其对Blackwell平台可带来最高7倍的推理性能提升 [7] - 在智能体(Agentic AI)方向,公司推出Agent Toolkit、OpenShell、NemoClaw等工具,并将OpenClaw上升为“个人AI的操作系统”式平台 [7] - 公司扩展了Nemotron、Cosmos、Isaac GR00T、BioNeMo、Earth-2等开放大模型家族,强化软件生态 [7] 市场定位与竞争格局 - 公司正从“训练霸主”进一步扩张为“AI算力推理基础设施总包商”,以应对在推理计算领域来自CPU及谷歌TPU等定制AI ASIC处理器的竞争 [2][10][14] - 公司强调“极限协同”设计理念,将计算、网络、存储、软件、供电和冷却作为一个整体进行优化,以在固定电力预算下实现最佳经济效益 [4][5] - 高盛认为,公司在电力受限、时延敏感的推理时代,拿出了更强的变现框架与更完整的异构算力答案,巩固了其护城河 [14] 业务扩展与新市场 - 公司将“物理AI”与“空间计算”纳入战略,IGX Thor已进入通用可用阶段,面向工业、医疗、机器人和轨道边缘计算 [8] - 公司推出Open Physical AI Data Factory Blueprint,用于加速机器人、视觉AI智能体和自动驾驶的数据生成与评估 [8] - 公司将Vera Rubin架构延伸至太空,Space-1 Vera Rubin Module相较H100可为太空推理带来最高25倍的AI算力 [8] - 公司正将“AI工厂”的范式从云数据中心扩展至跨云、边、端、车、机器人及太空的统一基础设施 [8][9] 行业影响与叙事 - 公司抛出的万亿美元AI算力宏图,旨在撑起资本市场的“AI牛市叙事”,并带动全球AI算力产业链迈向新一轮上行轨迹 [1] - 全球投资者将围绕公司、谷歌TPU集群与AMD的“AI牛市叙事”,继续锚定为全球股市中最具确定性的景气投资叙事之一 [1] - 电力、液冷散热系统、光互连供应链等与AI训练/推理密切相关的投资主题,将继续位列股票市场最火热的投资阵营 [1]
Can PayPal’s Latest AI Bet Spark a Stock Revival?
Yahoo Finance· 2026-01-23 01:32
公司股价表现与市场担忧 - 公司股价在过去一年中下跌了39% [2] - 当前股价约57美元,徘徊在2017年水平附近,凸显了约八年的增长停滞 [3][8] - 股价表现引发市场对公司增长前景的质疑,尤其是在支付领域竞争加剧的背景下 [3] 竞争环境与市场地位 - 投资者担忧公司的竞争地位,因Apple Pay和Stripe等支付替代方案激增 [2] - 金融科技竞争对手提供无缝集成和更低费率,侵蚀了公司在数字交易中的市场份额 [2] - 在智能体商务领域,公司面临来自Stripe和Shopify的激烈竞争 [8] 战略举措:收购Cymbio与智能体商务布局 - 公司宣布同意收购Cymbio,这是一家成立于2015年、总部位于特拉维夫的多渠道协调平台 [4] - Cymbio自动化品牌与零售商之间的连接,管理产品数据、库存同步、订单协调和计费 [4] - 该平台使品牌能够在Microsoft Copilot和Perplexity等智能体界面以及传统电商渠道上销售 [4] - 此次收购基于公司与Cymbio的现有合作关系,公司旗下的PayPal Ventures曾在2022年投资该公司 [5] - 交易预计在2026年上半年完成,Cymbio的平台和团队将整合到公司的Store Sync功能中 [5] 技术整合与产品功能 - Store Sync功能旨在使商家的产品目录在AI界面中可见并可购买,订单可回流至商家现有的履约系统 [6] - 商家保持作为销售记录方的控制权,维持直接的客户关系,并处理自己的品牌事宜 [6] - 公司多年来一直致力于开发AI驱动工具,例如在2024年推出了用于个性化优惠的智能收据和利用AI预测客户购买的高级优惠平台 [7] - 到2025年,公司扩展了智能体商务服务,包括与Microsoft、Google和OpenAI合作,提供AI集成支付 [7] - 公司提供了如Agent Toolkit等开发者工具,用于构建处理支付和订阅等工作流程的AI智能体 [7] - 去年九月,公司通过AI增强了其Honey应用,以在聊天机器人中提供实时推荐和优惠 [7] 收购的战略意义 - 收购Cymbio旨在扩大商家在Microsoft Copilot和Perplexity等AI平台上的影响力 [8] - 尽管在欺诈预防和身份验证方面有优势,但公司在智能体商务领域面临激烈竞争 [8]
Mastercard to Enhance Payments, Enable Blockchain and AI Adoption with Key Updates
Crowdfund Insider· 2025-09-18 05:32
区块链与数字资产计划 - 公司加速推进区块链技术发展 通过Start Path计划支持数字资产初创企业 新入选5家区块链和数字资产赛道初创公司[1] - Plume公司提供专门为现实世界资产金融设计的区块链 支持代币化和EVM兼容环境下的链上交易[2] - Nomyx平台为基金经理提供无代码解决方案 可在30分钟内启动集成KYC/KYB和支付功能的代币化资产[3] - Borderlessxyz实现全球稳定币执行 连接银行与支付通道以实现无缝互操作性[3] - Keyrails的Stable OS平台将商户与稳定币 USD清算和SWIFT系统连接 并提供自托管钱包服务[3] - Nominis提供实时交易监控服务 结合链上与链下情报进行主动式区块链调查[4] - 该计划旨在建立可扩展的代币化支付基础 稳定币结算和验证交易机制 顺应监管明确化和机构采用趋势[4] 无接触ATM技术升级 - 公司与NCR Atleos及ITCARD合作推出无接触无密码取款技术 采用移动设备生物识别验证方式[5] - 该技术使ATM体验与日常无接触支付保持一致 无需物理卡片或PIN码[5] - 初步测试显示交易速度提升超过20% 通过设备原生验证增强安全性[6] - 技术试点在波兰VeloBank进行 计划2026年全球推广[6] - 该项目连接移动钱包与ATM系统 在无现金化趋势下提升便利性[6] 人工智能代理商务 - 公司推出"代理商务"创新工具 使AI代理能自主代表用户进行精准可靠的购物[7] - 与Stripe Google Ant International旗下Antom PayOS和FirmlyAI等合作伙伴共同为全球商户提供安全AI交易服务[7] - 到2025年假日季 所有美国持卡人将可使用Mastercard Agent Pay项目 首先面向花旗银行和美国银行用户[7] - 代理工具包采用模型上下文协议 使Claude和GitHub Copilot等AI平台能轻松集成API[8] - Agent Sign-Up简化访问流程 Insight Tokens提供基于同意的治理洞察以实现个性化体验[9] - 与FIDO联盟合作制定可验证凭证标准 确保交易金额和商户细节的准确性[9] 实时决策引擎系统 - 公司推出按需决策规则引擎 允许金融机构直接在网络上定制授权逻辑[10] - 发行方可设置优先服务高价值客户或减少补发卡拒付等策略 实现即时审批[10] - 该系统提升决策准确性 保持优质体验并降低操作风险 计划2025年10月1日全球上线(印度除外)[10] - 波尔图银行执行董事认可该工具优化了授权策略 同时最小化操作风险[11] - 使银行能根据自身战略调整决策 在动态支付环境中增强敏捷性[11] 整体战略定位 - 公司通过技术进步和合作伙伴关系 成为数字经济发展关键推动者[12] - 致力于为数十亿用户提供更安全更智能的金融交互体验[12]
Mastercard Launches AI-Powered Tools to Shape the Future of Commerce
ZACKS· 2025-09-12 01:36
公司战略与产品发布 - 公司推出Mastercard Agent Pay支付工具 计划在假日季面向所有美国持卡人开放 随后进行全球推广[2] - 公司发布Agent Toolkit工具包 通过Model Context Protocol服务器帮助AI助手和代理工具访问和理解API文档 支持与GitHub Copilot、Cursor和Claude等平台集成[3] - 公司推出Insight Tokens功能 允许消费者共享授权数据以获得更个性化的购物体验[3] - 公司新增Agentic Consultancy咨询服务 帮助企业打造尖端支付体验[3] - 公司推出Agent Sign-Up注册服务[3] 合作伙伴关系 - 公司与Stripe、Google、Antom和FIDO Alliance建立合作伙伴关系 共同开发安全可互操作的支付生态系统[4] - 合作伙伴关系旨在提升AI驱动支付的透明度和信任度 可能加速代理商务的采用并开辟新的交易增长渠道[4] 市场表现 - 公司股价年初至今上涨10.8% 超过行业1.3%的增长率[8] - 公司目前获得Zacks Rank 3(持有)评级[9] 行业比较 - OppFi Inc (OPFI)当前财年每股收益共识预期为1.42美元 过去60天内经历两次上调 营收预期5.889亿美元 同比增长12%[12] - Green Dot Corporation (GDOT)当前财年每股收益共识预期为1.35美元 过去30天内经历两次上调 营收预期21亿美元 同比增长20.3%[13] - The Brink's Company (BCO)当前财年每股收益共识预期为7.95美元 过去60天内经历两次上调 营收预期52亿美元 同比增长4.3%[14]
Mastercard Expands Into AI Powered Payments Ahead Of Holiday Season
Yahoo Finance· 2025-09-10 18:07
核心观点 - 公司宣布一系列AI支付加速计划 包括推出开发者工具 咨询服务和战略合作 旨在推动智能代理商业发展[1] - 核心产品Mastercard Agent Pay计划在假日季前向全美持卡人推出 并后续进行全球扩展[1] - 公司与主要金融机构和技术企业建立合作 共同制定行业标准并提升交易安全性[2][4] 产品与服务 - 推出Agent Toolkit开发工具包 通过MCP服务器为AI助手提供直接API访问权限和简化注册流程[3] - 推出Insight Tokens数据框架 使AI代理可获取用户授权数据 已获得SAP Concur和Agentic Consulting支持[3] - 推出On-Demand Decisioning实时决策系统 允许金融机构通过可定制规则引擎设置授权标准 减少错误拒付并优先处理高价值客户交易[5] 合作伙伴与市场拓展 - 花旗银行和美国银行客户将成为首批体验用户[2] - PayOS等商业平台准备激活AI驱动购物功能[2] - 与Stripe 谷歌和蚂蚁国际Antom合作制定行业标准 包括与FIDO联盟共同开发商户凭证验证系统[4] 市场表现 - 公司股价年初至今上涨11% 略低于标普100指数12%的涨幅[5] - 最新交易数据显示股价下跌0.26%至582.51美元[6] 战略意义 - 这些举措为基于人工智能和智能代理的更智能 更安全购物体验奠定基础[4] - 公司持续通过创新计划推动价值增长[5]