Workflow
OpenClaw
icon
搜索文档
Nvidia Debuts Platform for Enterprise AI Agents
PYMNTS.com· 2026-03-18 09:09
Nvidia发布企业级AI代理平台NemoClaw <doc id='1'>Nvidia announced NemoClaw at its annual GTC conference, an enterprise-ready version of the viral artificial intelligence agent platform OpenClaw that adds security, privacy controls and policy enforcement, giving companies a way to deploy self-operating AI assistants without exposing sensitive business data.</doc> <doc id='4'>According to Nvidia, OpenClaw became the fastest-growing open-source project in history after its release. Its problem was straightforward: It was built for individual users, not companies. It had no controls over what data the agent could access, where it could send information, or how its actions could be audited. NemoClaw solves that problem.</doc> <doc id='5'>What NemoClaw Does, Why It Matters According to Nvidia's announcement, NemoClaw can be installed in a single command and pairs OpenClaw agents with Nvidia's Nemotron AI models and the newly announced OpenShell runtime. In plain terms, OpenClaw is the AI worker. OpenShell is the walled environment in which a worker operates, one where a company can specify what the agent is allowed to do, what it cannot touch, and what requires a human to sign off.</doc> <doc id='6'>As reported by TechCrunch, the platform does not require Nvidia's own hardware and connects to Nvidia's existing business AI software suite. Agents can use AI models stored locally on company systems or pull from cloud-based models through a connection that keeps internal data from being exposed externally. Nvidia is treating NemoClaw as an early-stage product, acknowledging it is not yet production-ready. "For the CEOs, the question is, what's your OpenClaw strategy?" Nvidia CEO Jensen Huang said on stage at GTC. "We all needed a Linux strategy. We all needed an HTTP strategy. Every company in the world today needs to have an OpenClaw strategy, an agentic systems strategy."</doc> <doc id='12'>Perplexity's Computer is fully managed by the company, which controls the infrastructure, the AI models used and the rules governing how the system interacts with outside services. OpenClaw hands that responsibility to whoever installs it. NemoClaw sits between those two models, preserving the flexibility of OpenClaw while allowing companies to set and enforce their own rules. That middle ground is exactly what regulated industries have been waiting for.</doc> <doc id='15'>As reported by TechCrunch, Gartner identified governance tools for AI agents in a December report as the essential infrastructure companies need before enterprise adoption of the technology can scale. For executives weighing when and how to deploy AI agents across their organizations, NemoClaw represents a meaningful shift in what is actually available. The technology to automate complex business tasks has existed for months.</doc> <doc id='16'>What has been missing is a way to do it without handing over the keys. A system that keeps AI agents productive while enforcing company-defined limits on what they can access, execute and report removes the central objection that has kept procurement, legal and compliance teams on the sidelines.</doc> 产品定位与功能 - Nvidia在GTC大会上发布了企业级AI代理平台NemoClaw,它是热门开源平台OpenClaw的企业版本,增加了安全、隐私控制和策略执行功能,使公司能够部署自主运行的AI助手,同时不暴露敏感业务数据 [1] - NemoClaw通过单一命令即可安装,将OpenClaw代理与Nvidia的Nemotron AI模型及新发布的OpenShell运行时环境相结合,OpenShell是一个受控环境,公司可在其中规定代理的权限、禁止访问的内容以及需要人工审批的操作 [5] - 该平台不强制要求使用Nvidia自家硬件,并能连接Nvidia现有的商业AI软件套件,代理可以使用本地存储的AI模型,或通过能防止内部数据外泄的连接调用云端模型 [6] - NemoClaw定位于早期产品,目前尚未达到生产就绪状态 [6] 市场背景与竞争格局 - OpenClaw发布后成为历史上增长最快的开源项目,但其原版是为个人用户设计,缺乏对企业数据访问、信息发送和操作审计的控制 [4] - NemoClaw进入了一个快速拥挤的市场,OpenAI于2月推出了自己的企业代理平台OpenAI Frontier,Perplexity AI也进入了该领域,并推出了名为“Computer”的产品,旨在接收广泛指令并分解执行 [11] - 与Perplexity完全托管服务的模式以及OpenClaw将责任完全交给安装者的模式不同,NemoClaw采取了中间路线,在保留OpenClaw灵活性的同时,允许公司制定和执行自己的规则 [12] - Nvidia CEO黄仁勋强调,制定“OpenClaw战略”或“代理系统战略”对当今全球每家公司都至关重要 [6] 行业需求与采纳现状 - 受监管的行业一直在等待NemoClaw所代表的这种中间路线解决方案 [12] - 高盛在12月的一份报告中指出,AI代理的治理工具是企业规模化采用该技术前所必需的基础设施 [15] - 财务部门已经开始试水,PYMNTS Intelligence研究发现,接近7%的美国企业CFO已在实时财务工作流中部署了AI代理,另有5%正在进行试点 [13] - 研究还发现,使用具备自主行动能力AI代理的公司,其应收账款工作的自动化程度高达95%,而没有该能力的公司自动化率仅为38% [14] - 另一项独立研究显示,43%的CFO预计能够根据实时支出数据自动调整预算的AI代理将产生重大影响,另有47%的CFO预计会产生一些影响 [14]
为何停售初代小米SU7?雷军:不想背刺老车主;AI大厂月薪3w疯抢文科生!网友:拯救了文科就业率;周鸿祎:将启动360安全龙虾全国巡装计划
雷峰网· 2026-03-18 08:31
小米汽车 - 小米停售初代SU7,雷军表示此举对前三个月销售有影响,但目的是避免“背刺”老用户[4] - 新一代SU7在安全、动力、底盘等方面全面升级,采用2200MPa超强钢(强度较老款提升10%),气囊增至9个,全系标配V6s Plus超级电机,Pro版续航达902公里[5] - 雷军将小米造车过去两年的历程概括为“跌宕起伏、冰火两重天”,并认为造车是一场马拉松,需稳步前行[4] 华为渠道服事件 - 华为渠道服发生大规模账号封禁事件,涉及《蛋仔派对》等多款游戏,系统误将成年玩家识别为有未成年消费退款记录[9][10] - 故障原因可能为华为渠道的账号验证系统或防沉迷统计接口出现逻辑错误,部分账号在当日中午已恢复[10] - 根据华为应用市场联运服务协议,华为在应用内购买服务中可获得50%的分成,其渠道服因未成年人充值退款难、监管服务等问题备受关注[10] AI行业人才趋势 - 360创始人周鸿祎提出观点,认为随着AI发展,文科生将比理科生更吃香,因其人文社科储备及管理表达能力可解决AI带来的社会问题[12] - 字节跳动、百度等头部AI企业正批量招聘AI训练师、提示词工程师等高薪岗位,对应届生月薪普遍2.5万-3万人民币,资深岗位年薪可达50万+,并优先考虑中文、哲学等专业[13] - 硅谷AI浪潮催生出“首席讲故事官”等新型职业,年薪约30万美元,许多从业者为前资深媒体人[13] 360公司动态 - 360集团创始人周鸿祎宣布启动“360安全龙虾全国巡装计划”,将派出上千名AI龙虾工程师协助安装[15] - 针对“360安全龙虾”被曝私钥泄露一事,公司回应称是发布流程中的配置疏漏,误将内部域名证书打包进安装程序,该证书已第一时间吊销,问题未对用户安全造成实质影响[15] 芯片与自动驾驶行业 - 传闻地平线芯片研发负责人陈鹏即将离职,内部呼声较高的接替人选为副总裁兼首席架构师苏箐[17] - 地平线正面临激烈竞争,其采用第四代BPU“黎曼”架构的征程7系列芯片是关键产品,计划与特斯拉下一代AI5同步推出(预计2026-2027年量产)[17] - 小鹏汽车董事长何小鹏邀请罗永浩体验第二代VLA(视觉激光雷达融合自动驾驶)系统,该系统将于3月19日开启逐步推送,Ultra版本面向L4级能力打造[30][31] 消费电子与平板市场 - 三星将逐步停售其首款三折叠手机Galaxy Z TriFold,该机型上市仅约三个月,曾在中国市场遭抢购并多次售罄[34] - 三星将该产品定位为展示折叠屏技术的“旗舰产品”而非大众市场销售,停售原因可能包括核心组件(如DRAM、NAND闪存)价格上涨导致生产成本过高[35] - 苹果、华为、小米、OPPO、vivo等多家厂商据传正在研发小平板产品,联想拯救者Y700五代屏版将于3月18日发布[19] 互联网大厂AI战略 - 阿里巴巴集团正推进一项内部计划,向员工提供Token额度,鼓励其使用悟空、Qoder系列等付费AI工具工作,相关费用可申请报销[20] - 腾讯QClaw(基于OpenClaw的本地AI助手)将于近期公测,微信入口将全面升级,支持通过微信对话远程操控电脑[29] - 百度内部高度重视OpenClaw,视其为最高层次老板关注的新产品,其百度搜索Skill在OpenClaw官方商店下载量超45000次,稳居全球第一[31][32] 游戏与创业投资 - 前《阴阳师》制作人金韬的创业公司“芥子游戏”估值超过10亿人民币(约1.5亿美元),并获得莉莉丝及前网易副总裁少云旗下基金的投资[23] - 该公司已获得网易《阴阳师》IP授权,正在使用UE5开发新项目,团队规模约60多人,核心班底包括原《阴阳师》成员[23][24] 汽车产业与全球化 - 长城汽车CEO魏建军表示,汽车强国必须实现全球化及产业链出海,反对无底线的价格战,认为长城汽车不会加入此类“内卷”[21] - 自2025年美国加征关税以来,全球汽车行业遭受至少354亿美元直接损失,丰田预计本财年相关成本将达1.45万亿日元(约91亿美元),受影响最为严重[40][41] PC与科技行业裁员 - 戴尔宣布2026财年将裁员约11000人(占员工总数约10%),相关遣散费用为5.69亿美元(约合人民币39.2亿元)[37] - 此次裁员是科技行业持续降本增效趋势的缩影,今年以来已有60家科技公司启动裁员,累计影响超3.8万人,Meta亦计划裁员比例或超20%[37][38] 航天与AI竞争 - 特斯拉CEO埃隆·马斯克表示,未来几年内SpaceX的成就将超过所有AI公司总和,SpaceX已构建“可重复使用火箭+全球卫星互联网+深空探索”的商业闭环[38][39] - SpaceX星链在轨卫星超6000颗,全球付费用户突破1.2亿,商业发射市占率超80%,并正筹备目标估值1.75万亿美元的IPO[39] 半导体与硬件 - 英伟达CEO黄仁勋确认,三星电子负责制造Groq 3 LPU芯片,这是三星在失去英伟达先进制程订单后,再度打入其先进供应链[43] - AMD就驰为笔记本虚标CPU事件(将锐龙5 5500U标为7430U)发表声明,称从未授权或参与此类行为,将保留追究法律责任的权利[40] 企业合作与IPO - 阿里旗下速卖通与YouTube达成重磅合作,成为首个在韩国加入YouTube“购物联盟计划”的中国电商平台,YouTube将成为其全新分销渠道[46][47] - A股上市公司璞泰来(新能源电池材料)、可孚医疗(家用医疗器械)、晨光股份拟分拆子公司科力普科技,均递交招股书拟赴香港上市[49][50][51]
研究员的饭碗也快没了
虎嗅APP· 2026-03-18 08:18
以下文章来源于远川投资评论 ,作者沈晖 看更好的资管内容 本文来自微信公众号: 远川投资评论 ,作者:沈晖,头图来自:AI生成 Anthropic最近的一份失业报告,让金融从业者脊背发凉。 报告里,金融岗位替代率高达94%,位列所有职业第2,但目前实际替代率只有28%,未来空间巨 大。幸运的是,有30%的职业几乎不受影响,金融从业者还能考虑洗碗工、管道工等再就业机会。 远川投资评论 . 在行业待久了,总会感到焦虑——金融人士活在一个"被比较"的世界,销量考评和业绩排名日日压 顶,只要不学习就会产生一种不安。 好比春节假期结束后,金融中登回到工位还在和Chatbot一问一答,隔壁桌的小登同事,已经养了8只 龙虾,就原油涨跌激情Argue。 金融行业从不拒绝效率,从人工手势报单到程序化交易,从线下银行销售到互联网代销,莫不如此。 但这一次,AI替代的不是低效的金融工具,而是工具背后低效的人。毕竟,金融行业成本最高的就 是人,资管公司的利润背后,比的是如何用更少的人管好更多的钱。 于是,各家私募开始拥抱先进产能:蝶威资产线上开课,教人如何驯化7*24小时自助工作的"数字研 究员";鸣熙资本用Manus自动生成红利指 ...
扩大版图…英伟达赶搭“养龙虾”商机 推NemoClaw软件
经济日报· 2026-03-18 07:52
公司战略与产品发布 - 英伟达在年度GTC大会上宣布推出NemoClaw,作为OpenClaw的企业级参考架构,旨在通过多层安全机制协助企业在内网安全部署代理型AI [3] - 公司宣布将进军太空打造数据中心,正与伙伴共同研发“Vera Rubin Space One”太空电脑,但需克服新型辐射冷却技术以确保在真空与强辐射环境下的稳定运作 [4] - 公司宣布将在自动驾驶平台扩大与车厂的合作对象 [3] 行业观点与市场展望 - 英伟达执行长黄仁勋表示持续看好AI芯片的需求 [3] - 黄仁勋指出,OpenClaw让AI代理可透过“一键完成”彻底改变AI行业,即“AI领域的Windows时刻来了”,因此每家企业都需要制定“OpenClaw战略” [3] - 黄仁勋认为,当AI进入后代理时代,每家软件即服务公司都是“代理即服务”的公司,将专属领域知识转化为可租用的“数位代理劳动力”,这将成为一次企业IT的文艺复兴和一个数兆美元的产业 [4] 技术趋势与产品演示 - OpenClaw是近来爆红的开源AI代理系统,其标志是一只龙虾,主打可自动分解任务、呼叫工具并执行多步骤操作,被视为代理型AI的代表性框架 [3] - 黄仁勋坦言,OpenClaw在企业环境中的最大挑战在于安全性,因其可存取敏感资料、执行程式码并与外部系统互动,缺乏适当控管可能引发资安与合规风险 [3] - 在GTC大会尾声,黄仁勋与迪士尼合作研发的机器人“雪宝”同台互动,该机器人能以高度拟真的动作与语音即时回应指令并进行自然对话与肢体表演,展现出接近真人的互动能力 [1][5] - 黄仁勋表示,未来AI将不只存在于云端与荧幕,而将进入现实世界成为能理解、思考并执行任务的实体,通过结合生成式AI、推理能力与机器人控制技术,AI将从“会说话”进化到“会做事” [5]
腾讯大动作:QClaw即将上线!英伟达也有新布局
券商中国· 2026-03-18 07:29
腾讯QClaw产品动态 - 腾讯QClaw将于近期开启公测,或于3月18日发布全新版本,微信入口将全面升级[1] - QClaw是腾讯基于OpenClaw开源生态打造的本地AI助手,业内首创微信直连,主打零门槛、免部署[2] - QClaw分为Mac端与Windows端,内置kimi-2.5模型,用户无需复杂配置即可通过微信发送自然语言指令远程操控电脑执行任务[2] - 腾讯电脑管家18.0新版本推出“龙虾管家·AI安全沙箱”功能,为OpenClaw、QClaw等多种本地AI Agent提供一站式安全防护[4] 行业巨头动态与观点 - 英伟达创始人黄仁勋在GTC 2026上反复强调OpenClaw的重要性,并发布了企业级AI智能体工具NemoClaw[1][6] - 黄仁勋称OpenClaw是人类历史上最受欢迎的开源项目,其影响力在数周内超越了Linux三十年的发展历程[6] - 黄仁勋认为所有企业都需要搭建自身的OpenClaw战略和智能体系统,这一系统已成为企业发展所需的“新计算机”[7] OpenClaw发展现状与影响 - 开源AI智能体软件OpenClaw在GitHub上线仅两个多月便获得超过30万颗“星标”,远超同期其他开源项目[6] - OpenClaw的核心场景是用户在本地终端一行命令部署AI Agent,除了对数据中心推理芯片有益,也对端侧算力提出新需求[8] - OpenClaw有望刺激包括苹果、联想、小米在内的品牌PC销量,扭转市场对PC换机周期的悲观预期[8] 行业趋势与市场观点 - 伴随着基础大模型的逐步成熟,AI应用已经迎来百花齐放时代,OpenClaw作为标杆性产品受到市场广泛认可[8] - OpenClaw带动AI Agent热潮,其大量的推理Token需求进一步拉动了AI产业链的算力增长[9] - AI需求推动2025年全球晶圆代工产值年增长26.3%,达到1695亿美元,创历史新高[9] 1. 由于OpenClaw席卷全球导致Token消耗量大,腾讯云等大模型云厂商在近期对部分模型计费价格进行了调整[5]
Nvidia CEO Jensen Huang says OpenClaw is 'definitely the next ChatGPT'
CNBC· 2026-03-18 06:55
公司动态与战略 - 英伟达首席执行官黄仁勋在GTC活动期间接受采访时,将OpenClaw项目定位为人工智能交互方式的重大进步,并称其为“人类历史上最大、最受欢迎、最成功的开源项目”以及“下一个ChatGPT” [1] - 英伟达迅速围绕OpenClaw的势头展开布局,于周一宣布推出企业级版本NemoClaw,该版本将英伟达的软件栈和工具集成到OpenClaw平台之上,旨在使这些强大的AI代理变得安全、可扩展并适用于现实世界 [3] 技术与产品 - OpenClaw是一个开源的自主AI代理平台,其功能超越传统聊天机器人,能够在用户输入最少的情况下完成任务、做出决策并采取行动 [2] - NemoClaw是OpenClaw的企业级版本,由英伟达推出,核心目标是为企业应用提供安全、可扩展的AI代理解决方案 [3] - 该技术被描述为一次基础性转变,能够极大扩展个人利用AI所能完成的事情,用户仅需一行代码即可创建自己的代理,随后可指令其执行各种任务 [4]
英伟达押注OpenClaw并添加安全层,详解NemoClaw工作原理
搜狐财经· 2026-03-18 06:02
核心观点 - 英伟达在GTC大会上宣布推出NemoClaw堆栈,旨在通过增强隐私和安全性来加强并推广OpenClaw智能体平台,将OpenClaw定位为个人AI的基础,并预示企业AI智能体的发展将加速软件和知识工作的代际转变 [2][4] - 公司同时成立了Nemotron联盟,联合多家AI实验室和开发者,通过共享资源与计算来推进开源AI模型的发展,旨在加速AI进展并加强开放的生态系统 [5][6] 产品发布:NemoClaw与OpenShell - NemoClaw是一个新的软件堆栈,专为加强OpenClaw智能体平台而构建,旨在解决OpenClaw因自主能力和访问用户信息而带来的重大安全风险问题 [2][6] - NemoClaw集成了英伟达新推出的开源运行时OpenShell,该运行时通过执行基于组织策略的防护措施、将模型沙盒化来增强数据隐私和智能体安全性,并提高智能体的可扩展性 [3][6] - OpenShell由英伟达与CrowdStrike、思科和微软安全等安全公司合作构建,以确保其与其他网络安全工具的兼容性 [3][7] - NemoClaw可通过单个命令安装,在任何平台上运行,并允许在本地系统上使用任何编码智能体,包括英伟达自己的Nemotron开放模型系列 [3] - 通过隐私路由器,NemoClaw允许智能体结合使用云端的前沿模型和本地模型,帮助在隐私防护措施内训练智能体完成任务 [3] 战略定位与行业愿景 - 英伟达将OpenClaw视为个人AI的基础,并与OpenClaw创始人合作,称该智能体平台是“历史上最重要的软件发布” [2] - 公司CEO黄仁勋提出,OpenClaw预示了一条新路径:智能体即服务,而非传统的软件即服务 [5] - 推进企业AI智能体将“加速软件和知识工作的代际转变”,企业软件的下一阶段将完全关于专业化智能体 [4] - 英伟达的新Vera Rubin基础设施旨在支持这种智能体AI驱动,据称将在过程中降低成本 [4] - 英伟达希望额外的安全性能让OpenClaw智能体更受欢迎、更易于访问,风险比目前更小,从而让企业更安心地使用AI智能体为员工完成以前不会采取的行动 [3] 生态合作与开发者支持 - 开发者即日起可访问英伟达的Agent Toolkit和OpenShell,可与LangChain一起使用,或直接从GitHub下载以在本地运行 [5] - 企业可以通过AWS、Google Cloud和Microsoft Azure等云提供商创建和部署AI智能体 [5] - 英伟达成立了Nemotron联盟,初始成员包括Thinking Machines Lab、Perplexity、Cursor、Mistral AI和Sarvam等模型开发者和AI实验室 [5][7] - 联盟旨在通过共享资源和计算推进开源AI,加速AI模型进展,将智能扩展到任何单一模型之外,并加强开放的生态系统 [6][7] - 作为合作首例,Mistral AI和英伟达将共同开发一个在英伟达DGX™云上训练的开放模型并开源结果,该模型也将成为英伟达即将推出的Nemotron 4模型系列的基础 [5]
NVIDIA (NasdaqGS:NVDA) Conference Transcript
2026-03-18 01:02
NVIDIA (NVDA) 2026年3月电话会议纪要分析 一、 公司及行业概述 * 本次会议为NVIDIA于2026年3月17日举行的投资者电话会议[1] * 行业聚焦于人工智能(AI)计算,特别是加速计算、AI基础设施和生成式AI[3] * 公司正经历从生成式AI、推理到智能体系统(Agentic Systems)的第三波拐点[3] 二、 核心财务与业务数据 * **未来订单能见度**:公司对Blackwell和Rubin架构产品在2026年之前的订单有**5000亿美元**的强劲能见度[7] * **更新后的订单能见度**:目前对Blackwell和Rubin的订单能见度已提升至**超过1万亿美元**,时间范围延伸至2027年底[15] * **现金流与资本回报**:公司预计将约**50%的自由现金流**用于股票回购和股息[105] * **业务构成**:公司业务可粗略分为两部分:**60%** 来自超大规模云服务商(CSPs),**40%** 来自区域云、工业、企业本地部署等[26][27] * **新增市场机会**:在1万亿美元的Blackwell+Rubin需求基础上,加入Groq可能带来**25%** 的增量(即1.25万亿美元),存储和CPU等产品可能带来额外**50%** 的潜在机会[95][96] 三、 技术发展与产品路线 * **当前产品重点**:Vera Rubin DGX AI工厂参考设计已发布,旨在为非超大规模客户提供与超大规模云服务商竞争的蓝图[50] * **产品路线图**: * **Vera Rubin**:预计在**2026年下半年**开始量产,并将在Groq之前发货[61][63] * **Groq**:预计在**2026年第三季度**开始发货[55][59] * **Rubin Ultra** 和 **Feynman**:是未来的产品路线[135] * **架构演进**: * **NVLink扩展**:从NVL72发展到Rubin Ultra的NVL144,未来规划NVL1152[130][136] * **互连技术过渡**:将从纯铜互连过渡到铜+共封装光学(CPO),最终在NVL1152时完全采用CPO[138] * **内存架构**:公司是唯一能跨HBM、LPDDR5和SRAM三种内存类型优化AI工厂架构的公司[86] * **软件生态**: * **OpenClaw/NemoClaw**:被定位为AI计算机的操作系统,已有**150万**人下载OpenClaw[40] * **CUDA**:是公司核心生态,所有开发者都基于CUDA和CUDA-X库进行编程[25] * **模型覆盖**:平台支持所有主流AI模型,包括OpenAI、开源模型(合计第二大)、Anthropic(第三)和xAI等[22][156] * **Nemotron-3**:公司推出的混合专家(MoE)与状态空间模型(SSM)结合的模型,用于处理极长上下文[147][153] 四、 市场观点与行业趋势 * **AI发展拐点**:当前处于以**智能体系统**为标志的第三波拐点,智能体能够自主操作并执行任务[3] * **计算范式转变**:计算机从工具转变为**生产设备**,用于生产“令牌”(Token),其能源效率和生产效率至关重要[4] * **令牌经济(Tokenomics)**: * 工程师将拥有“令牌预算”,用于消费AI服务[4] * 公司价值主张在于:提供最昂贵的计算机,但生产**成本最低的令牌**[20] * 令牌成本将持续下降,同时令牌的“智能度”和吞吐量将不断提升[141] * 市场将出现分层,从免费层到高端层,满足不同客户需求(如搜索、代码生成、企业员工)[143][144] * 预计**25%** 的推理工作负载属于高端层,适合用Groq等低延迟架构处理[69][82] * **IT行业转型**: * 全球**2万亿美元**的IT软件产业将被改造,可能增长至**8万亿美元**,并转售大量令牌[40][41] * 未来的IT公司将从授权软件转变为**租赁和生成令牌**,商业模式和毛利率将发生变化[45] * **物理AI**:涉及**70万亿美元**的全球产业,需要边缘和本地部署的AI,这将推动公司业务中**40%** 的部分(非CSP)未来可能增长至**70%**[51][52] * **训练与推理演变**: * 后训练(Post-training)的计算强度可能是预训练(Pre-training)的**100万倍**[175] * 训练数据将从互联网数据为主,转向以**合成数据**为主[176] * 训练和推理的界限将变得模糊,公司希望未来**99%** 的计算资源用于产生经济价值的推理[177][178] 五、 竞争格局与公司战略 * **竞争优势**: * **全栈能力**:提供从芯片、系统、网络到软件的全栈解决方案,这是服务40%非CSP市场的必要条件[26][28] * **年度创新节奏**:通过内部掌控所有芯片、软件栈和系统,实现每年推出新产品的快速迭代能力[165][166] * **价值交付**:通过持续提升“每瓦每秒令牌数”的价值,使客户愿意为新一代更高价格的产品付费,从而维持毛利率[20][107] * **与超大规模云服务商(CSP)关系**:既是供应商(竞争部分),也是其**最佳销售力量之一**,通过CUDA生态为CSP带来大量客户[23][24][27] * **对竞争的看法**:认为单纯比较芯片价格是“不理解AI”的表现,真正的比较应基于“每瓦每秒令牌数”的工厂产出效率[110][111][142] 六、 运营与供应链 * **产能与供应**: * 为满足未来需求,公司正在建设基础设施和工厂,并与供应链伙伴进行长期合作,甚至预付款项以支持其产能增长[15][99] * 公司保持库存和供应管道,以应对客户突增的紧急计算需求[17] * 整体供应系统处于“和谐”状态,没有单一瓶颈,能够满足1万亿美元以上的需求[115][117] * **公司架构**:管理团队架构与产品架构对齐,由**60人**的核心直接团队领导,确保跨技术领域的快速协同决策[164][165] 七、 其他要点 * **现金使用优先级**:1)为增长提供资金,支持供应链;2)投资生态系统(CUDA开发者、AI原生公司);3)通过股票回购和股息回报股东[99][100][101] * **市场集中度**:下游市场存在一定集中度,但公司通过支持多种模型(OpenAI、开源模型、Anthropic等)和多种部署模式(云、本地、边缘)来分散风险[155][156][158] * **智能体采用案例**:已有用户报告其Claw智能体一天消耗了**5000万令牌**,成本约**50美元**,展示了生产力提升的潜力[53]
GenAI系列报告之72:OpenClaw会引领Agent元年吗?
申万宏源证券· 2026-03-17 22:53
报告行业投资评级 - 看好 [1] 报告的核心观点 - 2026年将成为Agent(智能体)商业化关键分水岭,标志着AI从“对话式助手”转向“数字员工” [3][4] - Agent技术的成熟是软件系统的全面革新,推动AI从单一“工具”向全面“执行系统”转型 [3][5] - Agent技术并未“吞噬软件”,而是通过优化任务执行和流程自动化,重新定义了软件的价值分配,为嵌入企业核心流程的B端软件平台创造了结构性增量机会 [3][6] 根据相关目录分别进行总结 1. Agent在2026年的变化 - **产品演变**:从“工具”到“数字员工”。以OpenClaw和Claude Cowork为代表的产品实现了AI从“对话式助手”向“执行式代理”的转变 [14]。OpenClaw作为开源“数字员工”,通过Headless架构在用户日常通讯工具(如微信、WhatsApp)中无缝执行高频任务 [26][27]。Claude Cowork则作为商业化“桌面任务执行引擎”,能在0代码环境下处理复杂的跨平台任务 [15][20] - **技术基础**:打造高效、可靠的Agent基础。过去三年,Agent所需的Brain(推理与规划)、Memory(上下文与记忆)、Action(工具调用与执行)三类底层能力已逐步闭环 [37]。技术演进路径为:2023年Reasoning(推理)突破,模型开始具备复杂任务规划能力 [38];2024年Memory(记忆)突破,长上下文与外部记忆体系成熟 [45];2025年Action(行动)突破,工具调用能力实现标准化和平台化 [51];2026年Agent技术进入系统化阶段,竞争重心转向多Agent协作、任务调度等系统级能力 [56] - **交付标准化**:关注成功率、可审计性与风险管理。企业部署Agent的核心约束包括端到端任务成功率、过程可审计与可复盘性、单位任务成本可预测性以及明确的风险边界 [60]。通过能力模块化、标准化工具栈、强约束工作对象来提升任务闭环稳定性 [61];通过对象级、过程级和动作级证据链实现可审计 [63][64];通过上下文成本治理和试错成本约束实现成本可控 [65];通过关键动作许可机制、执行环境隔离和最小权限原则控制风险边界 [66] 2. 模型会吞噬软件吗? - **市场讨论**:Claude Cowork等产品的出现引发了市场对“模型吞噬软件”的担忧,认为大模型可能从提供API能力转向直接切入应用层,冲击现有软件价值 [69] - **实际影响**:Agent实际带来了软件的价值分化,而非吞噬。模型将一部分通用能力(如写作、总结)标准化,降低了为单点功能使用独立软件的需求 [74]。但企业真正持续付费的价值在于数据合规访问、流程稳定执行、结果核验追溯和风险控制,这部分价值不会被模型吞噬,反而会在Agent放量时被重新定价 [74]。低切换成本、弱客户接触的软件形态易被替代,而深度嵌入企业核心流程、管理数据和任务执行的软件则因Agent技术加持实现价值扩展 [3][75]。在中国市场,软件行业具有更强的定制化特色和行业know-how壁垒,大模型难以完全取代应用 [77][78] 3. Agent利好的方向 - **办公软件与协同套件**:成为Agent的“核心入口”。它们占据高频入口、业务对象承载和组织级权限控制面的关键位置 [83]。例如,Microsoft 365 Copilot、Claude in Excel将Agent能力内嵌于工作流,实现“入口即产品”和“对象级可交付变更” [83][86]。协同与会议系统(如Zoom AI Companion)将沟通内容转化为可执行任务 [90] - **企业安全与“沙箱”需求**:Agent的广泛部署拉动了对轻量级、快速启动沙箱技术的需求,以提供安全隔离的执行环境 [95]。沙箱模式(启动速度约150毫秒)相比传统虚拟机更适合高频、短生命周期的Agent任务 [95][99]。头部云厂商(如阿里云、腾讯云、Google Cloud、AWS)均已推出包含沙箱功能的Agent Infra产品 [102][103] - **B端SaaS平台**:成为模型能力交付的“最后一步”,迎来结构性增量。CRM、ERP等平台掌握业务对象、流程引擎和数据语义,能够将行业know-how固化为可调用的actions(动作) [106]。例如,Salesforce的Agentforce、SAP的Joule Agents将Agent产品化为“数字劳动力”,并强调可见性、控制与流程专长 [107][110] - **Token消耗与云计算**:Agent的推理范式(如“思考->行动->观察”循环)推动Token消耗量爆发式增长 [117]。自2026年1月初起,Token调用量已连续2–4周保持高速增长 [119]。IDC预测Agent将带动Token数据爆发 [121]。云厂商通过提供Agent托管服务,吸引用户并增加云资源消耗,直接受益 [123]。边缘计算和网络安全基础设施(如Cloudflare)同样因满足AI代理的低延迟和安全连接需求而受益 [123] - **To C大入口与复杂场景**:复杂Agent入口的竞争向拥有资金、技术和生态优势的头部互联网平台集中 [124]。在中国,腾讯(微信)、阿里巴巴(千问)、字节跳动(豆包)凭借高频入口和丰富的服务生态占据优势 [126]。例如,豆包DAU已破亿,并接入抖音商城和本地生活 [130];千问在2026年1月上线Agent功能,可实现点外卖、行程规划等端到端动作 [136];“对话即交易”可能重塑互联网竞争格局 [139]
黄仁勋的Token经济学
经济观察报· 2026-03-17 22:23
文章核心观点 - 英伟达CEO黄仁勋在GTC大会的演讲核心并非仅是提出万亿美元的AI基础设施需求预期,而是阐述了一套新的商业逻辑:数据中心正从训练模型的场所转变为生产Token的工厂,这背后是AI推理需求爆发、Token分层定价以及硬件架构革新共同驱动的商业模式变革 [1][4] GTC大会与市场反应 - 2025年3月16日至19日,英伟达在美国圣何塞举行GTC大会,黄仁勋发表超过两小时主题演讲 [2] - 黄仁勋预测,到2027年全球AI基础设施相关需求将达到1万亿美元,并认为实际需求可能更高,产品将供不应求 [2] - 此预测发布后,英伟达美股股价瞬时跳涨超过4% [2] - 然而A股算力产业链股票在次日开盘后集体下跌,天孚通信收盘跌幅超10%,长光华芯收盘跌幅达9.72%,多数龙头股回吐了近5日涨幅 [2] - 市场落差源于时间尺度差异,黄仁勋讲的是未来需求,且下一代Feynman芯片架构要到2028年才上市,同时A股电子板块当时平均市盈率约82倍,市场存在估值担忧 [3] Token工厂:新的商业逻辑 - Token是大语言模型处理信息的基本单位,一个汉字大约对应一到两个Token [6] - AI消耗Token的量级自2022年底ChatGPT上线后经历了数次跳跃:ChatGPT使AI学会生成内容;o1模型使AI学会推理和反思;Claude Code使AI能执行复杂任务,单任务消耗Token量比简单对话多出好几个数量级 [7] - AI工作分为训练和推理两个阶段,过去全球购买GPU主要用于训练,现在重心已向推理转移 [8] - 推理服务商的业务规模过去一年增长了100倍,国内推理服务器在出货金额上占比已接近60% [8] - Token尚未形成统一市场定价体系,黄仁勋提出了未来可能出现的五档分层定价:免费层、中等层(每百万Token约3美元)、高级层(每百万Token约6美元)、高速层(每百万Token约45美元)、顶级层(每百万Token约150美元) [9] - Token价格取决于模型大小、上下文长度和响应速度,顶级层定价对应的是AI能处理此前无法完成的任务,例如一次性读完一整份合同或整个代码库 [9] 数据中心经济模型的变革 - 数据中心受电力限制,在固定功率下,单位电力产出Token最多的运营者生产成本最低 [11] - 黄仁勋展示了一组数据:同一个1吉瓦(GW)的数据中心,使用当前Blackwell架构年营收约300亿美元,换用新一代Vera Rubin架构约1500亿美元,再加上Groq LPU推理加速器后可达约3000亿美元,同一数据中心换设备后营收可相差10倍 [11] - 英伟达2026财年全年营收2159亿美元,其中数据中心业务贡献1937亿美元 [12] - 万亿美元需求预期的逻辑在于:客户现有数据中心未被充分利用,换上新一代设备后,在同等电力条件下可通过生产更多、更贵的Token使收入翻数倍 [12] - 未来企业CEO将密切关注其“Token工厂”的效能,因为这直接关系到收入 [13] - 随着工程师日常广泛使用AI工具,企业为员工使用AI的开销将大到需要单独列预算,黄仁勋预测未来每位工程师入职时获得的年度Token预算金额大约相当于其基础薪资的一半 [13][14][15] 硬件架构:Vera Rubin平台与Groq LPU - GTC大会上正式发布了Vera Rubin平台,这是一个完整的系统而非单一芯片,采用百分之百液冷设计,安装时间从两天压缩到两小时 [17] - Vera Rubin核心机架NVL72集成72颗Rubin GPU和36颗Vera CPU,通过NVLink 6相连,与上一代Blackwell相比,每瓦推理吞吐量最高提升10倍,单Token成本降至十分之一 [17] - 同时发布了全新88核Vera CPU,为AI智能体场景优化,微软CEO确认首批Vera Rubin机架已在Azure上运行 [18] - Vera Rubin在处理高并发Token生成(如每秒超过400个Token)时存在带宽短板,此缺口由Groq公司的LPU技术补足 [19] - Groq LPU与GPU是两种不同的芯片:GPU内存大(如Rubin GPU有288GB)、算力强,适合复杂计算;LPU内存小(仅500MB)但读写速度极快,在生成Token的速度和延迟上远优于GPU [19] - 英伟达通过Dynamo推理调度软件实现“解耦推理”:将需要大量算力和内存的上下文理解交给Vera Rubin处理,将对延迟敏感的Token生成交给Groq LPU,两者通过以太网协同工作,延迟减少约一半 [19] - 这套组合在高速层(45美元/百万Token)和顶级层(150美元/百万Token)实现了相比上一代35倍的性能提升 [20] - 从更长维度看,同一个1GW数据中心,Token生成速率可在两年内从每秒2200万提升到7亿 [20] - 黄仁勋建议客户:若以高吞吐批量推理为主,可完全使用Vera Rubin;若有大量编程、实时交互需求,可将25%的数据中心算力配置Groq LPU [20] - Groq 3 LPU由三星代工,已在量产,预计2025年第三季度出货 [21] 软件生态与未来路线 - 软件方面,英伟达发布了企业级智能体平台NemoClaw,为近期火爆的开源项目OpenClaw增加企业安全层 [21] - OpenClaw在几周内成为GitHub上增长最快的开源项目,黄仁勋将其地位抬升至与Linux同级,称其为智能体计算机的操作系统 [21] - Adobe、Salesforce、SAP等17家企业软件公司已宣布采用英伟达的Agent Toolkit [21] - 路线图方面,英伟达预告了2028年上市的下一代Feynman架构,首次同时支持铜缆和CPO(共封装光学)两种互连方式 [21] - 2025年是CUDA诞生20周年,英伟达目前60%的业务来自全球前五大云服务商,另外40%分布在主权AI、企业、工业、机器人等领域 [21] 其他领域合作 - GTC大会上,英伟达宣布了与Uber、比亚迪、吉利、现代、日产、五十铃在自动驾驶领域的合作 [22] - 受此消息推动,港股汽车板块在3月17日集体走强,吉利汽车盘中一度涨超5%,最终收涨4.55% [22]