Agent系统
搜索文档
黄仁勋150分钟访谈:Agent 是“Token 的 iPhone 时刻”|Jinqiu Select
锦秋集· 2026-03-24 15:24
AI时代的公司核心护城河 - AI时代公司的核心护城河是将技术、生态、组织和基础设施整合成完整系统的能力,而非单一产品[1] - NVIDIA的领先优势体现在从CUDA生态、芯片与机架系统设计、数据中心能力、供应链组织到内部极致协同设计的整套能力[2] NVIDIA的极致协同设计理念 - AI基础设施被定义为“极致协同设计”问题,需同步优化算法、芯片、网络、供电、散热、软件和组织结构[3] - 大规模分布式AI中,阿姆达尔定律重新关键,计算快不等于系统快,网络和调度会迅速成为瓶颈[4] - 公司的竞争轴已从“芯片级”升级到“机架级、Pod级、数据中心级”的工程能力[5] - 电力是主要约束之一,但可通过持续优化“每秒每瓦token数”来对冲[6] - 过去10年计算规模提升了约100万倍,远超传统摩尔定律的线性外推[7] - NVL72与Vera Rubin架构将“超算集成”前移至供应链,制造体系本身成为核心能力[8] - 单机架约含130万个组件,一个Rubin Pod超过万级芯片规模,复杂度已进入工业系统工程范畴[9] AI的扩展定律与前沿趋势 - AI的扩展分为四条:预训练扩展、后训练扩展、测试时扩展、智能体扩展[10] - 推理本质是“思考”,是计算密集型任务,将比预期消耗更多算力[11] - 下一阶段关键不是单个模型能力,而是智能体系统的“可并发复制能力”[12] - OpenClaw对智能体系统的意义,类似ChatGPT对生成式AI的普及意义[13] - 为代理安全提出“2/3权限约束”:访问敏感数据、执行代码、外部通信三者不能同时全部放开[14] NVIDIA的组织架构与管理哲学 - 公司CEO拥有60多个直接汇报对象,刻意构建“高密度信息流”组织,而非传统金字塔管理[17] - 组织设计围绕“极致协同设计”,所有对话均为集体讨论,无一对一交流,确保跨领域专家高强度协作[30][31] - 公司架构设计应反映其环境,目标是成为能产生系统性输出的机制[26] - 管理团队通过共同推理来塑造信念体系,确保重大决策(如收购Mellanox、全力投入深度学习)时团队已充分理解[60] NVIDIA的发展路径与战略决策 - 公司从加速器公司起步,但意识到狭窄应用领域限制市场规模和研发能力,必须拓展为计算平台公司[36][37] - 关键战略步骤包括:发明可编程像素着色器、在着色器中引入符合IEEE标准的FP32、引入C语言并最终发展出CUDA[41] - 将CUDA应用于GeForce是接近生存威胁的战略决策,虽大幅增加成本、吞噬毛利并导致市值从约70亿美元跌至15亿美元左右,但为CUDA生态奠定了基础[42][50][51] - 该决策使CUDA通过数亿块GeForce GPU建立了庞大的用户安装基数,这是计算平台架构最重要的部分[47][48] - 公司市值曾因CUDA投入而大幅回撤,但GeForce将CUDA带给所有人,最终成为平台和深度学习革命的基础[52][54] 算力、功耗与供应链 - AI智能提升的最终依赖是计算,预训练、后训练、测试时和智能体扩展均受计算能力限制[66][67] - 功率是约束但非唯一担忧,公司正通过极致协同设计持续优化“每秒每瓦token数”,过去十年已取得显著进步[82] - 公司市场份额在增长,供应链上下游至关重要,需花大量时间向合作伙伴CEO介绍业务动态和增长趋势,以促使其进行资本投资[85] - 供应链复杂度极高,例如单个机架有130万个组件,涉及数百家供应商,但公司通过提前沟通和建立信任来管理,不视其为最大阻碍[90][92][93] - 电网存在电力浪费,公司提议与电网合作,设计可优雅降级的数据中心,在电网需求高峰时减少用电,利用过剩电力[94][96][97] 对中国科技生态的观察 - 全球50%的AI研究人员是中国人,且大部分仍在中国[119] - 中国科技产业诞生于软件时代,工程师对现代软件熟悉,科学和数学教育基础好[119] - 中国内部省份和城市竞争激烈,催生了大量公司(如电动汽车、AI公司),国内竞争环境激烈[119] - 重视家庭、朋友和公司的社会文化促进了知识交流,本质上具有开源特质,工程师间分享迅速,加速了创新[119][120] - 中国被描述为一个“有建设精神的国家”,能够快速创新并涌现世界级成果[120][123] 对开源与生态系统的看法 - 开源有三重动机:共同设计前瞻、促进产业扩散、满足非语言模态(生物/物理/机器人)的创新需求[17] - 开源能让各行各业参与AI革命,如果所有技术都专有,研究和创新将难以开展[129] - 公司开源模型(如Nemotron 3)有助于了解AI模型发展,是深度共同设计策略的一部分,并希望让每个行业、研究人员和国家都能参与AI[129] NVIDIA的核心竞争优势 - 公司最重要的资产是计算平台的安装基础,目前主要是CUDA的安装基础[144] - 安装基础的建立依赖于公司长期坚持发展CUDA,以及数百万开发者的信任与软件移植[144] - 开发者在CUDA上开发可快速获得性能提升(平均等待6个月),并能触及广泛用户、计算机、行业和国家[144][145] - 第二个优势是广泛的生态系统,公司纵向整合复杂系统,并横向融入各合作伙伴的计算机中[148] - 生态系统涵盖谷歌云、亚马逊、Azure、CoreWeave、Nscale等云服务商,以及企业、汽车、机器人、卫星等多个领域[149] 对AI未来与行业影响的展望 - 计算单元从GPU演变为计算机、集群,现在是整个“AI工厂”,未来甚至可能考虑建造“行星级别的计算机”[151][153] - AI数据中心被称为“工厂”,token将出现分层定价与差异化商业化[17] - 计算正从基于检索的系统转变为基于生成的系统,新世界需要更多处理能力[160] - 计算机从存储系统转变为“工厂”,可直接与公司收入挂钩,创造价值[162] - 智能体(Agent)的“iPhone时刻”已经到来,OpenClaw即是标志,token应用处于历史增长最快阶段[169][171][173] - 不认同“程序员消失论”,认为软件工程师数量会增加,因为工作的核心是解决问题而非编码行数[238] - 规格定义能力将成为新的编程核心,未来可能有10亿人具备这种能力,每个职业(如木匠、会计师)都将通过使用AI得到提升[239][241]
吃够了全自动的龙虾,我决定把AI的方向盘抢回来
量子位· 2026-03-13 11:51
文章核心观点 - 当前主流AI产品存在“黑箱”问题,用户缺乏控制感,过程不透明,难以干预和纠偏[1] - MorphMind是全球首个可操控AI平台,旨在解决上述问题,将AI从一个黑箱对话框改造为可被人随时干预的工作系统[2] - 该平台的核心设计理念是构建一个人与AI专家团队协作的系统,让用户成为“主理人”或“管理者”,而非被动的提问者,实现“来源可查、逻辑可审”[51][77][83] 产品功能与设计理念 - 平台将复杂任务拆解为具有先后顺序的步骤,并以思维导图等形式可视化呈现,工作过程全透明[4][14][75] - 用户拥有“监督每步”和“自动完成”两种模式选择,可随时暂停、修改或回滚特定步骤,无需因小问题重新生成整个答案[10][80] - 系统将AI组织成一个具有明确分工的专家团队,不同专家角色在能力边界上真正分工,调用不同的底层模型、信息和工具[57][72] - 专家可在不同项目间“串门”协作,用户可培养并分享优秀专家,未来可能支持打赏等创作者经济模式[58][61] 核心技术能力 - 底层建立在三类核心能力之上:单调性(用户纠正过的错误和标准会在后续任务中持续约束系统)、共生式运行(用户在任务运行过程中持续参与系统能力塑形)、即时学习(AI在任务执行中识别知识缺口并主动寻求信息或确认)[66][67][69] - 任务被组织成有方向的协作图,专家协作像接力而非混战,确保每个关键结论可回溯到原始资料和中间步骤[75][76][77] - 系统明确标注信息的不确定性,而非替用户“糊弄过去”[79] 团队背景与行业洞察 - 联合创始人刘嘉是哈佛大学工程与应用科学学院助理教授,拥有超18年脑机接口前沿领域研究经验,认为真正的智慧存在于人与世界的交互中,AI需与人类直觉和创造性协作[84][85][88][91] - CEO丁杰是清华大学校友、哈佛大学博士,美国国家科学基金会杰出青年职业奖获得者,现任明尼苏达大学统计学终身教授,长期研究生成式AI及人机协作系统,其观察到的用户痛点与产品方向高度一致[96][98] - 团队认为当前AI行业的问题根源在于系统架构和工作方式,而非单一模型参数,主流的一问一答模式将检索、分析、写作等不同标准的工作揉成一个黑箱答案[53][54][92] - 团队早期在实验室内部开发用于科研流程自动化的AI Agent,经历AI擅自占用8张A100 GPU数小时算力等失控事件后,意识到需要构建让人保留主导权的系统[99][100][102][105] 市场定位与行业趋势 - 产品形态被类比为“Agent领域的油管或者B站”,旨在将AI产品发展为创作者社区[62][63] - AI产品形态正经历从聊天机器人、工具型AI、单智能体到Agent系统的演变,在Agent系统阶段,AI开始承担完整流程,正在从工具演化为新的组织结构[113][114] - MorphMind选择的路径是构建人与AI团队协作、并能随人的反馈不断调整成长的系统,与专注于提升单个Agent能力或构建复杂自动化流程的其他公司形成差异[116][117] - 该平台旨在成为一种新的基础设施,让人的思考能力被持续放大、沉淀并协作,使得一个人借助AI就能完成以往需要一个团队才能完成的复杂工作[118][119][124] - 未来工作的基本单位可能转变为“一个人和Ta管理的一群Agent”[122]
复盘字节扣子空间开发历程:瞄准工作场景,做一个 Agent 系统
晚点LatePost· 2025-04-21 17:36
字节AI产品扣子空间内测 - 字节AI产品"扣子空间"于4月18日开启内测 服务器在几小时内被用户挤爆 显示用户对实用AI产品的强烈需求 [3] - 产品定位为"与Agent一起开始你的工作" 重点解决工作场景中的复杂问题 由字节自研豆包大模型驱动 支持MCP协议并集成飞书工具 [4] - 产品包含通用Agent和专家Agent体系 当前上线2个专家Agent 覆盖用户数据研究和第三方数据分析场景 [12][18] 产品功能与测试表现 - 通用Agent提供探索模式和规划模式 规划模式强调人机协作 需用户确认任务规划后再执行 测试显示解决问题能力更强 [5] - 通用Agent表现类似"实习生" 能理解需求并交付参考成果 如整理豆包大模型团队动向 开发喝水提醒app需分阶段确认需求 [7][8] - 专家Agent表现:用户研究专家能提炼访谈记录规律并提出产品建议 华泰A股观察助手能分析关税对宁德时代影响并给出策略 [14][22][24] 产品开发理念与优势 - 开发理念强调解决实际问题而非完全替代人工 参考OpenAI Deep Research的交互方式 认为用户需求需多次澄清 [6] - 背靠字节生态优势:可调用扣子平台200多万款AI应用数据 与火山引擎打通 直接集成飞书文档等内部工具 [28] - 团队认为当前行业竞争点在于数据与工具调用能力 而非基础模型差异 飞书工具的深度集成形成独特壁垒 [31] 产品定位与行业竞争 - 产品定位为初级形态 目标是打造开放Agent系统 自动调度专家Agent协同完成任务 [4][33] - 行业现状显示几乎所有大厂都在开发Agent产品 竞争刚起步 扣子空间是行动较快者之一 [33] - 团队认为用户个性化需求难以被通用模型完全满足 未来方向是通用Agent与专家Agent协作系统 [33]