Workflow
Agent时代
icon
搜索文档
UI 没有死,但 80% 的交互已经换了主角
深思SenseAI· 2026-04-25 18:14
文章核心观点 - AI Agent正在深刻改变软件交互范式,从传统的用户通过图形界面操作,转变为用户通过自己的AI Agent与软件的AI Agent进行协作,直接操作底层系统[7][9] - 这一转变由真实的企业级产品数据驱动,例如Ramp平台的MCP(模型上下文协议)周活用户在三个月内增长了10倍,表明AI Agent已进入企业用户的日常工作流[3][25] - 领先的软件公司(如Salesforce)已开始进行根本性的架构变革,将自身“无头化”(Headless),以适配Agent优先的未来[5] - 为AI Agent设计产品需要全新的原则,包括主动提供规范、建立反馈回路和弥合上下文鸿沟,这将成为下一代软件产品的核心竞争力[10][14][17] - 对于新产品而言,这是一个关键的窗口期,将“Agent友好”作为原生设计原则,有望获得超越仅关注人类用户体验的竞争对手的复合优势[24] 根据相关目录分别进行总结 01 一个让人不安的数字 - Ramp作为一家低调务实的企业财务管理平台,其产品VP披露的数据具有行业说服力:过去三个月,其MCP的周活跃用户增长了10倍[2][3] - 这并非实验性尝试,而是表明大量企业财务负责人正日常通过Claude、ChatGPT等AI Agent直接调用Ramp功能,完全绕过其图形界面,代表了真实用户行为的根本性改变[3] 02 Salesforce 做了一件不得不做的事 - Salesforce推出了名为“Headless 360”的重大架构变革计划,旨在将其所有平台能力通过API、MCP或CLI暴露,以便AI Agent无需打开浏览器即可操控整个系统[5] - 此举背后的战略判断是:图形用户界面(UX)作为传统护城河的价值正在被侵蚀,未来大多数用户将通过Agent而非界面使用软件,公司选择主动进行自我颠覆[5] 03 UI 没有死,但 80/20 翻转了 - 软件交互范式正经历三个阶段演进:从“用户→界面→数据库”的界面时代,到“用户→用户的Agent→数据库”的Agent接入时代,最终发展为“用户→用户的Agent→软件的Agent→数据库”的Agent-to-Agent时代[7][9] - 未来80%的软件交互将通过Agent完成,界面并未死亡,但角色已从核心退居次要[7] - 这要求软件公司必须同时设计供人类使用的界面和供机器调用的Agent接口,为专注后者的公司提供了弯道超车的机会[9] 04 第一个设计原则:主动教会 Agent 怎么用你 - 优秀的设计需要主动、清晰地向Agent提供成功调用所需的知识,而非让其猜测[13] - Notion的MCP工具描述中明确要求Agent在操作前先获取其增强Markdown规范,并强调“不要猜测或产生幻觉”,从而确保了输出格式的准确性,这是成功案例[11][13] - 反面案例是Slack的MCP,因未在工具描述中明确其特殊的Markdown格式,导致Agent输出格式混乱,用户体验变差[12] 05 第二个设计原则:建立反馈回路 - 为理解Agent的使用情况并持续改进,需要建立有效的反馈机制[14] - Ramp采用了三种方法:要求每个工具调用附带解释意图的“rationale”参数;提供独立的反馈工具供Agent在卡住时调用;在工具中加入特定参数以捕获关键上下文[14] - 通过分析rationale日志,可以发现新的用户意图模式,从而驱动新功能开发,形成“反馈→洞察→迭代”的闭环[16] - 这为传统的用户研究提供了全新的数据源——直接观察用户意图的文字表达[16] 06 第三个设计原则:弥合上下文鸿沟 - 在Agent-to-Agent交互中,设计核心是让双方各自贡献自己独有的上下文知识,共同达成任何一方单独无法实现的结果[17][20] - 以报销场景为例:用户的AI助理掌握日历、邮件、收据等个人上下文;报销系统掌握公司政策、会计科目等业务上下文。优秀的设计是让系统询问“餐饮场合”而非具体的“GL科目”,由用户助理根据其上下文提供答案,从而自动匹配科目[17][18] - 设计哲学是坦诚告知对方自己知道什么、不知道什么,协作填补信息鸿沟,而非要求对方做不擅长的事[20] 07 大多数公司会发 MCP,然后就没有然后了 - 许多公司仅将上线MCP视为一项任务,其使用量在短暂增长后会陷入停滞[21] - 真正的竞争力在于执行深度和细节打磨,例如Notion主动推送规范、Ramp要求rationale、报销系统优化提问方式等[21] - 一个简单的衡量方法是让未使用过产品的新用户,仅通过自然语言指示Claude等Agent完成典型任务,观察其成功率与卡点,这能有效检验Agent体验的好坏[21] 08 对我们意味着什么 - AI Agent的普及信号来自企业工具真实使用数据的飙升(如Ramp周活10倍增长),而非炫酷的演示,这代表了真实的市场趋势[22] - “为Agent设计”是一种思维模式的根本转变:从思考“用户如何用界面”转向思考“Agent如何理解接口、何时出错、如何恢复”[23] - 对于新产品,这是一个宝贵的窗口期,可以原生地将“Agent友好”作为第一设计原则,从而在Agent采用率快速上升阶段,建立起竞争对手难以复制的复合优势[24]
马斯克站台谷歌第8代TPU!训练从数月缩至数周、推理性价比提升80%
量子位· 2026-04-23 17:08
谷歌第8代TPU产品发布与核心观点 - 文章核心观点认为谷歌第8代TPU (TPU v8) 被市场低估,其专为Agent时代打造,通过“训推分离”的彻底硬件方案、显著的能效提升以及全栈协同优化,为AI智能体的大规模落地提供了变革性的硬件基础,并已获得资本市场的初步认可 [1][2][6][7][11][44] 产品战略与架构设计 - 公司在“训推分离”道路上比竞争对手走得更彻底,直接推出了物理上完全不同的两款芯片:面向训练的TPU 8t和面向推理的TPU 8i [3][16] - 采取此战略的原因是智能体时代对训练(要求“快”)和推理(要求“稳”)的延迟与吞吐要求截然不同,实践表明一块芯片无法同时做好两件事 [24][25] - 第8代TPU由谷歌大模型Gemini参与共同设计 (Co-designed) [14][15] TPU 8t (训练芯片) 性能规格 - 整体计算性能是上一代Ironwood的近三倍,能将模型训练周期从数月缩短至数周 [8] - 单个超级芯片组 (Pod) 规模扩展至9,600个芯片,配备2PB共享高带宽内存,芯片间双向扩展带宽 (Bidirectional scale-up bandwidth) 从9.6 Tb/s 提升至19.2 Tb/s [21][22] - 总算力达到121 ExaFlops (FP4),相比上一代Ironwood的42.5 ExaFlops有巨大提升 [21] - 存储访问速度提升10倍,配合TPUDirect数据直连提升利用率 [22] - 基于Virgo网络、JAX和Pathways实现近乎线性扩展,单一逻辑集群可延伸至百万级芯片规模 [22] - 通过实时遥测、自动故障链路绕过 (ICI) 和光路交换 (OCS) 等机制,在超大规模下有效吞吐目标最高可达97% [22] TPU 8i (推理芯片) 性能规格 - 在成本不变的情况下,服务能力接近翻倍,每美元性能提升约80% [8][23] - 单个Pod规模从256个芯片大幅扩展至1,152个芯片 [24] - 总算力达到11.6 ExaFlops (FP8),相比上一代Ironwood的1.2 ExaFlops有显著提升 [24] - 每个Pod的总高带宽内存 (HBM) 容量从49.2TB提升至331.8TB [24] - 芯片间双向扩展带宽同样从9.6 Tb/s 翻倍至19.2 Tb/s [24] - 公司为降低延迟,几乎从底层重做了整套推理栈 [23] 能效与散热技术 - 采用第四代液冷技术,第8代TPU的每瓦性能比上一代Ironwood提升了近两倍 [5][40] - 优化范围从芯片本身扩展到整条链路,包括CPU、TPU、网络及整个数据中心,全部围绕“省电”重做 [33] - 将网络连接直接集成进计算芯片,减少节点间数据搬运以节省能耗 [34] - 配合统一的电源管理,根据实时负载动态调功,优先分配电力给最关键的计算环节 [36] - 数据中心与TPU协同设计,供电、调度、散热全部重新打磨,配合液冷技术支撑更高功率密度 [37][38] - 在数据中心层面,单位电力能提供的算力在过去五年已提升6倍 [41] 全栈协同与系统优化 - 首次与谷歌自研的CPU (Axion) 搭档,可按AI任务需求定制CPU与TPU的配合方式,榨干每瓦电性能 [29][30] - 内存方面,将288GB高带宽内存和384MB片上SRAM塞进芯片,片上SRAM容量是上一代的3倍,以缓解“内存墙”问题 [31] - 系统效率方面,引入自研Axion CPU架构,将每台服务器的CPU主机数量翻倍,并通过NUMA进行隔离优化 [31] - 针对主流MoE混合专家模型,将互连带宽提升至19.2 Tb/s,并用新的Boardfly架构将网络“路径长度”砍掉一半以上 [31] - 新增片上集体加速引擎 (CAE),将原本需跨芯片的全局操作移至芯片内部,使整体延迟最高可降低至原来的1/5 [31] 开发者支持与生态 - 公司将全栈能力打包提供给开发者,TPU 8t和8i原生支持PyTorch、JAX、vLLM等主流框架,同时提供裸机访问 [42] - 配合MaxText、Tunix等开源工具,进一步打通从模型训练到上线部署的路径 [43] 市场反应与竞争背景 - 第8代TPU发布后,其母公司Alphabet股价盘中最高涨幅达2.2%,显示出资本市场的初步认可 [11] - 预计两款芯片将在今年晚些时候正式上市 [13] - 文章提及英伟达首席执行官黄仁勋认为TPU没有威胁,因其专注于特定赛道,而英伟达提供覆盖AI、数据处理、科学计算等全场景的加速计算体系 (如CUDA生态) [48][49][50] - 随着AI吞噬越来越多算力需求,TPU的重要性正在被重新评估 [52]