Workflow
千问Agent
icon
搜索文档
从OpenClaw说起:Agentic AI时代CPU价值的回归
半导体行业观察· 2026-03-11 10:00
Agentic AI时代的开启与OpenClaw现象 - 2026年初,一个名为OpenClaw(最初名为ClawdBot/MoltBot)的轻量级AI智能体在Mac Mini上部署并引爆AI圈,其作为24小时私人助理,通过短消息交互执行复杂任务,如编写Bash脚本、调用本地知识库和控制智能家居 [2] - 该智能体的开源、易部署及短消息交互特性使其更贴近用户,并获得了包括AWS、阿里云、火山引擎在内的各大云服务提供商的支持,可能标志着Agentic AI时代的真正开启 [2] AI智能体的定义与核心能力 - AI智能体是能够自主感知环境、进行决策并采取行动以实现特定目标的智能系统,其核心特点在于自主性和为实现目标进行独立决策与多步复杂操作的能力 [5] - 与AI助理和聊天机器人相比,AI智能体在用途上更强调自主和主动执行任务,在功能上能执行复杂多步骤操作、学习适应并独立做出决策 [5] - 实现AI智能体需要具备四大细分能力:感知(接收多模态数据)、规划(拆解并调整复杂目标)、记忆(保存短期与长期信息)以及行动(调用外部工具执行任务) [7] 思维链作为Agentic AI的基石 - 思维链通过引导大模型将复杂任务分解为逻辑步骤来提升回答准确性并减少幻觉,是AI智能体实现自主性的基础 [9][10] - 思维链在智能体中具体发挥四大作用:任务规划与拆解、动态环境中的异常处理、提供决策过程的可解释性与可诊断性,以及实现“推理”与“行动”的协同 [10][11][12][13] - 思维链的实现方式有三种:通过提示词工程进行浅层引导、通过监督微调将逻辑模式内化到模型中,以及通过强化学习在试错中产生逻辑推理能力 [13][14][15][16] - 在思维链推理模式下,CPU负责预处理(如提示词模板化、分词、KV缓存查找)和后处理,而GPU负责核心计算,两者协同工作 [17][19] 检索增强生成与智能体演进 - 检索增强生成作为获取外部知识的途径,与思维链结合解决了思维链自身的三个缺陷:错误传播与幻觉、缺乏外部反馈闭环,以及逻辑与事实未解耦 [20][21][25] - 传统检索增强生成遵循“检索->阅读”的线性流程,模型被动总结资料;而智能体检索增强生成则由模型的思维链驱动,模型自主决定何时及如何检索,形成“思考-行动-感知”的ReAct闭环 [27][30][31] - 在智能体检索增强生成模式下,CPU更深度地参与决策链条,负责向量数据库查询等操作,成为智能体与环境交互的关键渠道 [31][32] Engram:模型内部的知识增强 - Engram是一种条件记忆模块,通过确定性哈希实现静态知识的常数时间查找,并将检索到的记忆与动态推理融合,有效减轻大模型重构静态知识的负担,减少幻觉 [33] - 与外部检索增强生成相比,Engram将知识存储在模型内部,具有极低的查询延迟,擅长处理高频实体和常识性词组,两者互补 [34] - Engram允许将庞大的静态知识表存放在主机内存中,CPU可在GPU推理时异步预取数据,几乎不增加GPU显存占用和延迟,为AI智能体普及提供了高成本效益的路径 [35] - 引入Engram后,CPU在推理过程中的利用率显著提升,不再局限于预处理和后处理,深度参与计算 [35][36] CPU价值的回归与系统优化需求 - Agentic AI的发展本质上是不断提升大模型逻辑推理能力并降低幻觉的过程,而CoT、ReAct检索增强生成和Engram等技术方案都重度依赖于CPU计算,且CPU的参与程度不断提升 [37] - 在典型的智能体应用中,CPU侧执行的任务可能成为系统延迟的关键,例如在SWE-Agent中,Bash/Python调用占延迟可达78.7% [37] - Agentic AI对CPU提出了新的要求:需要高并发能力以处理大规模检索增强生成任务;需要高效管理大量工具调用进程并保障服务质量;并且依赖于CXL等互连技术来扩展内存、实现内存池化与一致性互连,以支撑“通算超节点”架构 [38][39][40][41] - 从端侧视角看,未来云端协同的AI智能体将强化CPU的中心地位,例如OpenClaw运行在Mac Mini上,端侧模型负责理解用户需求和处理本地任务 [42] 计算范式的迁移与未来展望 - Agentic AI时代的到来,背后是大模型分步逻辑推理能力的成熟和计算范式从绝对的GPU主导向CPU-GPU协同的迁移 [44] - 在此进程中,CPU转变为决策环路中的重要节点,需要从算法层、系统层和硬件层进行协同优化,例如优化检索增强生成与Engram查询效率、实现计算-通信-检索的重叠、以及利用CPU大内存带宽设计分层存储策略 [44][45] - 这反映了在Agentic AI应用特性引导下,CPU算力价值的回归以及CPU与GPU协同并进的系统思维 [44]
电商Agent进展
2026-01-16 10:53
涉及的行业与公司 * **行业**:人工智能(AI)助手、电商、本地生活服务、大语言模型(LLM)[1][4][10][26] * **公司**:阿里巴巴(千问 Agent、淘宝、支付宝、高德、飞猪、盒马、闲鱼)、字节跳动(豆包 APP、火山引擎)、腾讯、OpenAI、Google [1][2][6][10][25][26] 核心观点与论据 千问 Agent 的产品定位与市场表现 * 千问 Agent 的核心亮点是与阿里系业务(高德、飞猪、淘宝、支付宝)直接关联互通,通过 API 调用完成任务,提升了体验效率 [2][6] * 在本地生活服务(如交通、线下购物、盒马智能导购)中应用效果较好,但在重度电商和外卖领域难以满足用户高频浏览和反复比较的需求 [1][4] * 闲鱼是适合导入千问 Agent 的场景,因为其用户对价格敏感但对时间消耗不敏感,Agent 可帮助筛选信誉高且价格低的商品 [1][4][5] * 千问 Agent 的发布符合预期,但时间上比业内预计的(原预计2025年11月或12月)要晚 [2][3] * 千问 Agent 的日活跃用户数(DAU)与豆包存在较大差距,尽管模型性能相近甚至更强 [19] 豆包 APP 的发展策略与优势 * 字节跳动通过豆包 APP 深耕垂直场景(如教育、美术馆陪伴),分功能、分场景接触用户,逐步积累日活用户,为未来电商和本地生活服务奠定基础 [10][14][16] * 豆包通过存储全量对话数据并每日重算生成历史标签,实现数据飞轮效应,精准描绘用户画像,提高产品粘性和体验 [2][17] * 豆包 30 日留存率已超过 20%(2025年),而2024年 AI Chatbot 留存率不足 1% [16] * 豆包用户主要是功能性人群,关注具体功能(如推荐、制作PPT、讲故事),而 ChatGPT 用户更多是模型人群,关注模型能力本身 [20] * 豆包当前拥有约 1 亿的 DAU,在中国移动端的安装次数已达到 6 亿次,市场渗透率接近饱和,预计2026年用户增长将明显放缓,环比增长已低于 5% [16][25] 国内AI助手市场需求与竞争格局 * 国内市场对AI助手的需求存在,但不如美国、日本等发达国家高,潜在用户群可能仅一两千万人,并非高频需求 [8] * 阿里巴巴通过千问 Agent 直接切入 C 端市场,满足国内用户对具体功能型应用的需求 [10][14] * 腾讯面临模型开发进展缓慢的问题,需解决模型能力及政策适应性,目前通过小程序AI化和QQ空间灰度测试进行探索 [10][13] * 国内公司在模型研发上与谷歌和 OpenAI 相比仍有差距,例如阿里的千问 3.5 或千问 4 预计要到 2026 年底才能接近 Gemini 模型的能力 [31] AI技术对电商行业的影响与挑战 * **海外模式**:Google 和 OpenAI 采取中立策略,通过协议和标准驱动下游厂商接入,利用强大的模型能力缩短交易路径,提高成交效率 [26] * **国内模式**:字节跳动、阿里巴巴等依托自身生态系统开发AI产品,面临广告收入模式与AI技术整合的冲突,难以实现无缝对接 [26][30] * **潜在变革**:AI Agent 可能成为主要流量入口,将搜索、电商等功能整合成插件,改变原有产品功能属性,提供更短路径和更高成交率 [29] * **国内挑战**:国内电商平台引入AI技术面临业务模式革新和模型技术两大挑战,字节跳动的广告收入模式与AI推荐存在冲突 [30][31] * **下游玩家**:下游电商玩家可能需要重新定位,转向资料管理、市场经营和优化商品描述,以适应来自AI入口的需求变化 [27][28] 公司未来计划与市场展望 * **字节跳动**:计划在 2026年2月10日前更新具备实时处理能力的视觉识别模型,并可能更新文生视频模型;2026年上半年将在原动力大会上更新 Tokens 统计方式 [2][22][23] * **火山引擎**:2026年在PaaS和SaaS层面的增量会相对集中,MaaS(模型即服务)层面的增长预计非常高,增量可能是2025年的 3 到 5 倍,AI方向营收预计在2025年基础上增加 2.5 到 3 倍 [25] * **出海前景**:短期内国内公司很难完全复刻谷歌和 ChatGPT 的模式并成功应用于国际市场,缺乏自主可控的大规模语言模型是主要障碍 [32][33] * **发展趋势**:在C端领域,应用和模型更可能分层发展;在B端领域,拥有行业资源、数据的公司倾向于将垂类场景与通用大模型结合 [34] 其他重要内容 * 阿里巴巴此前推出的“阿福”表现不理想,投流与月活增长的 ROI 不匹配 [15] * 豆包通过类似抖音的数据运营方式积累用户行为数据,KV Cache 用于热缓存近期信息 [17] * Tokens 统计口径不统一且频繁变化,参考意义减小,需关注未来是否会统一并公开统计标准 [23][24] * 豆包曾多次测试电商功能但最终未推出商品列表页,字节跳动可能认为暂时不宜让用户感知到这是一个重度电商应用 [6] * 千问 Agent 需要针对不同场景优化体验,并明确品牌和用户定位,以避免重复豆包助手尝试后放弃的问题 [1][7] * 豆包 AI 手机助手的“读屏幕”功能目前更像一个噱头,并未被广泛使用 [9]