文章核心观点 文章记录了2026年中关村论坛人工智能主题日的一场高信息密度圆桌讨论,核心观点聚焦于人工智能产业,特别是大模型和智能体(Agent)技术,正从“聊天”范式转向“干活”范式,这一转变引发了算力需求爆发、模型架构创新、基础设施重构以及产业生态演变等一系列深刻变革 [3][5][13] 根据相关目录分别进行总结 行业趋势:从聊天到“干活”的范式转变 - 以OpenClaw为代表的智能体框架标志着人工智能应用从简单的对话交互转向能够完成复杂任务的“干活”助手,这极大地拓展了AI的想象力空间和应用价值 [6][8][13] - 范式转变导致对模型能力的要求发生根本变化,模型需要具备长程任务规划、自主循环、多模态信息处理和持续调试等复杂能力 [13] - 应用范式的转变直接驱动了推理阶段token消耗量的急剧增长,无问芯穹公司透露其token用量从一月底开始每两周翻一番,累计已增长十倍,类比于3G时代手机流量的爆发速度 [9] 模型层:架构创新与商业价值回归 - 为适应“干活”需求,模型在长上下文处理和推理效率方面进行重点创新,中国的模型团队在有限算力条件下催生了如细粒度MoE、混合稀疏注意力等高效的模型结构创新 [18] - 长上下文能力是实现高生产力任务和模型自进化的关键前提,其竞争焦点在于如何在百万甚至千万token的上下文长度下实现足够低的推理成本和足够快的速度 [19] - 随着模型任务复杂化,完成一个任务所需的token量可能是简单问答的十倍甚至百倍,智谱公司对其GLM5 Turbo模型进行提价,反映了模型商业价值向真实成本与能力回归的市场信号 [5][13][14] 基础设施层:应对推理时代算力挑战 - 推理时代算力需求爆发式增长,过去一段时间内推理需求已增长近十倍,未来可能达到百倍,算力成为制约行业发展的最朴素且紧迫的问题 [9][20][29] - 无问芯穹作为基础设施厂商,通过软硬件协同,接入国内十几种芯片和几十个算力集群,致力于打造高效的“token工厂”,以优化资源利用和转化效率 [15] - 为充分发挥智能体潜力,基础设施需要从为人类工程师设计转向为AI原生设计(Agentic Infra),以支持智能体秒级甚至毫秒级的任务调度,长远目标是使基础设施本身进化为由智能体管理的自主组织 [16][17] 智能体(Agent)层:技术痛点与生态发展 - 智能体在规划、记忆和工具使用三个维度存在技术痛点:复杂垂直领域规划知识不足、记忆系统面临信息压缩与召回精度挑战及海量上下文管理压力、技能生态存在质量参差不齐和安全风险 [21][22] - 智能体框架通过开源和模块化设计(如技能体系)降低了创建门槛,不仅拉高了国内模型在具体任务上的完成度上限,也激发了社区对Agent层的热情和广泛参与 [11] - 智能体交互模式取得突破,OpenClaw以即时通讯软件式的嵌入方式提供了更强的“活人感”,其轻量级操作系统式的设计通过生态撬动更多工具,与开源生态紧密结合 [12] 未来展望:未来12个月的关键词 - 生态:智能体要从个人助手转化为真正的“打工人”或协作者,需要整个技术生态的共同努力,推动软件、数据和技术向“Agent Native”模式演进 [24][25] - 自进化:在强大模型和智能体框架的激活下,模型能够在执行长程任务中持续自我学习和优化,实现对科学研究的指数级加速,这一进程可能在未来一两年内变得更为务实 [25][26][27] - 可持续token:从基础设施视角,需要确保在资源有限的条件下,能够持续、稳定、大规模地提供token供给,构建从能源、算力到token产出的可持续经济化链路,并探索将中国的优势转化为全球“token工厂”的潜力 [27][28] - 算力:所有技术进步和效率提升的前提是充足且可负担的算力支持,推理需求的爆发(十倍甚至百倍)使得算力成为未来十二个月行业面临的最大实际问题 [5][29]
杨植麟、张鹏、罗福莉等齐聚一堂,他们关于OpenClaw的观点值得一听。