“龙虾”出现后,大模型时代的共识被推翻了

文章核心观点 - 以OpenClaw为代表的智能体(Agent)技术正在引发大模型行业从“训练时代”向“推理时代”的加速转变,其核心价值在于使大模型能够执行完整的复杂任务,而不仅仅是回答问题,这正在重塑行业的技术路线、商业模式和竞争格局 [9][10][13] 行业动态与公司进展 - 月之暗面正考虑在香港进行首次公开募股(IPO),并已与中金公司及高盛展开初步磋商 [5] - 在OpenRouter平台上,代号为Hunter Alpha的模型(即小米MiMo-V2-Pro)调用量迅速冲上榜首,显示模型厂商正从OpenClaw引发的浪潮中直接获益 [9] - 智谱AI发布了新的GLM Turbo模型,旨在从“简单的对话”转向支持完成任务的“干活”能力 [27] OpenClaw(智能体)带来的范式转变 - 任务执行取代问答交互:OpenClaw将模型拉入任务执行环节,用户交互从“提问-回答”转向“目标-执行-迭代”,模型更像一个帮助完成完整任务链路的“脚手架” [13] - 评价体系改变:评价重点从单轮回答质量,转向复杂任务能否稳定收敛并交付结果,同时用户对系统响应产生了“慢”的感知,因为这涉及规划、调度和试错过程 [13] - Token消耗与属性剧变:智能体场景下,单个任务的Token消耗是传统问答的10倍甚至100倍 [15]。无问芯穹公司的Token用量从1月底开始,每两周翻一倍 [15][26]。Token不再仅是成本指标,而是对应规划、执行、调用工具的全过程,具备了“生产力”或“机器工时”属性,这将重塑价格体系 [16] - 技术竞争维度下沉:行业竞争焦点从模型参数规模,转向推理效率、系统调度能力甚至能源成本 [20]。随着任务复杂度上升,上下文长度(Context)迅速拉长至1M甚至10M级别,迫使厂商在推理侧进行结构创新以降低成本、提高稳定性 [18][19] 对行业生态与竞争格局的影响 - 系统能力部分抵消模型差距:在智能体框架下,通过技能(Skill)和工具组合,次顶级模型也能完成复杂任务,模型之间的能力差距被压缩,用户更关注任务结果而非模型本身指标 [22][23] - 降低参与门槛与激发生态:构建能力向系统工程倾斜,而不再局限于算法本身,降低了参与门槛 [24]。OpenClaw的“开源”特性有利于社区深入参与,将国内次顶级闭源模型的上限拉高,同时靠技能体系保证了下限 [26]。它点燃了行业想象力,让更多人参与AGI变革,并释放时间去做更有创造性的事 [26] - 推动架构创新:中国大模型团队在算力受限背景下,通过对模型结构(如Hybrid、Linear Attention、Long Context Efficient设计)的创新来追求高效率与低推理成本的经验,在当前长上下文推理需求下依然重要 [30][31] - 预示未来竞争:随着推理需求爆发,预计今年可能增长100倍,竞争维度将进一步下探到算力、推理芯片甚至能源层面 [32] 主要参与者的观点摘要 - 智谱CEO张鹏:将OpenClaw定义为“脚手架”,使普通人能以极低门槛使用顶尖模型完成复杂任务,是重大突破 [25]。GLM Turbo模型的发布旨在优化任务执行所需的高Token消耗过程,近期提价是因任务消耗Token量为简单问答的10-100倍,旨在回归正常商业价值以支持持续优化 [27][28] - 无问芯穹创始人夏立雪:初期感觉OpenClaw交互慢,后发现其能完成大型任务,这标志着从聊天到完成任务的想象力空间提升,但对系统能力要求增大 [25] - 小米MiMo负责人罗福莉:认为OpenClaw是革命性事件,在智能体框架设计上领先,其最大价值在于“开源”和激发社区参与 [26]。强调在长上下文下实现低成本、高速度的推理结构创新,是激发高生产力任务和模型自迭代的关键 [30] - 香港大学助理教授黄超:认为OpenClaw提供了“更有活人感”的体验,证明了构建智能体的框架可以既简单又高效,促使行业重新思考智能体的形态 [27]

“龙虾”出现后,大模型时代的共识被推翻了 - Reportify