Workflow
自进化
icon
搜索文档
杨植麟当主持人的大模型圆桌:张鹏罗福莉夏立雪都放开说了
量子位· 2026-03-28 00:01
文章核心观点 本次中关村论坛汇集了中国大模型领域的顶尖专家,围绕Agent(智能体)的下一代演进、行业发展趋势、技术挑战与机遇进行了深入探讨。核心观点聚焦于:Agent框架(如OpenClaw)正成为推动大模型从对话工具转向生产力工具的关键催化剂,引发了推理需求(token消耗量)的爆发式增长,这进而对模型架构创新(尤其是长上下文与效率)、算力基础设施、以及行业生态的可持续发展提出了全新要求。专家们普遍认为,行业正从“训练时代”迈向“推理时代”,竞争维度已扩展至模型、算力、能源乃至全球化的“token经济学”层面 [5][12][32][45][65]。 对OpenClaw及Agent框架的认知与影响 - **OpenClaw被定位为革命性的“脚手架”**:它降低了使用顶尖模型能力的门槛,让非程序员也能通过简单交流构建复杂应用,其开源特性和社区参与度是成功的关键 [11][16]。 - **重新定义了模型能力的上下限**:此类框架能将次闭源水平模型的性能上限拉高,在多数场景下接近顶级闭源模型,同时通过体系化设计保证任务完成的下限(准确率)[17]。 - **带来交互模式的革新**:其IM软件嵌入方式提供了更强的“活人感”和“贾维斯”体验,区别于以往工具感更强的Agent [19][21]。 - **引爆了token使用量的激增**:从一月底开始,某基础设施厂商的token调用量每两周翻一倍,至今已增长十倍,增速堪比3G时代手机流量的普及速度 [12]。 - **激活了社区生态**:让更多非研究员参与AGI变革,推动了面向Agent的应用(skills、harness)开发,撬动了整个工具生态 [18][23]。 大模型技术演进与竞争焦点 - **中国团队的核心优势在于“算力受限下的最优解能力”**:在互联带宽等限制下,催生了如细粒度MoE、MLA等模型结构创新,追求更高的训练与推理效率 [40][42]。 - **竞争的关键是“长上下文”与“推理效率”的结合**:未来竞争不仅是做出原生适配长上下文的模型架构,更关键的是能否在100万甚至1000万级上下文下,将推理成本打下来、速度提上去 [42][43]。 - **超长上下文是模型“自迭代”的前提**:只有当上下文长度达到1000万甚至上亿级,模型才可能在复杂环境中依靠超强上下文完成对自身的持续进化 [5][44]。 - **模型正从“简单对话”转向“真正干活”**:完成复杂任务(如规划、尝试、debug)所消耗的token量是简单问答的十倍甚至百倍,这直接推动了模型能力的专门优化和定价策略的调整 [26][30]。 行业发展趋势与市场动态 - **推理需求爆发,行业进入“推理时代”**:由Agent驱动,token需求正经历十倍甚至百倍的增长,对算力基础设施构成巨大压力 [32][45][65]。 - **模型定价策略反映价值回归**:为完成复杂任务而增强的模型,因消耗token量巨大、推理成本增加,其涨价被视为回归正常商业价值,长期低价竞争不利于行业发展 [26][30]。 - **竞争维度扩展至全链路**:未来的竞争不仅是模型间的竞争,更是算力、推理芯片乃至能源层面的全方位竞争 [45]。 - **基础设施需为AI原生(Agent-native)重构**:当前云计算基础设施是为服务人类工程师设计的,未来需要能支持Agent毫秒级任务调度的“智慧化工厂”,甚至基础设施本身也应进化为智能体 [37]。 未来12个月的关键词与展望 - **生态**:Agent的发展依赖开源社区共同建设,未来软件可能不再以人类为中心,而是转向原生面向Agent(agent-native),需要整个技术栈朝此方向重构 [56][57]。 - **自进化**:在Agent框架加持下,模型能够通过可验证的目标约束进行持续自我优化,未来一两年内可能对科学研究带来指数级加速,研究效率已可提升近十倍 [59][60][61]。 - **可持续**:关注如何将中国在能源等方面的优势,通过“token工厂”持续转化为高质量token并输出全球,构建可持续的“AI Made in China”经济化迭代链路 [62][63][64]。 - **算力**:推理需求的爆发性增长使得算力成为未来12个月最关键的制约因素,确保用户“用得起、用得上”是行业发展的前提 [65]。
一只能安装龙虾的龙虾,才是好龙虾!
机器之心· 2026-03-08 10:31
行业现状与痛点 - 当前市场上“Claw系列”智能体(龙虾)数量激增,形态多样,涵盖本地、云端、插件及独立系统,但普遍面临安装部署复杂、用户体验不佳的问题[1] - 许多智能体存在系统兼容性问题,例如仅支持MacOS或在Linux上版本混乱,所谓的“一键部署”往往需要阅读冗长的说明文档,甚至催生了付费上门安装服务[2] - 当工具的“安装难度”超过其“使用价值”时,这不仅构成技术门槛,更对生产力造成了负面影响[4] 解决方案:GenericAgent的核心能力 - 公司提出了一种新思路:开发一个具备“指挥官级”能力的智能体,能够理解系统、调度环境并自动部署其他智能体,而非让每个智能体自我简化[4][5] - GenericAgent是一个完全开源、仅用约3,300行Python代码实现的极简自主Agent框架,旨在让任意大语言模型获得对PC环境的“物理级接管”能力,控制浏览器、终端、文件系统等[6][7][30] - 该智能体展示了强大的“元能力”,包括跨系统理解能力、跨工具调度能力、动态纠错能力以及复杂任务拆解能力[28] - 其核心价值在于“指挥能力”,即能够理解其他智能体的结构并为其搭建运行环境,这被视作一种元认知能力,是下一阶段智能系统的关键分水岭[22][23][25][37] 技术验证:OpenClaw安装案例 - 公司选择以公认安装极其复杂的OpenClaw作为验证对象,其安装涉及Node.js、pnpm、wsl2、Docker等多重前置环境,对环境变量极为敏感[9] - 在仅给出“在当前环境下,帮我安装并跑通OpenClaw”的指令,且无预设脚本和人工干预的情况下,GenericAgent成功完成了从pnpm安装、依赖配置到网关设置等一系列步骤,最终在Mac系统上成功部署并打开了OpenClaw的网页端[10][16] - 经过少量提示与API key配置后,GenericAgent成功实现了与OpenClaw的对话功能[18] - GenericAgent具备自组织记忆能力,其学习成果以Markdown形式沉淀,使得在新环境(如从Mac切换到Windows)进行二次部署时,速度更快、更便捷,无需重新学习[19][20] 产品定位与未来展望 - GenericAgent由A3实验室(深圳夸夸菁领科技有限公司与复旦大学知识工场实验室联合团队)研发,定位为下一代自组织、自学习、自进化的通用智能体框架,具备“生命感”[30] - 该系统已于2026年1月11日开源,其设计理念是无需依赖Electron、Docker、Mac Mini等复杂环境,也无需多达53万行代码或付费安装服务[31][32] - 公司认为,真正的智能体不仅是能执行任务,更能调度其他复杂工具并不断进化,这代表了“基础设施级智能”的到来[34][35][38] - 未来,该技术框架可应用于自动部署复杂研发环境、自动搭建多Agent系统、自动构建工具链及自动接管繁琐配置任务等场景[38] 商业化产品:DinTal Claw - 为降低非技术用户的使用门槛,公司以GenericAgent为内核,推出了面向企业级、开箱即用的自进化智能体引擎——DinTal Claw[42] - DinTal Claw提供一键安装版本,用户无需懂代码或配置环境变量,双击即可运行,旨在接管用户繁杂的工作流[43] - 公司以此对比市场上可能需要花费500元寻求安装服务的复杂智能体,突出其产品的便捷性与生产力价值[44]
荣耀的“自进化”新局:中国叙事争夺全球话语权
行业困境与荣耀的破局点 - 全球智能终端行业陷入参数内卷的死循环,厂商盲目比拼NPU算力(TOPS)和大模型参数规模,但用户体验未同步提升[5] - 行业面临功能雷同的创新瓶颈,AI功能局限于优化照片、总结文本等单一工具性应用,手机仍是“被动工具”而非“懂你的伙伴”[5] - 许多厂商存在路径依赖的战略短视,过度依赖云端AI方案,导致响应延迟、必须联网及用户数据安全担忧,品牌体验趋同[6] - 荣耀的“阿尔法战略”跳出堆硬件参数和全靠云端AI的二元对立,提出以手机本地智能为核心的“自进化”模式,重新制定游戏规则[6] - 竞争焦点从“手机出厂时的硬件性能”转变为“手机在使用过程中能成长得多快、多贴合用户”,构建了新的优势壁垒[8] 技术护城河:自进化体系 - 荣耀Magic8系列作为2025年性能顶尖的旗舰手机,凭借“同级芯片,跨代领先”的产品力展现技术底气[3] - 智能助手YOYO实现从“执行者”到“共情者”的范式革命,能感知不同场景、理解用户深层需求,并主动规划复杂任务[10][12] - YOYO的交互模式从“用户找功能”变为“服务主动来”,覆盖超过80%的手机高频使用场景,实现3000多个场景的自动化服务[12][14] - “端云结合魔法大模型3.0”和行业首创的“系统级智能上下文感知(MCP)架构”是技术核心,充当高效“智能调度中心”,打通不同设备功能[14] - 通过MCP架构和向全球开发者开放多模态大模型MagicGUI,荣耀搭建“智能生态的通用通道”,吸引开发者为其生态开发能“自进化”的应用[16] 开放生态战略 - 荣耀推广“荣耀无界智联”方案,旨在打破苹果iOS、谷歌安卓、华为鸿蒙等系统间的壁垒,让不同品牌设备实现数据和服务无缝流转[18] - 生态开放的核心是让用户不管用什么设备都能享受“自进化”智能服务,例如视频跨设备续播、文档实时同步等[18] - 该开放生态是荣耀最难被模仿的优势之一,目标是让“自进化”服务无处不在,对当前各自为战的生态格局发出打破壁垒的信号[18] 未来布局与全球叙事 - 荣耀Magic8系列是ROBOT PHONE的“前身”,ROBOT PHONE赋予智能终端物理行动能力,使其从“数字大脑”变为能感知和干预物理世界的“行动者”[20][22] - 此举旨在抢占“后手机时代”的入口,未来智能设备可能是遍布生活空间的智能节点,荣耀为此未来铺路[22] - 荣耀重新定义“性能”:真正性能不是出厂参数,而是持续成长的能力,宣告只比拼硬件参数的时代结束[22] - 荣耀向世界输出与西方科技巨头不同的发展理念,强调“手机本地智能”,更注重用户隐私保护、低延迟响应和个性化体验[23] - 中国科技企业正从“技术追随者”转变为“规则共同制定者”和“发展理念输出者”,争夺智能产业未来十年的话语权[24] - 公司五年投入720亿元研发,并在全球布局研发中心,为参与定义未来提供底气[23] 战略价值与行业影响 - 荣耀Magic8系列的发布短期靠产品力和自进化体验赢得市场,长期是“阿尔法战略”的关键实践和理念验证[25] - 成功将行业竞争焦点从硬件参数“内卷”拉至“自进化”新赛道,目标不再是成为最佳手机制造商,而是下一代智能终端生态的“执棋者”[27] - 为全球智能终端产业提供一个带有鲜明中国印记的发展方向,游戏规则正在被重写[27]
下一代 AI 系统怎么改?让 AI 自己改?!
机器之心· 2025-07-12 18:54
下一代AI系统自我改进 - 互联网人类数据枯竭及局限性推动AI转向「自进化」范式 通过机器与世界互动生成经验数据实现自我改进 突破人类知识边界 [1][4] - 图灵奖得主Richard Sutton提出「经验时代」构想 主张智能体通过自身经验学习获得超人类能力 当前AI方法依赖人类知识输入需突破该范畴 [4] - 「达尔文哥德尔机(DGM)」为代表的自进化技术 通过修改Python代码库实现自我改进 SWE-bench性能从20%提升至50% Polyglot从14.2%提升至30.7%超越人工设计模型 [5][6] 自进化与SL/RL技术差异 - 自进化依赖模型生成训练数据 数据管理算法需纳入学习框架 监督学习(SL)依赖人类标注数据 强化学习(RL)因通用性难以适配自我改进需求 [7][8] - ICLR 2025设立自进化主题研讨会 探讨无监督下合成数据提升模型性能 接收80篇论文覆盖多智能体系统、机器人自进化等领域 [7] - 自进化存在训练崩溃风险 传统RL因奖励信号机制可避免该问题 需结合基础模型、认知神经科学等多领域实现技术突破 [8][9] 具身智能赛道发展动态 - 智元资本运作先于技术成熟 收购上纬新材引发行业关注 主流企业倾向「自研本体+定制模型」路径 双系统架构在高复杂场景稳定性受关注 [2] - 本体形态差异驱动模型设计分化 轮式/四足/人形机器人对应不同技术方案 2025年上半年资本偏好成为行业焦点 [2] - Figure AI筹备量产 借鉴飞机公司经验实现机器人能力指数级突破 摒弃「可爱型」设计避免人类沦为技术仆从 [3]