文章核心观点 - 到2026年,AI行业组织方式发生根本性变革,转向跨团队联合设计“硅基生命”的完整系统,涵盖感知、大脑、心脏、神经、软件与硬件本体[1] - 通用智能体(Agent)的发展路径已经跑通,并成为未来核心,其关键在于主动服务与系统级整合,而非简单的工具调用[7][10][12] - 具身智能是下一场关键竞争,需要云端大脑与端侧系统的联合设计,中国企业在此领域具备显著优势[12][14] - 理想汽车的战略重心转向构建完整的AI系统与系统级通用智能体,并计划进军人形机器人领域,以创造“硅基人类”服务用户[4][11][13] AI行业组织与研发范式变革 - 行业组织方式统一为跨功能团队联合设计,共同构建硅基生命的感知、大脑、心脏、神经、软件和硬件[1] - 所有领先公司均设立基础设施团队保障算力与数据,相当于“云端心脏”;设立基座模型团队作为“大脑”,研发多模态与机器人技术[1] - 研发以大量招收校招生(包括本科生)为主,均需进行预训练与后训练[1] - 自2025年下半年起,普遍组建专门的“软件本体”团队和“造手”团队,构建完整工具链与SaaS调用能力,赋予模型数字世界执行力[1] - 提供免费的数字世界工具和完整团队服务,例如Lovart提供从创意到发布的全流程设计团队,Claude Code覆盖从需求分析到部署验证的全流程[1] - 通过微调、上下文工程与记忆技术,将基础模型转化为可配合工具进行大规模生产的“个体”[1] 模型训练的正确与错误路径 - 评估模型能力是必要环节[2] - 基座模型迭代频率需至少每周一次,智能体本体需至少每天一迭代[4] - 两种错误的后训练方式包括:1)采用类似LoRA方式,主模型参数不动,用小模型辅助,这被比喻为制造“章鱼”结构,无法成为“人”[3];2)根据需求直接调整主模型参数,这会导致主模型性能变差[3] 通用智能体(Agent)的成功实践与核心特征 - 2024年关于大模型落地的争论中,坚信“大模型+提示工程”的B派(以Manus团队为代表)最终成功,而依赖知识图谱和规则算法的A派几乎全军覆没[5][6] - 2025年初即开始布局通用智能体的团队,在2026年成为华人领域80%的主流成功者[6] - Claude Code被视作工程思维的通用智能体,它通过CLI工作,能调用工具、编写新工具甚至直接调用操作系统权限解决问题,相当于配备了一个完整的工程师团队[6][7] - 使用Claude Code三天后能深刻理解AI未来发展方式,预计2026年80-90%的信息类工作可由其完成[7] - Manus从“浏览器+工具”角度定义了通用智能体的做法,其约100人的团队做出了世界领先的通用智能体,并被Claude的Cowork功能模仿[7] - 豆包手机实现了系统级通用智能体,其优势在于:1)能调用并开启手机上几乎所有应用的功能[8];2)交互方式符合人类直觉[9];3)操作路径能转化为训练数据,实现自我进化(步骤从7-8步缩减至1-2步)[10] - 2026年1月,千问APP作为生活服务领域的通用智能体表现突出,例如能在几十秒内完成点20杯不同奶茶的复杂任务,而人类需要10-20分钟[10] 通用智能体的发展路径与生态要求 - 四条已跑通的通用智能体路径:模型能力派(如Claude)、系统终端派(如豆包手机)、生活生态派(如阿里)、浏览器工具派(如Manus)[11] - 构建真正的系统级通用智能体需要强大的基座模型能力和丰富的生态,否则会受制于其他平台(如ChatGPT做购物受亚马逊限制,豆包手机受微信/支付宝限制)[11] - 现有车机系统的深度定制功能(如直达指令)本质是“热键”或“API”,割裂了用户体验且无法产生有效训练数据,并非真正的智能交互[10] - Claude Code选择CLI而非IDE界面,是为了与工程师的实际工作逻辑保持一致,促进人机相互理解,这种逻辑尚未在任何车辆(包括特斯拉)上实现[10] 理想汽车的战略转向与具身智能布局 - 理想汽车计划对技术和研发团队进行大调整,按照最先进的“协作造硅基生命”方式工作[4] - 公司正构建包含推理芯片、操作系统、基座模型的完整AI系统,并分别于2022、2022、2023年启动,强调原生联合设计的迭代速度远快于借用外部组件[4] - 目标是构建真正的软件本体,服务用户大规模生产,打造围绕用户的完整软件生态和系统级通用智能体,让手机所有应用都能运行在车机上[4] - 同时深化硬件本体自研,包括电池、电机、碳化硅、主动式转向、刹车、悬架等[4] - 公司战略聚焦于改善生活的ToC领域,具体为“自动驾驶+司机”与“人形机器人+家政”的组合[11] - 认为雇佣司机、保姆、家政的是同一人群,他们期望统一的大脑系统和沟通方式,因此必须立刻启动人形机器人项目,否则将错过最后的上车机会[11] - 计划从水下浮出水面的机器人团队中招聘顶尖人才,并将此前因缺乏机器人业务而流失的员工招回[11] - 当前机器人面临的难题与2025年初通用智能体面临的难度相似,其迭代速度虽比软件稍慢,但进展将远超预期[11] - 公司使命更新为“Be Proactive, Change the World”,品牌定位从“创造移动的家”强化为“给车和家赋予生命”,核心是创造“硅基的人”[12][13] 具身智能的竞争逻辑与技术架构 - 具身智能需要云端大脑与端侧系统联合设计,端侧必须配备本地推理芯片(“本地心脏”)以确保断网安全,并配备反应快速的端侧模型(“大脑”)[12] - 必须重新设计感知系统,因为感知是由大脑模型训练出来的,需与大脑联合设计[12] - 具身智能竞争被比喻为物种进化竞赛,大脑、感官、肢体的性能必须完美平衡,任何一项弱30-50%就会被淘汰[12] - 未来服务的核心是Proactive(主动服务),即高频且无需用户指令的可见服务[12] - 展望未来五年,在数字世界美国可能略优,但在具身智能领域,即使有特斯拉存在,中国企业也将完胜美国[14]
2026年1月的李想对AI与Agent的理解