清华大学AGI-Next前沿峰会核心观点 - 峰会由清华大学基础模型北京市重点实验室发起,汇集了智谱、Kimi、阿里等中国AI领域核心公司的领军人物,探讨了AGI发展的现状、挑战与未来方向 [1][3] - 与会专家普遍认为,大模型的发展正从“对话”范式转向“做事”范式,即从通用聊天能力转向解决具体任务、提升生产力的智能体 [4][18][19] - 中国在开源大模型领域已形成显著影响力,但在整体AI赛道上反超美国仍面临巨大挑战,需要关注技术创新与新范式探索 [4][28] 大模型技术发展路径与现状 - 大模型智能水平持续快速提升,发展轨迹类似人类成长:从2020年前后的简单问答,到2021-2022年的数学计算与基础推理,再到2023-2024年能处理研究生层级问题与真实世界编程任务 [8][9] - 模型能力正从知识记忆走向复杂推理,并在SWE-bench等真实环境评测中表现出可用性,代码能力已能实质性地辅助高级工程师 [8][17] - 当前的核心挑战是从规模扩展走向真正的泛化能力,并解决强化学习可验证场景逐渐耗尽的问题 [11][16] - 到2025年,模型的整体能力仍在快速提升 [10] 智谱AI(唐杰)的技术策略与展望 - 公司发展基于“像喝咖啡一样做研究”的理念,强调AGI需要长期专注与持续投入 [5][6][7] - 判断Chat对话范式已基本结束,下一步是“走向做事”,因此优先选择强化思维、结合编程与智能体的技术路径 [4][18][20] - 通过整合编码、智能体与推理能力,并利用可验证环境进行强化学习,显著提升了模型在真实任务中的稳定性,在SWE-bench等评测中取得领先成绩 [21][22][24] - 面对智能体大规模落地,公司采用API与GUI操作结合的混合方案,并引入交替训练机制以应对强化学习的风险与冷启动问题 [25][26][27] - 认为未来AGI的突破方向可能在于:原生多模态、记忆与持续学习、反思与自我认知能力 [31][34][36] - 提出参考人类双系统认知的AI结构:系统一(模式匹配)、系统二(复杂推理)和自学习模块,并通过数据规模、推理时间和自学习环境三个维度的扩展来提升智能 [37][40][42][43][44][45] - 指出Transformer架构存在计算复杂度高的问题,需探索新型架构以实现高效的知识压缩 [47][48] - 展望2026年将专注于区分已知与未知路径的扩展、推进全新模型架构、发展多模态感统能力,并判断2025年可能成为AI for Science的重要突破年份 [55] Kimi(杨植麟)的技术创新与核心理念 - 认为大模型发展的第一性原理是Scaling Law,即把能源转化为智能,Transformer因其在扩展律上更优的表现而成为主流架构 [56][58][59] - 提出评估模型架构的两个关键维度:Token效率(用更少的Token达到相同效果)和长上下文能力,两者的结合是实现优秀智能体的基础 [60][61][62][63] - 公司通过采用MUON二阶优化器,实现了2倍的Token效率提升,等效于用50%的数据达到相同的测试损失,或用相同数据获得更低的损失 [64][67] - 通过创新的kimi Linear线性注意力架构,在保持线性计算复杂度的同时,实现了在长短程任务上效果均优于全注意力机制,并在百万上下文长度下具有6到10倍的端到端速度优势 [65][73][74][75] - 认为做模型本质是在创造一种世界观和审美,智能具有不可交换性,不同模型会发展出不同的“品位” [4][77] - 公司开发的kimiK2是中国首个智能体模型,可完成两三百步的工具调用,在HLE评测中达到45%的准确率,并声称比OpenAI更高 [72] 阿里通义千问(林俊旸)的进展与方向 - 公司致力于开发通用智能体,训练范式已发生变化,不再完全依赖传统标注,而是通过解决推理和评估来驱动 [81] - 在文本模型上,Qwen3系列总体能力提升,重点增强了推理能力,并支持119种语言及方言,上下文长度已做到1M以上并内部实现数个M [88][89] - 在代码能力上,聚焦于具有生产力的软件工程任务,在SWE-bench评测中达到70分,在相关榜单中排名前列 [91][92][93] - 在多模态方面,视觉理解模型在保持语言智力不下降的前提下,提升了操作手机/电脑的能力,并致力于实现文本、视觉、音频的统一理解与生成 [85][94][95][104] - 图像生成模型进步显著,Qwen-Image系列在内部盲测中排名靠前,12月版本生成的图像已接近真人,并具备强大的图像编辑能力 [99][100][101] - 语音模型Omni能达到文本模型2.5的水平,支持声音定制 [102][103] - 下一代模型将采用新的架构,并探索通过环境反馈进行多轮强化学习,以实现长视野推理,最终让智能体走向数字世界和物理世界 [104][105][106] 行业路线分化与未来思考 - 行业出现明显分化:to C产品对极致智能的需求不强烈,更像搜索引擎加强版;to B市场则强烈追求最强模型,因为智能直接等同于生产力,导致强弱模型分化加剧 [4][113][114] - 在商业模式上,to C场景模型与产品垂直整合依然紧密;但在to B场景,模型层与应用层可能出现分层,强大的模型会被不同的应用层产品在各生产力环节中使用 [113][115] - 学术界与工业界需要协同,工业界在前沿狂奔,学术界应跟进解决基础理论问题,如智能上界、资源分配、幻觉与资源的平衡、持续学习中的噪声清理等 [119][120] - 自主学习的定义多样,它更关乎具体的数据和任务场景,而非单一方法论,目前已在特定场景中逐渐发生 [126][127][128]
姚顺雨对着唐杰杨植麟林俊旸贴大脸开讲!基模四杰中关村论英雄