行业趋势与范式转变 - 人工智能技术发展正处临界点,大规模预训练和强化学习对齐等旧范式带来的爆发期即将结束,新的提升范式尚未全面启动[5] - 行业共识是从“聊天机器人”进化为“干活的智能体”,从单纯堆砌算力转向追求AI“自我学习”,让AI从预测下一个词变为真正理解并改变物理世界的智能生命体[6] - 单纯的参数竞赛已成过去,前沿公司和团队正在探索新的技术航路[8] - 智能体(Agent)被寄予厚望,其演进被划分为四个阶段:1. 目标和规划由人定义;2. 目标由人定义,规划由AI辅助;3. AI观察人的工作流程自动学习规划;4. 终极阶段是目标和规划都由大模型内生定义,目前大多处于第一、二阶段[44] 智谱AI (GLM) 的技术路径 - 公司认为大模型正在从基于直觉的“系统1”思考向基于逻辑的“系统2”思考进化[11] - 提出单纯依靠堆砌数据和算力的Scaling路径是“人类偷懒的办法”,更本质的方法是找到新的知识压缩方式和未知的Scaling范式[11] - 重点介绍了RL V R(可验证奖励的强化学习),在数学、编程等可验证场景下,模型可通过自我探索突飞猛进,GLM-4.7是这一思路的产物[11] - 在移动端智能体方面,采用“API + GUI”混合模式,演示中AutoGLM可在手机后台静默执行长达40步的复杂操作[12] - 提出“机器睡眠”构想,认为未来AI应具备通过“自反思”和“自学习”来消化数据的机制,类似人脑的睡眠[14] - 提醒中国开源模型虽在榜单领先,但与顶尖闭源模型的实际差距可能并未明显缩小,需探索未知范式以缩小差距[16] 月之暗面 (Kimi) 的技术路径 - 公司认为从2019年至今,所有大模型的第一性原理依然是Scaling Law,本质是“将能源转换为智能”的过程[19] - 强调Transformer架构在长上下文(Context)下的优势是智能体时代的胜负手,因为许多智能体任务是搜索问题,更好的预训练模型能提供更强先验以帮助搜索剪枝[22] - 为追求极致“Token效率”,推出了Muon优化器,相比Adam优化器实现了“两倍的Token效率提升”,达到同样智能水平只需一半数据量[23][24] - 另一突破是Key-Value Cross Attention新架构,针对长上下文任务,其在超长Context下的表现超越了全注意力机制,且速度提升了6到10倍[26] - 认为智能是非同质化的,做模型本质是在创造一种世界观,基于此理念打造的Kimi K2模型在极高难度的HLE基准测试中达到45%的准确率,超越了OpenAI等美国前沿公司[27] 阿里云通义千问 (Qwen) 的技术路径 - 公司秉持“模型即产品”的理念,通过开源社区反馈完成自我进化[31] - 针对2026年主力模型Qwen-3,正在全力打磨Hybrid Architecture(混合架构),极可能是将Transformer与Mamba等线性注意力机制以3:1比例混合,旨在解决无限长文本带来的显存和计算瓶颈[32] - 实现了“不降质”的突破,在增强视觉和语音能力的同时,模型的文本推理能力不再出现倒退,实现了多模态与智力的同步提升[32] - 正在尝试将“生成”与“理解”打通,例如在解几何题时,模型可自己画辅助线(生成)然后基于新图继续推理(理解),这种“理解-生成一体化”被视为通向AGI的重要台阶[36] - 愿景是打造能真正帮助人类的智能体,并坚信能够操作电脑、写代码、在物理世界行动的具身智能(Embodied AI)才是AI走向现实世界的终极形态[36] 市场应用与商业化前景 - 当前大模型在ToC(面向消费者)端的体验正趋于平缓,普通用户对模型在专业领域能力提升的感受变化不强烈[41] - ToB(面向企业)端的生产力革命已经发生,尤其是在编程(Coding)场景,“Coding革命已经开始”,正在改变整个计算机行业的工作方式[41] - 在ToB市场,强模型和弱模型的分化会越来越明显,企业愿意为顶级模型支付溢价以换取确定性,例如顶级模型能做对9个任务而差一点的模型只能做对5个时,企业无法承受未知的错误[41] - 智能体要产生经济价值,瓶颈往往不在模型本身,而在部署环境和用户教育,即使模型能力不再提升,仅将现有模型部署到各种企业环境中就能产生巨大经济效益[44] - 智能体的核心价值在于解决通用模型无法覆盖的、极其个性化的长尾需求[44] 技术范式前瞻:自主学习 - “自主学习”(Self-learning)成为行业共识的下一代范式关键词[42] - 有观点认为自主学习可能不会以突发突破形式出现,而更像一个“潜伏的间谍”渗透过程,例如ChatGPT利用用户数据拟合聊天风格,Claude Code编写了自己项目95%的代码,已是雏形[42] - 另一种观点提出“智能效率”概念,即投入多少资源能获得多少智能增量,认为真正的范式革命是找到能用极少投入换取巨大智能增量的新路径[42] - 也有对“主动性AI”的安全担忧,担心AI可能主动做出不可控的行为[43] 中美AI发展对比与竞争格局 - 有观点将中美AI创新模式对比为美国的“富人创新”与中国的“穷人创新”,硅谷在资源充裕下探索下一代范式,中国团队则在资源受限下逼出极致算法优化和工程落地能力[45] - 中国研究界存在过分关注榜单和数字,而忽视探索正确技术路径的倾向,需要更多冒险精神和研究文化,走出榜单束缚[46] - 硬件瓶颈被视作客观且可解决,真正的差距在于主观的冒险精神,中国00后一代展现出的冒险精神令人欣慰[46] - 如果有一群聪明人愿意做特别冒险的事,且国家能提供更好的容错环境,哪怕概率只有20%,也有机会抓住三五年一遇的窗口期[46] - 中国AI正在从刷榜走向落地,从复现走向探索,通过开源先进模型,国内科技公司正从全球AI技术的跟随者转变为推动者[47] - 国内AI“开源四巨头”正脱颖而出,包括智谱、月之暗面、Qwen和DeepSeek[47][48]
刚刚,唐杰、杨强、杨植麟、林俊旸和刚回国的姚顺雨坐一起都聊了啥?