Workflow
模型分化
icon
搜索文档
深度解读 AGI-Next 2026:分化、新范式、Agent 与全球 AI 竞赛的 40 条重要判断
36氪· 2026-01-14 08:17
模型与行业发展趋势 - 模型分化已成为显性趋势,分化原因多元,包括To B与To C场景需求差异、对竞争格局的押注以及不同AI实验室的战略选择 [1] - 在To B领域,强模型与弱模型的分化会越来越明显,企业用户愿意为“最强模型”支付溢价,因为强模型(如Opus 4.5做10个任务能对8-9个)能减少错误监控成本,而弱模型(可能只对5-6个)即便更便宜也带来额外管理负担 [2][3] - 在To C场景,任务瓶颈往往不是模型不够大,而是上下文(Context)与环境(Environment)的缺失,例如回答“今天吃什么”需要个性化数据,因此利用好合规的上下文数据(如微信聊天记录)比盲目追求更强预训练模型能带来更大价值 [2] - To C场景适合模型与产品进行垂直整合的All-in-one路线,而To B(生产力应用)因涉及复杂生产环节,给了应用公司优化空间,出现了模型公司与应用公司之间的分层 [3] - 模型分化也是自然演化的结果,源于与客户的高频交流,例如Anthropic进入金融领域就是在交流中发现的机会 [3] - 模型分化的时机与竞争格局判断相关,例如智谱AI在DeepSeek出现后判断“Chatbot取代搜索”战局已定,从而选择押注编程(Coding)领域 [4] 技术新范式与自主学习 - Scaling(规模扩展)仍会继续,但需区分已知路径(通过增加数据和算力探索能力上限)与未知路径(寻找新范式,让AI系统自主定义奖励函数、交互方法和训练任务) [5][6] - Scaling Law的核心是将能源高效转化为智能,是技术、数据与品味(taste)共进的过程,探索前沿智能不会因潜在风险而停止 [8] - 自主学习是共识性极强的新范式,目标是让模型具备自反思与自学习能力,通过持续自我评估与批判来优化行为路径 [8] - 新范式的发生是一个“渐变”过程,已有信号显现,例如Cursor的Auto-complete模型每几小时用最新用户数据学习,ChatGPT拟合用户聊天风格,Claude Code编写了自己项目95%的代码 [8] - 新范式发展的最大瓶颈是想象力,即需要构想出证明其实现的具体任务,例如变成一个赚钱的交易系统或解决未解科学问题 [8] - 从实际角度看,强化学习(RL)的潜力尚未被充分挖掘,下一代范式包括自主学习以及AI具备更强的主动性,未来模型可能不再需要人类提示(Prompt),而是由环境直接触发 [9] - 主动学习(Active Learning)会带来严重的安全挑战,风险不在于“讲不该讲的话”,而在于“做不该做的事”,因此必须为其注入正确的方向 [9] - 持续学习(Continual Learning)中,对于多智能体(Agent)串联的长程任务,若单个智能体能力未达100%,后续能力会呈指数级下降,可能需要探索类似人类睡眠的“清噪”与新计算模式 [9] - 提出了“智能效率”(Intelligence Efficiency)概念,未来范式应关注“投入多少资源能获得多少智能增量”,以解决成本瓶颈 [10] - 大模型发展借鉴人脑认知,在多模态、记忆与持续学习、以及反思与自我认知这几类人类显著领先的能力上,可能是新的突破方向 [10] - 智谱AI参考人类认知提出AI系统三模块结构:系统1(模式匹配与知识提取,对应数据与模型规模的Scaling-up)、系统2(知识融合与推理,对应Reasoning的Scaling)、自主学习(对应Environment Scaling,让模型从与外界交互中获得反馈) [10] 多模态与感知能力 - 原生多模态模型与人类的“感统”相似,能汇集视觉、声音、触觉等信息进行综合感知,但当前模型的感统能力并不充分 [11] - 多模态感统是智谱AI今年的重点方向之一,具备此能力后,AI才能在真实工作环境中执行长链路、长时效任务,如在手机、电脑等设备上持续协作 [11] - 多模态同样是Qwen的持续发展方向,认为真正智能的东西天然应该是多模态的,但存在多模态能否驱动智能的争论 [11] - 从第一性原理出发,为模型提供更多生产力、更好地帮助人类,发展视觉、语音等多模态能力是自然而然的选择 [11] - 视频是更广义的表达,理解长视频是一个有意义的探索方向 [12] 智能体(Agent)的发展与产品化 - 编程(Coding)是通往智能体(Agent)的必经之路,例如智谱AI的GLM-4.5虽跑分高但写不出“植物大战僵尸”游戏,通过引入RLVR和大量真实编程环境训练,GLM-4.7才解决了该问题 [13] - 模型即智能体,智能体即产品,实现复杂任务对模型要求极高,因此做基础模型本身就是在做产品 [13] - 模型在To B和To C的分化同样体现在智能体上:To C产品的指标有时与模型智能不相关甚至相反;To B的智能体则更依赖模型智能提升来解决真实世界任务、创造价值 [14] - 生产力场景的智能体才刚开始,除了模型进步,环境与部署(deployment)同样重要,是创造价值的关键,即使模型不再变好,将现有模型部署到各公司也能带来10倍甚至100倍的收益,但目前AI对GDP的影响还远不到1% [14] - 未来的智能体将变成“托管式”,用户设定通用目标后,智能体在后台长时间独立运行直至完成任务,这需要自我进化(Self-evolution)与主动学习(Active Learning)能力支撑 [15] - 在通用智能体开发中,解决长尾任务更值得关注,用户感知AI的价值常因某个长尾任务被解决,今天的AGI本质上也在解决长尾问题 [15] - 通用智能体的开发见仁见智,若应用公司没有比模型公司做得更好的信息优势,那么“模型即产品”对模型公司是机会,因为许多工程问题可能只需“烧卡”即可解决 [15] - 智能体的发展可从两个维度划分四象限:目标定义(人为/自动)和任务规划(人为/自动),目前处于初级阶段(目标与规划皆由人定义),未来将发展为由大模型内生定义 [16] - 决定智能体未来走势的重要问题包括:能否真正解决人类任务并创造价值、成本有多大、以及应用公司的迭代速度是否能拉开时间窗口 [17][18] 全球AI竞赛与中美对比 - 对于中国AI在3-5年内进入全球第一梯队持乐观态度,因为中国在制造业、电动车等领域已证明,一旦某事可行,就能以极高效率复现甚至做到局部更好 [19] - 长期挑战在于文化差异,即“敢突破新范式、敢冒险的人不够多”,并面临两个现实瓶颈:光刻机突破决定的算力瓶颈,以及是否能诞生更成熟的To B市场并在国际竞争,应避免过分刷榜,更关注做“正确的事”和用户体验 [20] - 相对冷静的观点认为,中国AI超过美国的概率最乐观情况为20%,中美算力差异不仅是绝对量级(美国算力比中国大1-2个数量级),更是结构性的:美国将相当一部分算力投入下一代研究,而中国仍在解决任务交付爆发带来的算力瓶颈 [21] - 但“穷则生变”,作为“算力穷人”,中国团队更有紧迫感和动力去思考算法与基础设施(Infra)的联合优化,这可能倒逼创新发生 [21] - 面对光刻机瓶颈,有可能从软硬结合的角度,通过下一代模型结构和芯片实现端到端(End-to-End)的突破 [21]
深度解读 AGI-Next 2026:分化、新范式、Agent 与全球 AI 竞赛的 40 条重要判断
海外独角兽· 2026-01-13 20:33
文章核心观点 - 华人已成为AGI领域的重要力量,中国开源模型是全球Tier 1,预计到2026年地位将更加牢固[1] - 大模型行业正经历显著分化,主要体现在To B与To C场景、以及垂直整合与分层路线上[3] - 自主学习是行业共识性极强的新范式,预计2026年将成为主要投入方向[1] - Scaling(规模扩展)将继续,是技术、数据与品味共进的结果,探索前沿智能不会停止[1] - 模型即Agent,Agent即产品,两者趋于一体化[1] - 中美AI竞赛存在结构性差异,美国算力比中国多1-2个数量级,且更多投入下一代技术探索[1] 模型分化趋势 - 分化趋势显性,原因多元,包括To B和To C场景需求差异、对竞争格局的思考以及不同AI实验室的战略选择[1] - To B领域会出现强模型与弱模型的分化,且会越来越大[1] - To C场景的任务瓶颈往往不是模型不够大,而是上下文(Context)和环境(Environment)的缺失[1] - 在To C逻辑下,大多数用户大多数时候不需要很强的智能,模型智能提升的体验不强烈[3] - To C问题的解法在于真正的个性化数据,例如在合规前提下利用微信聊天记录等上下文,比追求更强预训练模型带来更大价值[3] - 在To B市场,用户(企业)愿意为“最强模型”付出溢价,因此强模型与弱模型的分化会越来越明显[3] - 例如,Opus 4.5这类强模型做10个任务能对8-9个,而弱模型只能对5-6个,即使后者更便宜,但企业因监控错误成本高而更倾向于选择强模型[4] - To C场景中,模型做All-in-one的垂直整合成立,模型与产品可强耦合迭代;而To B(生产力应用)因涉及多生产环节,给了应用公司优化空间,出现了模型公司与应用之间的分层[4] - 模型分化并非预设路线图,更多是自然演化的结果,通常源于与客户的高频交流[4] - 分化与模型竞争的时机相关,例如智谱AI押注Coding是基于对当时模型竞争格局(如DeepSeek出现后Chatbot取代搜索之战基本结束)的判断[5] 新范式:自主学习 - Scaling会继续,但需区分两种方向:Scaling已知路径(增加数据和算力)和Scaling未知路径(寻找新范式,让AI系统自己定义奖励函数、交互方法等)[5] - 当下AI社区对新范式尚无统一定义,自主学习、主动学习、持续学习等概念本质都预期模型能在人类不介入下提升智能[6] - Scaling Law被总结为一种将能源转化为智能的视角,核心在于高效逼近智能上限,是技术、数据与审美的共进[6] - 自主学习的目标是让模型具备自反思与自学习能力,通过持续的自我评估与批判来优化行为路径[6] - 新范式的发生是一个正在发生的“渐变”过程,2025年已出现信号,例如Cursor的Auto-complete模型每几小时用最新用户数据学习,ChatGPT利用用户数据拟合聊天风格,Claude Code写了自身项目95%的代码[6] - 新范式的最大瓶颈是想象力,即需要构想出证明范式实现的具体任务(如赚钱的交易系统或解决未解科学问题)[7] - 从更实际角度看,强化学习(RL)的潜力尚未被充分挖掘;下一代范式存在两个维度:自主学习和AI具备更强的主动性(未来模型可能不再需要人类提示,而是环境本身就能提示它)[7] - 主动学习会带来严重的安全挑战,风险不在于“讲不该讲的话”,而在于“做不该做的事”,因此必须为其注入正确的方向[7] - 自主学习能体现到个性化上,但衡量其是否“变好”会变得困难,因为当AI覆盖生活方方面面后,评估指标变得极其模糊[7] - 对于多Agent串联的长程任务,一旦Agent能力未达100%,后续能力往往呈指数级下降;人类通过睡眠“清理噪音”,AI可能需要探索类似的清噪与新计算模式[8] - 提出了“智能效率”(Intelligence Efficiency)概念,即关注投入多少资源能获得多少智能增量,这是解决成本瓶颈的关键[8] - 大模型发展路径借鉴人脑认知学习过程,而在多模态、记忆与持续学习、反思与自我认知这几类能力上,人类显著领先于当前模型,这些可能是新的突破方向[8] - 智谱AI在2020年参考人类认知规划了AI系统结构图,包含三个模块:系统一(模式匹配与知识提取)、系统二(知识融合与推理机制)、自主学习,分别对应数据与模型规模的Scaling-up、推理的Scaling、以及环境Scaling(让模型从与外界交互中获得反馈)[9][10] 原生多模态 - 原生多模态模型和人的“感统”相似,能汇集视觉、声音、触觉等信息,但当前模型的感统能力并不充分[11] - 多模态感统是智谱AI今年的重点方向之一,具备此能力后,AI才能在真实工作环境中执行长链路、长时效任务[11] - 多模态同样是Qwen持续要做的事情,认为真正智能的东西天然应该是多模态的,但存在多模态能否驱动智能的争论[11] - 从第一性原理出发,为模型提供更多生产力、更好帮助人类,做视觉、语音等多模态能力是自然而然的选择[11] - 视频是更广义的表达,图片可理解为单帧视频,理解很长视频是很有意思的事情[11] Agent发展 - Coding是通往Agent的必经之路,例如智谱AI的实践中,GLM-4.5虽跑分高但写不出“植物大战僵尸”游戏,通过引入RLVR和大量真实编程环境训练,GLM-4.7才解决了该问题[11] - 模型即产品,Agent要实现复杂任务对模型要求相当高,模型就是Agent本身,Agent就是产品本身,做基础模型也就是在做产品[12] - 模型To B和To C的分化同样体现在Agent上:To C产品的指标有时与模型智能不相关甚至相反;To B的Agent甚至不需要做太多创新,模型智能提升、解决真实世界任务能力提高就能创造更多价值[12] - 生产力场景的Agent才刚开始,除了模型进步,环境和部署同样重要,是Agent创造价值的关键:即使模型不再变好,只要把现有模型部署到各公司,也能带来10倍甚至100倍的收益,但今天AI对GDP的影响还远不到1%[13] - 教育非常重要,会使用AI工具的人正在替代那些不会使用工具的人[13] - 未来的Agent将变成“托管式”,用户设定通用目标后,Agent在后台长时间独立运行直至完成任务[13] - Agent要做到这一点离不开前面提到的自我进化以及主动学习,在此逻辑下,“模型即Agent,Agent即产品”[13] - 做通用Agent过程中,长尾任务更值得关注,用户感受到AI的价值与魅力往往因为某个长尾任务被解决,今天的所谓AGI本质上也在解决长尾问题[13] - 做通用Agent是见仁见智的问题,如果作为“套壳”方没有比模型公司做得更好的信息,那么通用Agent就是“模型即产品”的机会,因为对模型公司来说,很多工程问题可能只是“烧一烧卡”就可解决[14] - Agent发展可划分为四个象限,从两个维度看:目标定义(人为/自动)和任务规划(人为/自动);今天处于初级状态(目标与规划皆由人定义),未来会出现大模型观察人的工作并使用人的流程数据,最终目标与规划皆可由大模型定义,Agent应是大模型内生的原生系统[14] - 决定Agent未来走势的几个重要问题:是否能真正解决人类任务并创造价值及价值大小;Agent成本有多大(成本过高是问题,若调用API就能解决,模型厂商意识到价值大时就会自然做进去,这是基座模型与应用之间的矛盾);应用公司的迭代速度(若Agent团队有能力拉开半年时间窗口满足用户需求,就有机会持续往前走)[14][15] 全球AI竞赛 - 对于中国AI在3-5年内进入全球第一梯队持乐观态度,因为中国最大的优势在于一旦证明某件事可行,就有能力以极高效率复现、甚至做到局部更好[17] - 但长期视角中更核心的问题在于“敢突破新范式、敢冒险的人不够多”的文化差异,此外还需面对两个现实瓶颈:算力瓶颈(核心在于光刻机是否有突破)和是否能诞生更成熟的To B市场并在国际市场竞争(应更关注“正确的事”和用户体验,而非过分刷榜)[17][18] - 另一种观点认为,中国AI超过美国的概率最乐观情况为20%[18] - 中美AI之间算力差异不只是绝对量级上的,还是结构性的:美国算力比中国大1-2个数量级,但最关键的差异在于,美国有相当一部分算力投入到了下一代的研究中,而中国今天还在解决任务交付爆发带来的算力瓶颈[1][18] - 但从历史经验看,“穷则生变”,作为“算力穷人”,中国团队更有紧迫感和动力去思考算法与基础设施的联合优化,这个出发点可以倒逼创新发生[18] - 面对光刻机的现实瓶颈,有可能在下一代的模型结构和芯片上从软硬结合的角度端到端地实现突破[18]
唐杰、姚顺雨、杨植麟、林俊旸同台对话背后:5个2026年最重要的AI趋势观察
新浪财经· 2026-01-11 14:47
会议背景与核心观点 - 2025年1月10日,一场由中国大模型领域顶尖人物参与的对话在北京举行,核心议题是寻找中国AGI的突围路径[1][16] - 与会者平均年龄不到35岁,代表了中国AGI赛道的主要力量,包括智谱AI(唐杰)、腾讯(姚顺雨)、阿里巴巴(林俊旸)、月之暗面(杨植麟)等公司[1][2][15][16] - 会议核心共识是,“Chat(对话)范式”的竞争已结束,大模型的未来将向解决问题与自主学习的“深水区”演进[3][17] 下一代AGI范式:自主学习 - 阿里巴巴林俊旸认为,2026年最关键的赌注在于AI的主动性,未来范式应是环境直接Prompt模型,让AI自主思考决策,而非被动响应指令[3][17] - 腾讯姚顺雨同样认为AGI接下来最重要的点是自主学习,这是一个由数据和任务驱动的渐变过程[4][18] - 姚顺雨举例,目前Claude 95%的代码已由Claude自己编写,ChatGPT利用用户数据更新风格也是自主学习的早期信号[4][18] - 林俊旸指出主动学习范式存在风险,需为AI注入正确方向指引,类似培养小孩[3][17] - 姚顺雨认为,尽管OpenAI内部创新受损,但其仍是全球最可能引领下一代范式创新的公司[4][18] Scaling Law(规模法则)的演进与效率 - 智谱AI唐杰指出Scaling Law面临效率困境,从2025年初的10T数据到现在的30T甚至未来100T,单纯增加数据量的收益正在递减[5][19] - 唐杰提出新衡量标准“智能效率”,即用更少算力、更小规模获得同等或更高智能提升,并预判在持续学习、记忆及多模态领域会发生效率范式变革[5][19] - 月之暗面杨植麟认为Scaling Law远未到终点,但内涵已变,Scaling意味着在架构、优化器、数据层面做技术改进,以让模型拥有更好的“品味”,形成护城河[6][20] - 杨植麟指出,Token效率与长文本将是决定AI智力水平的核心因素[6][20] - 阿里巴巴林俊旸提出“测试时扩展”思路,认为o1系列证明可在推理时投入更多计算资源让模型变强,而非仅在训练阶段死磕数据量[6][20] 模型分化趋势 - 模型分化指大模型不再追求样样精通的通用工具,而是根据场景、产品形态和技术特性裂变成不同方向[7][21] - 腾讯姚顺雨认为,模型分化首先发生在商业逻辑上:在B端,智能直接等同于收益,美国用户愿为强模型支付数倍溢价,因其能将任务正确率从60%提升到90%[8][22] - 在C端,分化不在于模型变大,而在于上下文厚度,产品应通过垂直整合让模型感知用户实时环境,走“模型与产品强耦合”路线[8][22] - 阿里巴巴林俊旸认为,公司基因对生态位影响不大,To B和To C本质都是服务人类,他以Anthropic为例,指出其成功源于发现B端客户巨大的Token消耗场景[8][22] - 杨强院士提出,大模型进入稳态后,学术界应研究智能上限和幻觉的平衡,即投入资源与降低错误率之间的风险收益平衡,并建议借鉴人类睡眠机制清理学习噪音[9][23] AI Agent的发展前景与挑战 - 2026年市场对Agent价值爆发充满信心,但对其能否自动化1-2周工作存在不同看法[11][25] - 腾讯姚顺雨认为,To B的Agent正处在上升曲线,但在To C场景,DAU和模型智能常不相关甚至相反,瓶颈在于环境部署和用户教育[11][25] - 阿里巴巴林俊旸认为,通用Agent的魅力在于解决长尾问题,其未来应不止于电脑,需与真实物理世界交互,未来三到五年可能与具身智能结合[11][25] - 杨强院士将Agent发展分为四阶段,认为当前处于最初级阶段(人定义目标与规划),未来大模型将能利用人的过程数据,自行定义目标与规划[12][26] - 智谱AI唐杰认为Agent未来取决于三方面:真正帮助人的价值、成本、以及应用开发速度,行业目前更多在拼速度和时间[12][26] 中美AI竞争与中国的机会 - 智谱AI唐杰对中美差距持保守态度,认为中国模型在快速迭代,但差距可能未缩小,因美国有大量未开源闭源模型[12][26] - 腾讯姚顺雨认为,中国要成为引领者关键在算力突破、发展更成熟的To B市场、以及参与国际商业竞争[13][27] - 姚顺雨指出,美国在To B模型和应用上领先,因其支付意愿更强、文化更鼓励冒险和创新精神[13][27] - 姚顺雨强调,中国需解决能否引领新范式的问题,并走出“榜单的束缚”[13][27] - 阿里巴巴林俊旸同样强调了冒险和创新的重要性[14][28] - 唐杰指出中国市场的赶超机会在于:一群敢冒险的聪明人、更好的营商环境(包括政策)、以及个人的坚持精神[14][28]
唐杰、杨植麟、姚顺雨、林俊旸罕见同台分享,这3个小时的信息密度实在太高了。
创业邦· 2026-01-11 11:22
文章核心观点 - 文章记录了AGI-NEXT活动中多位中国AI行业领袖的圆桌讨论,核心观点是:AI行业正从“聊天”范式转向“行动”范式,并出现明显的市场与技术分化,未来竞争的关键在于模型的“品味”与价值观注入,而非单一能力的比拼 [16][17][20][21] - 与会嘉宾普遍认为,下一阶段的竞争焦点是Agent(智能体)和自主学习,中国AI公司在工程实现和局部创新上具备优势,但要在全球引领新范式,仍需在基础算力、研究文化和冒险精神上取得突破 [17][42][71][73][76] 行业分化趋势 - **To C与To B市场明显分化**:To C产品(如ChatGPT)对普通用户而言体验变化不大,更多是搜索引擎的加强版;而To B市场对智能高度敏感,生产力提升与模型能力直接挂钩,用户愿意为最强模型支付高溢价(例如200美元/月 vs 20-50美元/月) [31][32][33] - **垂直整合与分层路线出现分化**:在To C场景,模型与产品强耦合的垂直整合模式依然成立(如ChatGPT、豆包);但在To B生产力场景,趋势是强大的基座模型与多样化的应用层产品分离,模型层与应用层所需能力不同 [34] - **中美市场应用重点不同**:美国市场Coding(编程)需求消耗量巨大,几乎全是Coding;而中国市场Coding消耗量相对较小,这导致自然的市场分化 [37][38] 技术范式与未来展望 - **当前范式收益接近瓶颈**:预训练走了3年,收益已达七八成;强化学习成为共识,做到了四五十的空间;后续增长需要依赖数据和环境 [43] - **“自主学习”是热门方向但定义多元**:它并非单一方法论,而是依赖于具体场景和奖励函数,例如聊天个性化、代码熟悉度提升、科学探索等,且该趋势已在发生(如Claude Code项目95%的代码由AI编写) [43][44] - **新范式可能在2026年出现**:有观点认为,当Scaling(规模扩展)的收益效率遇到瓶颈时(例如数据从10TB扩展到100TB但收益很小),追求“智能效率”的新范式就会出现,学术界与工业界的资源差距缩小(从万倍差缩小到十倍差)将助推创新 [56][57][58] - **联邦学习与协作模式受关注**:在医疗、金融等隐私要求高的领域,通用大模型与本地领域专家模型通过联邦学习等方式进行协作,成为一种重要趋势 [53][55] Agent(智能体)的发展战略 - **Agent是下一仗的核心**:行业共识是让AI从聊天转向“做事情”,Agent的本质被视为一个搜索问题 [17][18] - **To B Agent处于上升曲线**:其发展逻辑清晰,模型越智能,解决的任务越多,带来的收益就越大,目前没有放缓趋势 [60][61][62] - **环境与部署是关键瓶颈**:即使模型能力停止进步,将现有模型更好地部署到各行业,也能带来10倍或100倍的收益,对GDP产生5%-10%的影响,但目前影响不足1% [62] - **Agent的四个发展阶段**:从目标与规划均由人定义,最终发展到目标与规划均由大模型内生定义,目前处于非常初级的阶段 [68] - **通用Agent的机会**:解决长尾需求是AI的魅力所在,但通用Agent的竞争对创业者和模型公司各有机会,取决于能否比模型公司“套壳”做得更好,或模型公司能否实现“模型即产品” [65] 中国AI公司的机遇与挑战 - **成为全球领先的概率**:嘉宾对此看法不一,有观点表示乐观,认为概率很高;也有观点给出具体数字,认为3-5年后中国公司成为全球最领先的AI公司的概率约为20% [71][77][79] - **关键挑战一:算力与基础设施**:光刻机突破、算力瓶颈、软件生态是主要客观制约因素,中国虽有电力和基础设施优势,但算力规模与美国有1-2个数量级差距,且大量算力用于交付而非前沿研究 [72][76] - **关键挑战二:研究文化与冒险精神**:中国团队更倾向于做已被证明可行的“安全”事情,对刷榜和数字更看重;需要培养更多敢于进行前沿探索和范式突破的冒险精神,这需要文化积累和时间沉淀 [73][74][75][77] - **关键优势与机会**:中国在工程实现、局部优化、产业落地方面能力强,一旦技术被证明,能快速复现并做得更好;年轻一代(90后、00后)冒险精神更强;在To C市场有望百花齐放 [71][77][80][83] - **必要的环境改善**:需要改善营商环境,让顶尖人才有更多时间投入创新而非交付;需要更多资源(资金、算力)投入到AGI行业,支持年轻研究员 [83][85]
唐杰/杨植麟/林俊旸/姚顺雨罕见同台,“基模四杰”开聊中国AGI
新浪财经· 2026-01-10 22:44
文章核心观点 - 中国大模型行业的核心参与者(智谱、腾讯、阿里、月之暗面)在AGI-Next峰会上探讨了行业未来发展方向,共识在于基础模型能力是竞争关键,但发展路径出现分化,重点关注To B与To C的分化、新的技术范式(如自主学习)以及衡量模型智能的新标准[4][5][6][7] 行业竞争格局与公司动态 - 智谱AI于2026年1月8日登陆港股,其创始人唐杰认为对话(Chat)范式探索随DeepSeek出现已基本结束,公司已押注(bet)于Coding和Reasoning,成果为GLM-4.5模型[4][5][6][23] - 前OpenAI研究员姚顺雨加入腾讯,出任CEO办公室首席科学家,腾讯近期完成了关键的模型团队重组[4] - 阿里通义实验室技术负责人林俊旸为阿里最年轻P10,其开源模型的衍生数量和下载量位列全球第一[4] - 月之暗面CEO杨植麟近期官宣了新一轮5亿美元的融资[5] 中美大模型差距与行业共识 - 唐杰指出,美国与中国大模型之间的差距可能并未缩小,因为美国有大量闭源模型未开源[5] - 2025年行业形成的最大共识是:基础模型的能力高低决定着未来多场竞争的输赢,包括能否成为下一个超级入口或伟大公司[5] - 四位嘉宾共同看好AI的自主学习作为下一阶段的方向[6] 下一代AGI范式与智能衡量标准 - 智谱唐杰定义了衡量智力水平的新范式“Intelligence Efficiency”,用于衡量模型投入和智力收益的ROI,他认为当前疯狂的RL和Scaling收益已大不如前[7][41] - 月之暗面杨植麟认为下一阶段Scaling仍是重点,但需在架构、优化器、数据层面做技术改进,目的是让模型拥有更好的“Taste”以避免趋同[6] - 杨植麟定义的AI智力水平是Token效率(Token Efficiency)和长文本(Long Context)的结合[7] - 学术界代表杨强提出,需研究智能上限、资源分配以及如何用资源换取幻觉降低的平衡点,类比经济学中的“无免费午餐定理”[20][93] To B与To C市场分化 - 姚顺雨与林俊旸共识:To C和To B的分化会越来越明显,AGI的本质是服务真实的人类场景[7] - To C场景下,垂直整合成立,模型与产品需强耦合迭代以优化用户体验,如ChatGPT和豆包[7][13] - To B场景下,趋势相反:模型公司专注做强模型,应用公司则追求用最强模型提升生产力,两者分化[7][12] - To B市场用户愿意为最强模型支付高溢价,例如一个模型200美元/月,次强的50美元/月,因为智能越高代表生产力越高,能赚的钱越多[11][83] - 姚顺雨指出,在To B市场,强模型与弱模型的分化会越来越明显,因为最强模型(如OpenAI 4.5)可能10个任务做对八九个,而差一点的只做对五六个,后者需要额外监控成本[11][84] 公司发展战略与押注(Bet) - 腾讯(姚顺雨)作为To C基因更强的公司,关注如何通过额外上下文和环境给用户提供更多价值,例如利用微信聊天记录作为模型输入[13][14][15] - 阿里(林俊旸)认为分化是自然发生的,公司没有绝对的基因之分,成功关键在于与客户交流发现真实需求,他举例美国API消耗量中Coding占据绝对主导,而中国尚未达到此水平[8][17][89] - 智谱(唐杰)在2025年初决定全力押注Coding,并将所有精力投入其中[23] - 大公司在To B和Coding方面的优势在于其庞大的内部场景可提供多样化数据,例如10万人的公司可比创业公司或数据标注商捕捉更真实、多样的场景数据[16][88] 自主学习(Self-Learning)范式 - 自主学习是硅谷热议的下一个范式,但定义多样,可体现在个性化聊天、熟悉公司代码环境、探索科学问题等不同场景[25][26][98] - 姚顺雨认为自主学习已是进行时,例如Cursor每几小时用最新用户数据学习,Claude项目95%的代码已由Claude自己编写,但这更像是渐变而非突变[27][28][99][101] - 实现自主学习的挑战在于想象力,需要明确何种任务和效果能证明其实现,例如赚钱的交易系统或解决未解科学问题[30][101] - 林俊旸提出,除了自主学习,AI的主动性(即环境能prompt其自主思考做事)可能是2026年关键押注,但需警惕由此引发的安全问题[32][103][104] Agent(智能体)发展前景 - 行业对2026年Agent的预期是能自动化人类一周到两周的工作量,成为创造经济价值的关键一年[42][112] - To B领域的Agent发展曲线仍在上升,未显放缓趋势,模型智能与收入增长目标一致,如Anthropic的案例[42][112] - 发展Agent的瓶颈除了模型本身,还包括环境部署和教育普及;即使模型不变,广泛部署也可能带来10倍或100倍收益,对GDP产生5%-10%的影响,但目前影响远不到1%[44][114][115] - 林俊旸认为,真正的Agent需能与真实物理世界交互(如指挥机器人做实验),而不仅限于电脑环境,这可能需要三到五年与具身智能结合[47] - 通用Agent的机会在于解决长尾问题,但若创业者不具备比模型公司更强的“套壳”能力,该问题可能仍由模型公司自身解决[48][49] 中国AI公司的未来机遇与挑战 - 姚顺雨对三年到五年后全球最领先的AI公司来自中国团队持乐观态度,概率较高,关键条件包括突破算力瓶颈(如光刻机)、发展成熟的To B市场或国际商业环境竞争,以及培养更多具有冒险精神的人才进行前沿范式探索[56][57] - 林俊旸对此概率的估计约为20%,认为挑战包括美国算力投入比中国大1-2个数量级且更多用于下一代研究,而中国算力大量用于交付;机遇在于“穷则生变”,可能在软硬结合(如定制芯片与模型协同设计)中创新[62][67] - 唐杰指出中国AI Lab与美国有差距,但90后、00后一代更愿冒险,改善营商环境让聪明人有时间创新,以及从业者坚持是成功关键[71][73] - 杨强类比互联网发展,看好中国在To C市场百花齐放,并认为To B解决方案也会很快跟上[69][70]
唐杰、杨植麟、林俊旸、姚顺雨罕见同台,「基模四杰」开聊中国AGI
36氪· 2026-01-10 22:14
文章核心观点 - 2025年中国AI行业形成的最大共识是基础模型的能力高低决定未来多场竞争的输赢 闭门会四位主角的共同主题是稳固基模第一梯队地位同时让模型驱动业务发展 [5] - 中国大模型靠快节奏迭代和持续开源在国际上获得声量 但中美大模型差距可能并未缩小 因为美国有大量闭源模型未开源 [6] - 随着AGI探索范式变化 制定衡量模型智力的新标准非常重要 嘉宾共同看好的下一阶段方向是AI的自主学习 [6][7] AGI下一代路线与范式探索 - 后DeepSeek时代 对话范式探索基本结束 智谱押注了集推理、Agentic、Coding能力于一体的新范式 其GLM-4.5是成功成果 [6] - 对Scaling Law信徒而言 下一阶段Scaling仍是重点 但新变化是在架构、优化器、数据层面做技术改进 目的是让模型拥有更好的“Taste”以避免趋同 [6] - 驱动不同AI探索范式的核心是目标选择 追求智力顶峰还是注重落地 这决定训练策略是垂直整合还是分化训练 [7] - 未来To C和To B的分化会越来越明显 AGI的本质是服务真实的人类场景 [7] - To C场景下垂直整合成立 模型和产品必须强耦合迭代才能做出好体验 To B场景则相反 模型公司专注做强模型 应用公司追求用最强模型提升生产力 两者分化 [8][11][13] - 这种分化是自然发生的 公司没有基因之分 服务真实需求是关键 例如美国API消耗量中Coding占据绝对主导 [8][17] 模型智力衡量新标准 - 定义的AI智力水平是Token效率和长文本的结合 即在不同Context长度下模型优势有多大 [7] - 定义了衡量智力水平的新范式“智能效率” 用于衡量模型投入和智力收益的ROI 因为当前疯狂的RL和Scaling收益已大不如前 [7] - 在To B市场 强模型和弱模型的分化会越来越明显 用户愿意为最强模型支付溢价 例如一个模型200美元/月 次强的50美元/月 因为强模型能显著提升工作效率 [10][11] 大模型公司的战略选择与瓶颈 - 腾讯作为To C基因更强的公司 思考如何让大模型给用户提供更多价值 认为To C的瓶颈常在于额外的上下文和环境 而非更强的模型 [13][14][15] - 在中国做To B很难 很多做Coding Agent的公司选择出海 大公司的优势在于自身拥有多样化应用场景和生产力需求 能利用真实世界数据训练模型 而创业公司依赖数据厂商 多样性受限 [16] - 智谱经过思考 认为Chat的竞争自DeepSeek出现后已结束 因此决定将所有精力押注在Coding上 [23] - 预训练已过去三年 RL成为共识 硅谷正在讨论下一个新范式“自主学习” [24] 对“自主学习”范式的展望 - 自主学习是非常热门的词 但每个人定义不同 它并非方法论 而是数据或任务 其挑战因场景而异 [25][26] - 自主学习已在发生 例如ChatGPT利用用户数据弥合聊天风格 Claude项目95%的代码由Claude自己编写 [27] - 自主学习更像是渐变而非突变 2025年已看到信号 例如Cursor每几小时用最新用户数据学习 [28][30] - 实现自主学习的最大问题之一是想象力 即需要先构想出它实现后的具体形态和效果 [30] - OpenAI仍是全球最有可能诞生新范式的地方 尽管其创新基因可能因商业化被削弱 [30] - 另一个值得思考的方向是“测试时扩展” 即通过吐出更多Token变得更强 以及AI实现更强的主动性 由环境触发而非人类提示 但这引发了安全问题 [32] - 自动化AI研究员甚至不需要自主学习 未来AI训练AI可能很快实现 更大的技术挑战在于如何评估个性化等指标 [33][34] 对Agent发展的预期 - 2026年对Agent的一大预期是它能自动化人类一周到两周的工作量 而不再仅是工具 这可能是Agent创造经济价值的关键一年 [44] - 在To B方面 Agent正处在不断上升的曲线上 目前没有变慢趋势 模型智能越高 解决任务越多 带来的收入越大 [44] - 当前除了模型本身 还有两个瓶颈 一是环境和部署问题 现有模型若广泛部署可能带来10倍或100倍收益 对GDP产生5%-10%的影响 但目前影响远不到1% 二是教育问题 会用AI工具的人与不会用的人差距在拉大 [46][47] - Agent未来需要与真实物理世界交互 而不仅限于电脑环境 这需要三到五年时间与具身智能结合 [54][56] - 通用Agent的魅力在于解决长尾问题 头部问题易解 但解决用户寻遍各处都找不到的问题才是AI最大魅力 [57] - Agent发展有四个阶段 目前处于最初级阶段 目标和规划均由人定义 未来应由大模型内生定义 [60][61] - Agent未来的走势取决于其解决的事情是否有价值、成本有多大以及开发应用的速度 [63] 中国AI公司的机遇与挑战 - 中国团队在三年和五年后成为全球最领先AI公司的概率较高 因为一旦技术被证明可行 中国能快速复现并在局部做得更好 如制造业和电动车先例 [65] - 关键条件包括 能否突破光刻机等算力瓶颈 中国有电力优势和基础设施优势 但产能和软件生态是问题 以及能否发展出更成熟或更好的To B市场或参与国际商业竞争 因为美国支付意愿更强 文化更成熟 [65][66][67] - 主观上需要更多有创业或冒险精神的人去做前沿探索和范式突破 中国在商业、产业设计和工程上已比美国做得更好 但引领新范式是唯一待解决的问题 [68][69][70][71] - 中国研究文化更倾向于做安全、已被证明可行的事情 对刷榜或数字看得更重 需要时间积累文化底蕴并走出榜单束缚 坚持做正确且体验好的事情 [71][72][73] - 中美算力差距有1-2个数量级 美国将大量算力投入下一代研究 中国则捉襟见肘 大部分算力用于交付 这是历史遗留问题 [75] - 从软硬结合角度 中国有机会做出下一代模型和芯片 但需要更紧密的跨领域协作 [76] - 中国年轻一代冒险精神在变强 营商环境在改善 这有利于创新 但历史积淀原因导致中国公司成为最领先者的概率约为20% [77][78][80] - 回顾互联网发展 中国很快赶上并诞生了世界第一的应用 看好AI技术在To C领域百花齐放 To B领域也会很快跟上 [81][82] - 中国需要敢于冒险的聪明人、更好的创新环境以及从业者自身的坚持 [86][87]
唐杰、杨植麟、姚顺雨、林俊旸罕见同台分享,这3个小时的信息密度实在太高了。
数字生命卡兹克· 2026-01-10 20:37
文章核心观点 - 多位中国AI行业领军人物在AGI-NEXT会议上探讨了行业发展趋势,核心观点认为Chat聊天范式竞争已结束,下一阶段竞争焦点转向Action(执行任务)和Agent(智能体)[6] - 行业将出现明显分化,包括To C与To B市场的分化,以及垂直整合与模型应用分层路径的分化[12] - 对下一代技术范式(如自主学习)持乐观态度,并认为2025-2026年可能出现关键信号[21][23][28] - 智能体(Agent)在2026年有望创造显著经济价值,能够处理更长时间跨度的任务[32] - 中国AI公司在未来3-5年有成为全球领先者的机会,但需克服算力、市场环境和文化等挑战[39][40][41][45][46] 行业分化趋势 - **To C与To B市场分化明显**:To C产品(如ChatGPT)对大部分用户而言是搜索引擎的加强版,用户感受变化不大;而To B市场对智能水平高度敏感,智能越高代表生产力越高,用户愿意为最强模型支付溢价(例如200美元/月 vs 50或20美元/月的次优模型)[13][14] - **To B市场呈现“赢家通吃”趋势**:最强的模型与稍弱模型之间的分化会越来越明显,因为用户无法预知次优模型在哪些任务上会出错,需要额外精力监控[15] - **技术路径出现分化**:垂直整合路线(模型与产品强耦合)在To C领域(如ChatGPT、豆包)依然成立;但在To B领域,趋势似乎是模型层与应用层分离,强大的模型被不同的应用用于各种生产力环节[15] 下一代技术范式展望 - **自主学习是热门方向但定义多样**:硅谷已形成共识,但具体指代的任务场景各异,例如聊天个性化、代码环境适应、探索新科学领域等[21] - **自主学习已在发生**:例如ChatGPT利用用户数据优化聊天风格,Claude Code项目95%的代码由Claude自身编写以帮助其变得更好[22] - **范式突破可能发生在2025-2026年**:例如Cursor等公司已开始每几小时用最新用户数据训练模型,被视为早期信号[23] - **学术界与工业界将协同创新**:随着学校算力资源增加(尽管与工业界仍有10倍差距),学术界具备创新基因,将研究工业界未及解决的问题,如智能上界、资源分配、幻觉与资源的平衡(类似经济学中的风险收益平衡)等[18][19][28] - **效率瓶颈驱动创新**:大模型投入巨大但效率不高,继续Scaling的收益递减。未来需要定义“智能效率”,即用更少投入获得同等智能增量,这将成为范式创新的驱动力[29][30] 智能体(Agent)发展战略 - **To B Agent价值明确且处于上升曲线**:其价值与模型智能水平直接正相关,模型越智能,解决任务越多,带来的收益越大[32][33] - **当前瓶颈在于部署与教育**:即使模型停止进步,将现有模型更好部署到各公司也能带来10倍或100倍的收益,对GDP产生5%-10%的影响(目前影响不足1%)。同时,教育用户使用工具至关重要[34] - **Agent进化方向是更长的任务时长与主动性**:期待2026年Agent能处理人类1-2周工作量的任务流。更高级的Agent应具备自主进化和主动思考能力,但这引发了安全问题[25][32][35] - **通用Agent的机会存在于长尾需求**:解决广泛、分散的长尾问题是AI的魅力所在,也是挑战。模型公司凭借算力和数据可能快速解决部分问题,但套壳应用若做得更好也有机会[36][37] - **Agent发展有四个阶段**:从目标与规划皆由人定义,最终发展到目标与规划皆由大模型内生定义[37] 中国AI公司的机遇与挑战 - **成为全球领先者的概率与条件**:有嘉宾认为概率很高,也有嘉宾给出20%的乐观估计[39][47]。关键条件包括:突破算力瓶颈(如光刻机)、发展更成熟的To B市场或参与国际竞争、以及培养更多具有冒险精神和前沿探索意愿的人才[40][41][46] - **中美研究文化差异**:中国团队更倾向于做已被证明可行的、确定性高的事情(如预训练),对刷榜和数字指标看得较重。需要积累文化底蕴,并敢于坚持自己认为正确的方向,而非仅受榜单束缚[43][44] - **算力分配制约创新**:美国公司将大量计算资源投入下一代研究,而中国公司的大量算力被交付任务占据,用于前沿探索的资源相对捉襟见肘[45] - **软硬结合与冒险精神**:存在通过模型与芯片协同设计实现创新的机会。年轻一代(90后、00后)冒险精神增强,营商环境的改善有助于创新[46][49] - **历史借鉴与未来信心**:回顾互联网发展,中国在应用层面实现了赶超。在AI领域,To C应用可能百花齐放,To B解决方案也将跟进,关键在于创造让聪明人敢于冒险的环境并坚持到底[48][49][50]