Workflow
智谱模型
icon
搜索文档
张钹、杨强与唐杰、杨植麟、林俊旸、姚顺雨(最新3万字发言实录)
新浪财经· 2026-01-12 12:37
文章核心观点 - 多位中国顶尖AI公司创始人、技术负责人及院士在AGI-Next前沿峰会上,就AGI发展路径、模型扩展极限、智能体落地及中国AI的长期机会等议题展开深度交流,核心共识在于大模型发展正从“对话”范式转向“做事”范式,智能体是明确的前进方向,同时需在模型架构、训练范式及多模态等基础能力上寻求突破 [3][4][19][20] 行业技术发展路径与范式转变 - **从Chat到Agent的范式转变**:以DeepSeek的出现为标志,纯粹的“对话”范式竞争基本结束,行业焦点转向让AI完成具体任务的智能体范式 [4][19][20] - **Scaling Law的持续与反思**:模型扩展仍是提升智能的有效路径,但可能是一种“偷懒”方式,未来探索方向是让模型具备自主扩展能力,并需结合技术、数据与审美共同演进 [4][42][50] - **能力演进轨迹**:大模型能力从2020年前后的简单问答,发展到2021-2022年的数学计算与基础推理,再到2023-2024年可处理研究生层级问题与真实世界编程任务,智能水平持续快速提升 [9][11] - **强化学习与可验证环境**:RLVR通过引入可验证环境使模型能自主探索并获得反馈,是重要进展,但当前挑战在于可验证场景逐渐耗尽,需向半自动或不可验证任务空间拓展 [17] 模型能力进展与挑战 - **代码能力飞跃**:模型从2021年写十个程序才能跑通一个,发展到如今在复杂任务中可一次性跑通,能实质性地辅助高级工程师 [18] - **核心评测表现**:在HLE等极高难度智能评测基准上取得进展,例如有模型在HLE上达到45%的准确率,超过OpenAI [17][63] - **能力整合与回灌挑战**:在SWE-bench等真实世界评测中取得好成绩,但如何将专项能力可靠地整合回主模型,避免用户真实体验与Benchmark成绩脱节,仍是巨大挑战 [24] - **通用能力与专用能力的平衡**:在较小规模模型上引入大量Agent数据能显著增强Agent能力,但会导致部分通用语言和推理能力下降,未来需解决在强化Agent能力的同时避免损害通用能力的问题 [27] 智能体发展的关键问题与探索 - **智能体任务复杂度**:基础能力是编程,但任务可延伸至几十步、上百步的完全异步超长链路任务,这带来了全新的技术挑战 [25] - **环境交互的混合方案**:在现实环境中,需采用API调用与模拟GUI操作相结合的混合方案,以采集数据并训练模型适应能力 [26] - **训练风险与校正**:在数据不足的冷启动场景下,强化学习易陷入局部最优,需在训练中周期性插入SFT进行方向校正和多样性恢复 [27] - **开源生态影响力**:中国在开源大模型领域影响力显著,在Artificial Analysis榜单前五名中,蓝色模型几乎全部来自中国 [28] 未来AGI的突破方向与思考 - **三大关键突破方向**:1) 建立类似人类感统机制的原生多模态能力;2) 构建从个体到文明级的记忆与持续学习框架;3) 发展更深层次的反思与自我认知能力 [33][34][35] - **参考人类认知的三类Scaling**:1) Scaling数据与模型规模以提升智能上限;2) Scaling推理,用更多计算与搜索找更优解;3) Scaling自学习环境,让模型从与外界交互中获得反馈 [40][41] - **模型架构创新需求**:Transformer的O(N²)计算复杂度制约长上下文效率,需探索线性复杂度等新型模型架构,以实现更高效的知识压缩与承载 [42][64] - **自主学习的多层定义**:从实现F-X到X映射的自监督多任务学习,到引入数据学会推理,再到具备自反思与自学习能力,最终可能发展出自我认知乃至意识 [44][45][46][47] 主要公司的技术实践与战略 - **智谱AI**:发展路径聚焦强化模型的Thinking能力并结合Coding与Agent场景,通过整合Coding、Agentic和Reasoning能力,并利用RLVR在可验证环境中优化,使模型在真实编程任务中稳定性提升 [21][22][23] - **月之暗面**:技术核心围绕提升Token效率与长上下文能力,采用Muon二阶优化器使Token效率提升2倍,并研发kimi Linear线性注意力架构,在长程任务效果上超越全注意力机制且速度更快 [54][55][64][66] - **阿里千问**:致力于打造通用智能体,在2025年重点提升模型的Reasoning能力、长上下文支持及多模态能力,其VL模型在保持语言智力不下降的同时,图像生成质量接近真人,并积极布局语音交互与编辑功能 [73][80][83][89][95][96] - **腾讯**:观察到toC与toB市场明显分化,以及垂直整合与模型应用分层两种模式的分化,认为在toB场景,最强的模型与稍弱的模型价值分化会越来越明显 [110][111] 市场分化与行业生态观察 - **toC与toB市场分化**:toC应用类似搜索引擎加强版,用户对智能提升感知不强;toB场景中,智能直接等同于生产力,用户愿意为最强模型支付高溢价,市场分化明显 [110] - **垂直整合与分层模式分化**:在toC场景,模型与产品强耦合的垂直整合模式成立;但在toB生产力场景,强大的基座模型与多样化的应用层产品开始分层,专业化趋势显现 [111][112] - **中美市场差异**:美国市场Coding消耗量巨大,而中国市场相对较小,显示两地市场机会与认知存在差异 [114] - **学术界与工业界的角色**:工业界在前沿狂奔,学术界需在模型进入稳态后跟上,研究如智能上限、资源分配、幻觉与资源的平衡等理论问题,孕育新的计算模式 [115][116][117]
姚顺雨对着唐杰杨植麟林俊旸贴大脸开讲!基模四杰中关村论英雄
新浪财经· 2026-01-10 22:39
清华大学AGI-Next前沿峰会核心观点 - 峰会由清华大学基础模型北京市重点实验室发起,汇集了智谱、Kimi、阿里等中国AI领域核心公司的领军人物,探讨了AGI发展的现状、挑战与未来方向 [1][3] - 与会专家普遍认为,大模型的发展正从“对话”范式转向“做事”范式,即从通用聊天能力转向解决具体任务、提升生产力的智能体 [4][18][19] - 中国在开源大模型领域已形成显著影响力,但在整体AI赛道上反超美国仍面临巨大挑战,需要关注技术创新与新范式探索 [4][28] 大模型技术发展路径与现状 - 大模型智能水平持续快速提升,发展轨迹类似人类成长:从2020年前后的简单问答,到2021-2022年的数学计算与基础推理,再到2023-2024年能处理研究生层级问题与真实世界编程任务 [8][9] - 模型能力正从知识记忆走向复杂推理,并在SWE-bench等真实环境评测中表现出可用性,代码能力已能实质性地辅助高级工程师 [8][17] - 当前的核心挑战是从规模扩展走向真正的泛化能力,并解决强化学习可验证场景逐渐耗尽的问题 [11][16] - 到2025年,模型的整体能力仍在快速提升 [10] 智谱AI(唐杰)的技术策略与展望 - 公司发展基于“像喝咖啡一样做研究”的理念,强调AGI需要长期专注与持续投入 [5][6][7] - 判断Chat对话范式已基本结束,下一步是“走向做事”,因此优先选择强化思维、结合编程与智能体的技术路径 [4][18][20] - 通过整合编码、智能体与推理能力,并利用可验证环境进行强化学习,显著提升了模型在真实任务中的稳定性,在SWE-bench等评测中取得领先成绩 [21][22][24] - 面对智能体大规模落地,公司采用API与GUI操作结合的混合方案,并引入交替训练机制以应对强化学习的风险与冷启动问题 [25][26][27] - 认为未来AGI的突破方向可能在于:原生多模态、记忆与持续学习、反思与自我认知能力 [31][34][36] - 提出参考人类双系统认知的AI结构:系统一(模式匹配)、系统二(复杂推理)和自学习模块,并通过数据规模、推理时间和自学习环境三个维度的扩展来提升智能 [37][40][42][43][44][45] - 指出Transformer架构存在计算复杂度高的问题,需探索新型架构以实现高效的知识压缩 [47][48] - 展望2026年将专注于区分已知与未知路径的扩展、推进全新模型架构、发展多模态感统能力,并判断2025年可能成为AI for Science的重要突破年份 [55] Kimi(杨植麟)的技术创新与核心理念 - 认为大模型发展的第一性原理是Scaling Law,即把能源转化为智能,Transformer因其在扩展律上更优的表现而成为主流架构 [56][58][59] - 提出评估模型架构的两个关键维度:Token效率(用更少的Token达到相同效果)和长上下文能力,两者的结合是实现优秀智能体的基础 [60][61][62][63] - 公司通过采用MUON二阶优化器,实现了2倍的Token效率提升,等效于用50%的数据达到相同的测试损失,或用相同数据获得更低的损失 [64][67] - 通过创新的kimi Linear线性注意力架构,在保持线性计算复杂度的同时,实现了在长短程任务上效果均优于全注意力机制,并在百万上下文长度下具有6到10倍的端到端速度优势 [65][73][74][75] - 认为做模型本质是在创造一种世界观和审美,智能具有不可交换性,不同模型会发展出不同的“品位” [4][77] - 公司开发的kimiK2是中国首个智能体模型,可完成两三百步的工具调用,在HLE评测中达到45%的准确率,并声称比OpenAI更高 [72] 阿里通义千问(林俊旸)的进展与方向 - 公司致力于开发通用智能体,训练范式已发生变化,不再完全依赖传统标注,而是通过解决推理和评估来驱动 [81] - 在文本模型上,Qwen3系列总体能力提升,重点增强了推理能力,并支持119种语言及方言,上下文长度已做到1M以上并内部实现数个M [88][89] - 在代码能力上,聚焦于具有生产力的软件工程任务,在SWE-bench评测中达到70分,在相关榜单中排名前列 [91][92][93] - 在多模态方面,视觉理解模型在保持语言智力不下降的前提下,提升了操作手机/电脑的能力,并致力于实现文本、视觉、音频的统一理解与生成 [85][94][95][104] - 图像生成模型进步显著,Qwen-Image系列在内部盲测中排名靠前,12月版本生成的图像已接近真人,并具备强大的图像编辑能力 [99][100][101] - 语音模型Omni能达到文本模型2.5的水平,支持声音定制 [102][103] - 下一代模型将采用新的架构,并探索通过环境反馈进行多轮强化学习,以实现长视野推理,最终让智能体走向数字世界和物理世界 [104][105][106] 行业路线分化与未来思考 - 行业出现明显分化:to C产品对极致智能的需求不强烈,更像搜索引擎加强版;to B市场则强烈追求最强模型,因为智能直接等同于生产力,导致强弱模型分化加剧 [4][113][114] - 在商业模式上,to C场景模型与产品垂直整合依然紧密;但在to B场景,模型层与应用层可能出现分层,强大的模型会被不同的应用层产品在各生产力环节中使用 [113][115] - 学术界与工业界需要协同,工业界在前沿狂奔,学术界应跟进解决基础理论问题,如智能上界、资源分配、幻觉与资源的平衡、持续学习中的噪声清理等 [119][120] - 自主学习的定义多样,它更关乎具体的数据和任务场景,而非单一方法论,目前已在特定场景中逐渐发生 [126][127][128]
唐杰、杨植麟、林俊旸、姚顺雨罕见同台,「基模四杰」开聊中国AGI
36氪· 2026-01-10 22:14
文章核心观点 - 2025年中国AI行业形成的最大共识是基础模型的能力高低决定未来多场竞争的输赢 闭门会四位主角的共同主题是稳固基模第一梯队地位同时让模型驱动业务发展 [5] - 中国大模型靠快节奏迭代和持续开源在国际上获得声量 但中美大模型差距可能并未缩小 因为美国有大量闭源模型未开源 [6] - 随着AGI探索范式变化 制定衡量模型智力的新标准非常重要 嘉宾共同看好的下一阶段方向是AI的自主学习 [6][7] AGI下一代路线与范式探索 - 后DeepSeek时代 对话范式探索基本结束 智谱押注了集推理、Agentic、Coding能力于一体的新范式 其GLM-4.5是成功成果 [6] - 对Scaling Law信徒而言 下一阶段Scaling仍是重点 但新变化是在架构、优化器、数据层面做技术改进 目的是让模型拥有更好的“Taste”以避免趋同 [6] - 驱动不同AI探索范式的核心是目标选择 追求智力顶峰还是注重落地 这决定训练策略是垂直整合还是分化训练 [7] - 未来To C和To B的分化会越来越明显 AGI的本质是服务真实的人类场景 [7] - To C场景下垂直整合成立 模型和产品必须强耦合迭代才能做出好体验 To B场景则相反 模型公司专注做强模型 应用公司追求用最强模型提升生产力 两者分化 [8][11][13] - 这种分化是自然发生的 公司没有基因之分 服务真实需求是关键 例如美国API消耗量中Coding占据绝对主导 [8][17] 模型智力衡量新标准 - 定义的AI智力水平是Token效率和长文本的结合 即在不同Context长度下模型优势有多大 [7] - 定义了衡量智力水平的新范式“智能效率” 用于衡量模型投入和智力收益的ROI 因为当前疯狂的RL和Scaling收益已大不如前 [7] - 在To B市场 强模型和弱模型的分化会越来越明显 用户愿意为最强模型支付溢价 例如一个模型200美元/月 次强的50美元/月 因为强模型能显著提升工作效率 [10][11] 大模型公司的战略选择与瓶颈 - 腾讯作为To C基因更强的公司 思考如何让大模型给用户提供更多价值 认为To C的瓶颈常在于额外的上下文和环境 而非更强的模型 [13][14][15] - 在中国做To B很难 很多做Coding Agent的公司选择出海 大公司的优势在于自身拥有多样化应用场景和生产力需求 能利用真实世界数据训练模型 而创业公司依赖数据厂商 多样性受限 [16] - 智谱经过思考 认为Chat的竞争自DeepSeek出现后已结束 因此决定将所有精力押注在Coding上 [23] - 预训练已过去三年 RL成为共识 硅谷正在讨论下一个新范式“自主学习” [24] 对“自主学习”范式的展望 - 自主学习是非常热门的词 但每个人定义不同 它并非方法论 而是数据或任务 其挑战因场景而异 [25][26] - 自主学习已在发生 例如ChatGPT利用用户数据弥合聊天风格 Claude项目95%的代码由Claude自己编写 [27] - 自主学习更像是渐变而非突变 2025年已看到信号 例如Cursor每几小时用最新用户数据学习 [28][30] - 实现自主学习的最大问题之一是想象力 即需要先构想出它实现后的具体形态和效果 [30] - OpenAI仍是全球最有可能诞生新范式的地方 尽管其创新基因可能因商业化被削弱 [30] - 另一个值得思考的方向是“测试时扩展” 即通过吐出更多Token变得更强 以及AI实现更强的主动性 由环境触发而非人类提示 但这引发了安全问题 [32] - 自动化AI研究员甚至不需要自主学习 未来AI训练AI可能很快实现 更大的技术挑战在于如何评估个性化等指标 [33][34] 对Agent发展的预期 - 2026年对Agent的一大预期是它能自动化人类一周到两周的工作量 而不再仅是工具 这可能是Agent创造经济价值的关键一年 [44] - 在To B方面 Agent正处在不断上升的曲线上 目前没有变慢趋势 模型智能越高 解决任务越多 带来的收入越大 [44] - 当前除了模型本身 还有两个瓶颈 一是环境和部署问题 现有模型若广泛部署可能带来10倍或100倍收益 对GDP产生5%-10%的影响 但目前影响远不到1% 二是教育问题 会用AI工具的人与不会用的人差距在拉大 [46][47] - Agent未来需要与真实物理世界交互 而不仅限于电脑环境 这需要三到五年时间与具身智能结合 [54][56] - 通用Agent的魅力在于解决长尾问题 头部问题易解 但解决用户寻遍各处都找不到的问题才是AI最大魅力 [57] - Agent发展有四个阶段 目前处于最初级阶段 目标和规划均由人定义 未来应由大模型内生定义 [60][61] - Agent未来的走势取决于其解决的事情是否有价值、成本有多大以及开发应用的速度 [63] 中国AI公司的机遇与挑战 - 中国团队在三年和五年后成为全球最领先AI公司的概率较高 因为一旦技术被证明可行 中国能快速复现并在局部做得更好 如制造业和电动车先例 [65] - 关键条件包括 能否突破光刻机等算力瓶颈 中国有电力优势和基础设施优势 但产能和软件生态是问题 以及能否发展出更成熟或更好的To B市场或参与国际商业竞争 因为美国支付意愿更强 文化更成熟 [65][66][67] - 主观上需要更多有创业或冒险精神的人去做前沿探索和范式突破 中国在商业、产业设计和工程上已比美国做得更好 但引领新范式是唯一待解决的问题 [68][69][70][71] - 中国研究文化更倾向于做安全、已被证明可行的事情 对刷榜或数字看得更重 需要时间积累文化底蕴并走出榜单束缚 坚持做正确且体验好的事情 [71][72][73] - 中美算力差距有1-2个数量级 美国将大量算力投入下一代研究 中国则捉襟见肘 大部分算力用于交付 这是历史遗留问题 [75] - 从软硬结合角度 中国有机会做出下一代模型和芯片 但需要更紧密的跨领域协作 [76] - 中国年轻一代冒险精神在变强 营商环境在改善 这有利于创新 但历史积淀原因导致中国公司成为最领先者的概率约为20% [77][78][80] - 回顾互联网发展 中国很快赶上并诞生了世界第一的应用 看好AI技术在To C领域百花齐放 To B领域也会很快跟上 [81][82] - 中国需要敢于冒险的聪明人、更好的创新环境以及从业者自身的坚持 [86][87]
智谱香港IPO拟发行逾3700万股 发行价116.2港元
搜狐财经· 2025-12-31 10:54
上市计划与监管进展 - 公司计划在香港发行37,419,500股H股,发行价为每股116.2港元,预计H股于明年1月8日开始交易 [1] - 中国证监会已核准公司不超过43,032,400股境外上市普通股在香港联合交易所挂牌,并同步推进境内未上市股份“全流通” [1] 市场定位与业务规模 - 公司披露招股书,明确赴港冲刺“全球大模型第一股” [3] - 截至9月30日,公司模型赋能全球12000家企业客户、逾8000万台终端用户设备及超4500万名开发者,是中国赋能终端设备最多的独立通用大模型厂商 [3] - 公司成立于2019年,由清华大学技术成果转化而来,是国内启动大模型研究的开拓者,也是国产大模型技术领军企业 [3] 财务表现与增长 - 公司2022年收入为5740万元人民币,2023年收入为1.245亿元人民币,2024年收入为3.124亿元人民币,年复合增长率约130% [3] - 公司2025年上半年收入为1.9亿元人民币,已连续三年实现翻倍增长 [3]
智谱IPO获备案,冲刺“全球大模型第一股”
搜狐财经· 2025-12-24 11:12
公司上市进程 - 中国证监会已就北京智谱华章科技股份有限公司境外发行上市及境内未上市股份“全流通”出具备案通知书 [1] - 公司计划发行不超过43,032,400股境外上市普通股并在香港联合交易所上市 [1] - 公司已于12月19日披露招股书,明确冲刺“全球大模型第一股” [1] - 公司正与MiniMax(稀宇科技)角逐,力争成为中国首家上市的AI模型开发商 [3] 财务表现 - 公司2022年收入为5740万元,2023年收入为1.245亿元,2024年收入为3.124亿元,三年复合增长率高达130% [1] - 2025年上半年收入为1.9亿元,实现连续三年翻倍增长 [1] - 报告期内,公司收入主要来自大模型相关业务 [1] 业务规模与市场地位 - 截至2025年9月30日,公司模型已赋能全球12,000家企业客户、超过8,000万台终端设备,并覆盖4,500万+开发者 [3] - 公司是中国赋能终端设备数量最多的独立通用大模型厂商 [3] - 公司是中国最大的独立大模型厂商之一 [1] 公司背景与融资情况 - 公司成立于2019年,源自清华大学科研成果转化,是国内最早布局大模型研发的企业之一 [3] - 公司成立6年已完成6轮融资,仅2025年就完成5轮,最新估值约400亿元 [3] 管理层观点 - 公司联合创始人兼CEO张鹏表示,中国AI第一股的称号理应属于公司,并形容当前阶段如同马拉松最后一公里需要加速冲刺 [3]
AI开源社区来了国家队!华为百度第一时间加入
量子位· 2025-05-09 10:04
央企牵头AI开源社区 - 中国电信天翼云牵头发起魔乐社区(Modelers.cn),提供AI工具、模型、数据托管及学习交流平台 [2][6] - 社区线下成立理事会,由14家单位组成,覆盖AI芯片、模型、数据、科研机构等全产业链环节 [3][7][8] - 理事会设立治理、建设、运营委员会及秘书处,并引入特别兴趣小组(SIG)机制和淘汰机制 [11][13][15] 社区资源与生态协同 - 提供9024个开源模型(含文本、图像、音频等多模态)和1120个数据集,均完成国产硬件适配 [18][19][21] - 联合算力成员提供免费国产算力资源,支持在线体验空间快速创建AI应用 [21][22] - 产学研联动案例:上海AI实验室贡献模型/数据,硅基智能通过社区弥补大模型短板并反馈数字人技术 [24][26][27] 差异化定位与行业痛点解决 - 现有平台(如GitHub、Hugging Face)存在开放性不足、工具适配局限及产业链协同缺失问题 [30][34][35] - 魔乐社区以中立公益原则整合异构算力/工具,通过社区协调解决版权争议和敏感数据开源困境 [43][40][41] - 目标构建开放协同的AI生态,加速国产技术落地,未来计划联合高校培养人才 [45][46][29]