Workflow
AGI
icon
搜索文档
东方证券:CES展中国人形机器人占主导地位 看好具备构建大脑能力的领跑公司及产业链
智通财经网· 2026-01-12 10:23
行业地位与市场格局 - 在近期CES展中,机器人获得重点关注,中国的人形机器人制造商占据主导地位,在38个人形机器人展位中,中国企业占据了21个,比例超过一半 [2] - 根据Omdia报告,2025年全球人形机器人总出货量增长4倍以上,其中中国厂商(智元、宇树、优必选、乐聚、众擎、傅利叶)合计市场份额超80% [2] - 从CES展会和2025年市场份额看,中国人形机器人的制造能力在全球处于绝对领先地位 [2] 核心叙事与投资逻辑演变 - 市场认为投资机会来自人形机器人量产加速,但鉴于中国制造能力已绝对领先,如果量产仅围绕功能简单的机器人,其对投资的影响会边际变弱 [3] - 具有AGI(通用人工智能)属性的叙事对投资的影响会边际变强 [3] - AGI有望在2026年加速,英伟达CEO黄仁勋在CES上多次强调“物理AI”,预言其“ChatGPT时刻即将到来”,并表示“具备人类级别技能的机器人将在今年出现” [3] - 根据Omdia报告,2025年FigureAI的人形机器人在全球市占率不到2%,低于2024年,但其估值在25年9月达390亿美元,远超排名靠前的中国公司,市值反差说明大脑(AI能力)的估值更高 [3] 政策导向与产业链投资机会 - 国家发改委近期提到要着力防范重复度高的产品“扎堆”上市等风险,并支持围绕“大小脑”模型协同、云侧与端侧算力适配等技术进行攻关 [4] - 看好具备构建大脑能力的领跑公司及产业链,投资机会主要集中于两类公司 [1][4] - 第一类是特斯拉核心产业链,特斯拉官宣在自研世界模型中训练Optimus [4] - 第二类是具有垂直场景的本体公司,场景应用有利于数据和模型的积累 [4] - 相关标的包括:拓普集团、三花智控、五洲新春、恒立液压、震裕科技、杭叉集团、安徽合力、杰克科技、永创智能、优必选 [4]
多模态大模型输给三岁宝宝?xbench x UniPat联合发布新评测集BabyVision
红杉汇· 2026-01-12 09:04
文章核心观点 - 红杉中国xbench与UniPat AI团队联合发布名为BabyVision的全新多模态理解评测集 旨在量化评估大模型的基础视觉原子能力 揭示其与人类在“看懂世界”上存在的巨大差距 [1] - 评测结果显示 当前顶尖多模态大模型的视觉理解能力普遍低于3岁儿童 表明模型存在“系统性缺基础视觉能力”的问题 而非单一缺陷 [2][4][13] - 视觉问题的核心挑战在于其“unspeakable”特性 即无法在不丢失信息的情况下被完整语言化 模型试图将视觉信息压缩为文本token会导致关键细节丢失 从而无法进行真正的视觉推理 [14][15] - 研究团队提出通过生成式视觉推理(如画图、描线)可能是补齐模型视觉短板的一个方向 并为此开发了BabyVision-Gen评测集进行探索 [26][27][28] - BabyVision的价值在于将复杂的“看懂世界”能力拆解为22个可测量、可诊断的原子视觉任务 为多模态大模型的未来发展提供了明确的迭代与改进方向 [9][32] 评测背景与设计理念 - 该评测属于红杉中国xbench双轨评估体系中AGI Tracking赛道下的多模态评估集 旨在追踪模型的AGI演进进程 [1] - 评测设计核心理念是量化那些“人类直觉就会、但构成智能地基”的视觉原子能力 这是具身智能走向现实世界的必修课 [9] - 为避免模型通过语言推理走捷径 评测严格控制语言依赖 题目要求简单 答案必须依靠视觉信息本身得出 [2] 评测数据集构建 - 研究团队参考儿童认知教材和视觉发育测验 梳理出4大类共22种基础视觉子任务 [9] - 通过逆向图像搜索和关键词搜索从互联网爬取约4000张候选图片 并严格筛选版权合规、不含大量文字或需文化常识的素材 [9] - 经过专业人员人工标注、设计问题与答案 并进行“双盲质检” 最终产出388道高质量视觉题目 [10] 视觉能力分类 - 视觉能力被提炼为四大核心类别:视觉模式识别(4个子任务)、精细辨别(8个子任务)、视觉追踪(5个子任务)、空间感知(5个子任务) [9][11] 评测结果分析 - 人类基线测试(16位至少本科背景者)在388道题上的准确率达到94.1% [13] - 闭源最强模型Gemini3‑Pro‑Preview的准确率为49.7% 是唯一稳定超过3岁儿童基线的模型 但距离6岁儿童仍差约20个百分点 [4][13] - 开源侧最强模型Qwen3VL‑235B‑Thinking整体准确率为22.2% 多数模型准确率在12–19%区间 [13] - 模型在四大类视觉能力上表现均落后 差距并非集中在单一类别 属于系统性缺陷 [13] - 在某些子任务上模型几乎“全员翻车” 例如Count 3D Blocks任务普遍表现偏低 [13] 模型面临的核心挑战 - **挑战1:无法处理“非语言细节”** 在拼图/补全等任务中 模型将形状用语言概括会抹平像素级的细微差异 导致选项在token空间里变得“几乎一样” [16][17] - **挑战2:视觉追踪能力薄弱** 在连线/轨迹题中 人类本能地沿线追踪 而模型将线翻译为离散的方位步骤 遇到交叉点容易“换轨”追错线 [8][20] - **挑战3:缺乏真正的空间想象** 在三维方块计数等任务中 人类在脑中构建3D结构 而模型缺少稳定的3D内部表征与变换能力 容易漏掉隐藏块或搞错投影关系 [21][23] - **挑战4:图形规律归纳困难** 在视觉模式归纳任务中 人类抽象的是关系映射与变换规则 而模型容易误读为表面属性的统计 导致迁移时产生幻觉规则 [24][26] 生成式视觉推理的探索 - 研究团队推出BabyVision‑Gen评测集 从原基准中标注出280道适合“生成式作答”的题目 要求模型输出图像或视频来表达解题过程或答案 [26][27] - 开发了自动评测工具 与人工评测的一致性达到96% [27] - 初步结论显示 生成式推理在视觉追踪、精细辨别等任务上出现了“更像人类”的行为(如画轨迹、做标注) 但整体仍缺乏稳定到达完全正确解的能力 [28] - 这表明将视觉推理“落地到视觉操作”可能是补齐模型视觉短板的一条潜在路径 [28] 评测的意义与行业影响 - 视觉能力是通用智能与具身智能走向现实世界的基础 很难想象视觉能力低于3岁孩子的机器人能在真实物理世界中可靠地帮助人类 [32] - BabyVision将“看懂世界”拆解为可测量、可诊断、可迭代的22个原子能力 明确了当前多模态大模型的差距所在 为行业下一步发展提供了引导 [32] - 展望2026年 世界模型与视觉多模态预计将迎来新一轮突破性进展 此次评测旨在迎接并参与新一轮技术突破的到来 [1]
700亿“全球大模型第一股”,IPO破局
搜狐财经· 2026-01-12 08:37
行业阶段与市场逻辑转变 - AI行业已进入兑现阶段 大模型行业淘汰赛即将拉开序幕 [1] - 行业逻辑将从对规模的考量转变为对盈利的考量 [1] - 头部企业加速IPO 智谱上市为行业提供了估值锚点和参考 行业投资将降温 资本考量从规模转向收入 [8] 公司概况与市场地位 - 智谱成立于2019年 是专注于基础模型研发的独立厂商 [3] - 凭借原创GLM预训练架构 构建了覆盖语言、代码、多模态及智能体的全栈模型矩阵 模型适配40余款国产芯片 [3] - 公司是国内在技术路线上少数能与全球顶尖大模型公司匹敌的公司 [3] - 公司自成立之初就瞄准AGI 体现了与竞争对手的差异性 [4] - 按2024年收入计算 智谱在中国独立通用大模型开发商中排名第一 在所有通用大模型开发商中排名第二 [4] 商业化与财务表现 - 智谱在2021年开始布局MaaS(模型即服务) 中国前十大互联网公司中有九家使用其GLM大模型 [5] - 智谱是唯一一家做到MaaS有规模收入的创业公司 [5] - 公司营收从2022年的5740万元增长至2024年的3.124亿元 年复合增长率达到130% [5] - 2025年上半年营收为1.9亿元 同比增长325% [5] - 公司归母净亏损从2022年的1.43亿元扩大至2024年的29.56亿元 2025年上半年净亏损为23.51亿元 [7] - 毛利率从2022年的54.6%波动至2025年上半年的50% 整体呈下降趋势 [7] - IPO前已完成8轮融资 累计融资规模超83亿元人民币 投资方包括美团、蚂蚁、阿里、腾讯、红杉中国、高瓴等 [7] 资本市场表现与机构观点 - 智谱于1月8日在港交所主板挂牌上市 上市当天涨幅为13% 1月9日单日涨幅超20% 市值接近700亿港元 [1] - 中信证券研报指出 智谱过去两年收入实现持续翻倍以上增长 2025年收入超1亿美元 [7] - 中信证券预计未来6年国内大语言模型市场规模或将实现同比20倍增长 企业级需求将主导千亿元机会 [7] - 中信证券看好智谱在相关市场的身位优势 预计其2025年、2026年、2027年营业收入分别为7.38亿元、16.04亿元、26.86亿元 [7]
马化腾把 AI交给了 27 岁的姚顺雨
搜狐财经· 2026-01-12 07:46
腾讯AI战略调整与人事任命 - 2025年末,27岁的前OpenAI核心研究员兼首席AI科学家姚顺雨被任命为腾讯首席AI科学家,统筹公司AI两大核心板块,此举被视为腾讯对深陷困境的AI业务进行彻底改革的战略宣言 [2] - 姚顺雨在2025年1月10日完成了空降腾讯后的首次公开发声 [2] 腾讯AI业务的历史困境 - 腾讯AI业务曾面临“联邦制”研发模式带来的严重内耗与资源浪费,TEG、CSIG、微信事业群(WXG)各自为战 [4] - 仅算力重复投入,每年就吞噬超过20亿元人民币的研发预算,且各部门模型标准不一,无法协同,AI业务成为集团的“财务包袱” [4] - 公司曾过于关注技术榜单排名,其混元模型虽在MMLU等榜单上追平GPT-4,但产品落地效果不佳 [5] - 旗下AI产品“元宝”的月活跃用户数长期徘徊在3000万,用户留存率低,核心原因是产品功能停留在“聊天炫技”,未能解决实际问题 [7] 组织架构与研发模式变革 - 姚顺雨上任后立即进行组织改革,身兼AI Infra部与大语言模型部负责人,打破事业部壁垒,并新成立AI Data部、数据计算平台部,搭建“数据-基建-算法”的闭环体系 [4] - 架构调整带来了研发效率的指数级提升,腾讯AI止住了“流血” [5] - 2025年第三季度,腾讯研发开支飙升至约228.22亿元人民币,同比增长27.57%,环比增长12.70%,持续加码的投入为技术革新提供了支撑 [15] 技术落地与商业化进展 - 混元大模型已深度渗透腾讯会议、微信、广告等内部超过900个业务场景,实现了从技术研发到业务赋能的关键衔接 [5] - 研发侧效率显著提升,超过90%的腾讯工程师正在使用内部代码助手CodeBuddy,AI代码采纳率高达50% [5] - 通过引入OpenAI的Tree of Thoughts等技术机制,应用于《王者荣耀》新皮肤设计,使设计通过率从45%飙升到72%,上线速度加快,带动周边营收增长15% [8] - 通过Reflexion自我改进系统优化“元宝”AI产品,使其“怒怼用户”的失控情况降到1%以下,并成功接入微信支付客服,打开了商业化大门 [8] - 到2025年底,腾讯AI相关业务收入占比从3%提升到5%,AI业务开始从“烧钱部门”转变为“增收引擎” [8] 微信生态的AI机遇与挑战 - 腾讯拥有微信13亿日活用户与超过900个业务场景的生态护城河,是AI Agent落地的“天然土壤” [8] - 视频号和小程序数据打通后,智能导购Agent使商品转化率暴涨2.3倍,展现出巨大潜力 [8] - 然而,在微信生态中实现AI变现面临三大挑战:需统一Agent接口标准,动微信底层架构的前期投入超过5亿元人民币;接口开放程度难以平衡,开放少则限制AI联动,开放多则可能冲击微信广告业务;管理层在AI生态长期收益与广告业务短期稳定之间面临抉择 [9][10][11][14] - 2025年第三季度,腾讯营销服务(广告)业务收入同比增长21%,达到362亿元人民币,是公司的核心“现金牛” [13] To B与To C业务的商业化难题 - 腾讯的企业级AI解决方案毛利率高达65%,但国内客户付费意愿低,存在谈单难、续单更难的问题 [14] - 在To C端,AI产品“元宝”主要依靠免费模式,其推出的“Agent任务中心”增值服务付费率不足2%,可持续的盈利模式尚未找到 [14] 行业视角与未来展望 - 行业观点认为,姚顺雨的加盟为腾讯带来了OpenAI级别的研发能力与认知,腾讯有可能成为继阿里、字节之后,在大模型领域进行大规模投入的互联网大厂 [16] - 全球AI竞争已进入深水区,OpenAI正向更高阶的AGI发起冲击,腾讯的AI自救战关乎其未来的“财务保卫战” [16] - 腾讯AI转型成功与否,仍需解决三个关键问题:如何激活微信生态而不损害广告基本盘;如何平衡To B和To C业务以实现收入稳定增长;如何将巨额算力投入转化为实实在在的现金流 [17]
五分钟掌握AGI Next峰会干货:中国AI大佬们的2026共识与交锋
36氪· 2026-01-12 07:41
文章核心观点 - 2026年AGI Next前沿峰会标志着AI行业从概念炒作回归技术本质,进入比拼核心技术与真实能力的深水区 [1][13] - 行业共识认为未来AI发展将呈现分化格局,模型与应用分层,并聚焦于让AI具备自主学习、决策与执行的下一代范式 [7][9] - 中国AI团队需正视与全球领先水平的差距,发挥应用场景优势,并可能通过分布式智能等差异化路径实现跨越发展 [5][12][17] 从技术路径到行业判断 学界泰斗的清醒认知 - 张钹院士指出当前大模型存在指称、因果等五大根本缺失,强调AGI需具备多模态理解、在线学习、可验证推理等五项可执行、可检验的关键能力 [2] - 杨强教授以“咖啡精神”隐喻,强调AGI研发需要长期专注投入,是一场长期战役而非短平快的投机 [2] 企业掌舵者的技术洞察 - 智谱AI唐杰判断,DeepSeek出现后Chat范式竞争基本结束,下一步是“走向做事”,未来核心是让模型具备自主Scaling能力,实现从“记忆知识”到“举一反三”的跨越 [3] - 月之暗面杨植麟认为,Scaling Law本质是把能源转化为智能以高效逼近智能上限,优秀的模型承载价值观与品味,需技术、数据与审美共进 [3] - 阿里林俊旸聚焦具身智能,提出打造“全能智能体”,并审慎判断未来3-5年内中国团队做到全球领先的概率约为20% [5] - 腾讯姚顺雨指出AI行业正经历分化,垂直整合与模型应用分层两种模式并行,模型公司未必适合做应用 [7] 揭秘AI行业真实生态 模型分化与未来格局 - 圆桌对话共识认为,未来不会只有“大一统”超级模型,将形成“顶尖模型服务核心需求,轻量化模型覆盖大众场景”的分层格局 [9] 下一代技术范式 - 尽管表述不同,嘉宾核心方向高度一致,均指向让AI摆脱对人类数据的过度依赖,具备自主学习、自主决策、自主执行的能力 [9] Agent商业落地 - 嘉宾达成务实共识,认为当前Agent处于“理想很丰满,现实很骨感”阶段,大规模落地面临场景适配、效果验证等难题,短期内更可能在编程、科研辅助等可验证性强的专业领域率先突破 [12] 中美AI竞争格局 - 观点认为中美各有优势:美国在基础研究和生态构建上领先,中国则在应用落地和场景创新上更快 [12] - 中美AI差距本质是“基础研究”与“应用创新”的路径差异 [12] 这场峰会告诉我们什么? 行业阶段转变 - 峰会聚焦“因果推理”、“自主学习”等底层问题,几乎无人提及参数规模,标志着AI行业告别野蛮生长上半场,进入比拼核心技术、真实能力的深水区 [13] 企业战略定位 - 并非所有公司都要做顶尖大模型,大企业可聚焦基础研究打造核心技术壁垒,中小企业应深耕垂直场景,在细分领域做到极致 [14] - 中小企业可重点布局分布式AI的边缘节点应用,打造轻量化、低成本的智能解决方案,避免与巨头正面竞争 [14] 技术渗透与影响 - AI正从实验室走进寻常百姓家,To B效率革命已发生,未来几年To C场景改变将加速,AI可能成为处理文档、规划旅行、辅助学习等的“全能助手” [16] - 分布式智能发展将使AI功能更温和深入地嵌入日常设备,通过节点协同提供无感服务 [16] 中国AI发展路径 - 中国AI突围路径不在于复刻国外“超级模型”,而在于发挥全球最大的用户群体和最丰富的应用场景优势 [17] - 可通过分布式架构的协同效应,利用海量边缘节点收集真实场景数据反哺核心模型迭代,形成“场景-数据-技术”的正向循环 [17]
陆家嘴财经早餐2026年1月12日星期一
Wind万得· 2026-01-12 06:42
宏观政策与监管动态 - 证监会表示将持续完善长钱长投制度环境,推动各类中长期资金提高入市规模比例,并增强对科技创新企业的服务,纵深推进科创板创业板改革[3] - 全国商务工作会议部署2026年八项重点工作,包括实施提振消费专项行动打造“购在中国”品牌、推动贸易创新发展打响“出口中国”品牌、塑造吸引外资新优势擦亮“投资中国”品牌[5] - 国家医保局将在2026年2月至12月于部分地区试点建设“个人医保云”,构建覆盖全人群、全周期、全场景的智慧医保管理新模式[5] - 海南省推行用地用林用海联合审批制度改革,旨在提高重大项目要素保障效率并降低企业办事成本[5] - 香港特区政府财政司司长表示,受金融市场畅旺带动印花税等收入增加,经营账目可提前恢复盈余,但资本账目因工务工程投入加大仍将录得赤字[6] 资本市场与A股动态 - 截至1月10日,2026年入市的公募资金预计超450亿元,包括新上市股票ETF规模63.45亿元及处于建仓期的主动含权基金规模近400亿元[8] - 2025年A股上市公司现金分红总额达2.55万亿元,创历史新高,是同期IPO和再融资规模的两倍[8] - 2026年开年外资加仓中国资产,摩根大通累计斥资超10亿港元增持多家港股公司[8] - 中信证券认为年初市场躁动源于踏空资金入场,主题板块及小票轮动的震荡上行格局可能延续至两会前后[7] - 2026年首只翻倍股志特新材在6个交易日内累计涨幅超170%,公司提示股价短期显著偏离基本面[9] - 2025年11-12月北交所密集审议25家企业,23家过会,审核发行节奏有望保持高速[10] - 多家公司发布重要公告,包括四创电子预计2025年净亏损2.65亿-3.4亿元,仙坛股份12月鸡肉销售收入同比增长9.41%[12] 行业趋势与科技创新 - 清华大学AGI-Next前沿峰会认为大模型竞争重心已从“Chat”转向“Agent”,行业预判2026年为商业价值落地元年,技术路径向可验证强化学习演进[3] - 卫星产业链表现亮眼,相关ETF近一月业绩涨幅超60%,总规模达237.6亿元,较2025年末接近翻倍[8] - 有色金属板块强势,多只有色主题ETF近一年涨幅超100%,公募基金正密集申报相关产品[9] - 光伏行业面临政策变局,增值税出口退税全面取消,行业自律约谈被叫停,行业估值体系面临重构[14] - 存储芯片价格暴涨,8GB DDR4内存价格一年涨超5倍,谷歌、微软等巨头被传紧急前往韩国争抢DRAM货源[14] - 特斯拉CEO马斯克预测通用人工智能将于2026年到来[15] - OpenAI计划在2026年发布更自然、实时的语音模型,目标是通过语音交互取代屏幕操作[17] - 谷歌“人工智能概览”因提供不实信息已移除部分内容[17] 金融与资管市场 - 基金销售费用新规明确,自2027年1月1日起基金管理人销售其管理的基金不得收取认(申)购费、销售服务费,销售服务费采取“先收后返”模式[13] - 2026年公募REITs市场迎来“开门红”,市场将呈现“存量盘活”与“高质量发展”并重态势[13] - 中资券商国际化进程加速,政策提出到2035年形成2至3家国际竞争力投资银行目标,2025年港股IPO募资总额超2800亿港元[9] - 2026年债券基金开局遇冷,约1600只产品未获正收益占比近五成,过去一年债券基金平均收益率为1.83%[21] 商品与外汇市场 - 2026年贵金属延续牛市但波动加剧,机构预计贵金属和工业金属价格仍有上涨空间[22] - 全球镍市场因印尼将镍矿开采配额从3.79亿吨降至2.5亿吨并计划对伴生钴征收1.5%-2%特许权税而剧烈波动[22] - 申万宏源首席经济学家表示,人民币已进入升值通道,未来几年可能每年升值2-3个百分点,十年总升值幅度或超30%[23] - 数字人民币APP上线“碳普惠”小程序,用户绿色低碳行为可获碳积分并兑换数字人民币,首批接入上海地铁等平台[23] 国际事件与地缘政治 - 美国总统特朗普呼吁将信用卡利率上限设为10%,而美国人信用卡债务规模当前约1.23万亿美元[18] - 美国或将于本周解除针对委内瑞拉的额外制裁以推动石油出口[19] - 存储巨头美光科技宣布将在美国纽约州兴建总投资约1000亿美元的巨型晶圆厂,计划打造全球最先进存储半导体制造中心[20] - 逾60位经济学家呼吁欧盟议员支持数字欧元项目,欧盟理事会支持欧洲央行计划在2029年前推出数字欧元[16]
顶级AI专家海淀“论道”:下一个范式是什么?
中国基金报· 2026-01-11 20:57
校对:乔伊 "后来,2025年初我们在想一个问题,也许在DeepSeek范式下,Chat时代的问题基本上已经解决,我们 做得再好,在Chat的问题上可能最后跟DeepSeek差不多,或许会再个性化一点,变成有情感的Chat,或 者再复杂一点。但总体来讲,该范式可能基本上快到头了,剩下更多的是工程和技术问题。" 唐杰称,"我们面临选择,AI下一步将朝哪个方向发展?当时的想法是,也许下一个范式是让每个人能 够用AI做一件事情,原来是Chat,现在是真的做事了,所以,新的范式开启了。" 唐杰还表示,多模态感统是今年的一个热点和重点,它是完成人机GUI交互+AI进入物理世界的关 键,"有了这个能力,AI才可以完成更复杂的长时任务,形成一个AI工种,变成和人一样;通过AI Robotics(机器人),AI才能实现具身智能,进入物理世界。" 【导读】唐杰:多模态感统将是今年的研究热点 中国基金报记者 卢鸰 1月10日下午,由清华大学基础模型北京市重点实验室发起的AGI-Next前沿峰会在北京海淀召开,智谱 创始人、清华大学教授唐杰,月之暗面创始人杨植麟、Qwen技术负责人林俊旸、腾讯"CEO/总裁办公 室"首席AI科学家 ...
唐杰、姚顺雨、杨植麟、林俊旸同台对话背后:5个2026年最重要的AI趋势观察
新浪财经· 2026-01-11 14:47
会议背景与核心观点 - 2025年1月10日,一场由中国大模型领域顶尖人物参与的对话在北京举行,核心议题是寻找中国AGI的突围路径[1][16] - 与会者平均年龄不到35岁,代表了中国AGI赛道的主要力量,包括智谱AI(唐杰)、腾讯(姚顺雨)、阿里巴巴(林俊旸)、月之暗面(杨植麟)等公司[1][2][15][16] - 会议核心共识是,“Chat(对话)范式”的竞争已结束,大模型的未来将向解决问题与自主学习的“深水区”演进[3][17] 下一代AGI范式:自主学习 - 阿里巴巴林俊旸认为,2026年最关键的赌注在于AI的主动性,未来范式应是环境直接Prompt模型,让AI自主思考决策,而非被动响应指令[3][17] - 腾讯姚顺雨同样认为AGI接下来最重要的点是自主学习,这是一个由数据和任务驱动的渐变过程[4][18] - 姚顺雨举例,目前Claude 95%的代码已由Claude自己编写,ChatGPT利用用户数据更新风格也是自主学习的早期信号[4][18] - 林俊旸指出主动学习范式存在风险,需为AI注入正确方向指引,类似培养小孩[3][17] - 姚顺雨认为,尽管OpenAI内部创新受损,但其仍是全球最可能引领下一代范式创新的公司[4][18] Scaling Law(规模法则)的演进与效率 - 智谱AI唐杰指出Scaling Law面临效率困境,从2025年初的10T数据到现在的30T甚至未来100T,单纯增加数据量的收益正在递减[5][19] - 唐杰提出新衡量标准“智能效率”,即用更少算力、更小规模获得同等或更高智能提升,并预判在持续学习、记忆及多模态领域会发生效率范式变革[5][19] - 月之暗面杨植麟认为Scaling Law远未到终点,但内涵已变,Scaling意味着在架构、优化器、数据层面做技术改进,以让模型拥有更好的“品味”,形成护城河[6][20] - 杨植麟指出,Token效率与长文本将是决定AI智力水平的核心因素[6][20] - 阿里巴巴林俊旸提出“测试时扩展”思路,认为o1系列证明可在推理时投入更多计算资源让模型变强,而非仅在训练阶段死磕数据量[6][20] 模型分化趋势 - 模型分化指大模型不再追求样样精通的通用工具,而是根据场景、产品形态和技术特性裂变成不同方向[7][21] - 腾讯姚顺雨认为,模型分化首先发生在商业逻辑上:在B端,智能直接等同于收益,美国用户愿为强模型支付数倍溢价,因其能将任务正确率从60%提升到90%[8][22] - 在C端,分化不在于模型变大,而在于上下文厚度,产品应通过垂直整合让模型感知用户实时环境,走“模型与产品强耦合”路线[8][22] - 阿里巴巴林俊旸认为,公司基因对生态位影响不大,To B和To C本质都是服务人类,他以Anthropic为例,指出其成功源于发现B端客户巨大的Token消耗场景[8][22] - 杨强院士提出,大模型进入稳态后,学术界应研究智能上限和幻觉的平衡,即投入资源与降低错误率之间的风险收益平衡,并建议借鉴人类睡眠机制清理学习噪音[9][23] AI Agent的发展前景与挑战 - 2026年市场对Agent价值爆发充满信心,但对其能否自动化1-2周工作存在不同看法[11][25] - 腾讯姚顺雨认为,To B的Agent正处在上升曲线,但在To C场景,DAU和模型智能常不相关甚至相反,瓶颈在于环境部署和用户教育[11][25] - 阿里巴巴林俊旸认为,通用Agent的魅力在于解决长尾问题,其未来应不止于电脑,需与真实物理世界交互,未来三到五年可能与具身智能结合[11][25] - 杨强院士将Agent发展分为四阶段,认为当前处于最初级阶段(人定义目标与规划),未来大模型将能利用人的过程数据,自行定义目标与规划[12][26] - 智谱AI唐杰认为Agent未来取决于三方面:真正帮助人的价值、成本、以及应用开发速度,行业目前更多在拼速度和时间[12][26] 中美AI竞争与中国的机会 - 智谱AI唐杰对中美差距持保守态度,认为中国模型在快速迭代,但差距可能未缩小,因美国有大量未开源闭源模型[12][26] - 腾讯姚顺雨认为,中国要成为引领者关键在算力突破、发展更成熟的To B市场、以及参与国际商业竞争[13][27] - 姚顺雨指出,美国在To B模型和应用上领先,因其支付意愿更强、文化更鼓励冒险和创新精神[13][27] - 姚顺雨强调,中国需解决能否引领新范式的问题,并走出“榜单的束缚”[13][27] - 阿里巴巴林俊旸同样强调了冒险和创新的重要性[14][28] - 唐杰指出中国市场的赶超机会在于:一群敢冒险的聪明人、更好的营商环境(包括政策)、以及个人的坚持精神[14][28]
AI圈四杰齐聚中关村,都聊了啥?
首席商业评论· 2026-01-11 12:57
文章核心观点 - 清华大学主办的AGI-Next前沿峰会汇集了中国AI领域的核心人物,包括智谱AI唐杰、Kimi杨植麟、阿里林俊旸和腾讯姚顺雨,共同探讨了通用人工智能(AGI)的当前进展与未来范式转变 [2][4][6] - 行业共识认为,以Chat为代表的对话模型时代已基本结束,AI发展的下一步核心是“从对话走向做事”,即让AI具备执行具体任务的能力,特别是通过智能体(Agent)和编码(Coding)来提升生产力 [6][12] - 中国在开源大模型领域已形成显著影响力,但在整体AI赛道上实现反超仍面临巨大挑战,需要持续在技术创新、新范式探索上投入 [6][19] 大模型发展轨迹与能力演进 - 大模型智能水平发展轨迹类似人类成长:2020年前后解决简单问答,2021-2022年进入数学计算和基础推理,2023-2024年走向复杂推理并能处理研究生层级问题,在真实世界编程任务中表现出可用性 [9] - 模型能力正从知识记忆走向复杂推理,并开始通过人类终极测试(HLE)等极高难度基准的检验,2025年模型整体能力仍在快速提升 [9][10][11] - 代码能力是典型进步领域:从2021年模型写十个程序才能跑通一个,发展到如今在复杂任务中往往可以一次性跑通,能实质性地辅助高级工程师 [12] 下一代范式:从Chat到Agent - DeepSeek的出现标志着Chat这一代问题基本被解决,优化空间正在迅速收敛,行业需要思考新范式 [12] - 新范式的核心是让AI完成具体事情,主要思路有两条:一是强化思考(Thinking)能力,结合编码与智能体;二是让模型更深度地与环境交互 [12] - 智谱AI优先选择了强化思考能力并引入编码场景的路径,通过整合编码、智能体和推理能力,并在真实环境中通过可验证强化学习(RLVR)来提升模型稳定性 [13][14] - 智能体(Agent)的基础能力可理解为编程,但更复杂的任务涉及几十步、上百步的异步超长链路,需要AI具备设备使用层面的能力 [15][16] 技术挑战与解决方案 - 可验证强化学习(RLVR)的挑战在于可验证场景(如数学、编程)正逐渐耗尽,需探索如何进入半自动或不可验证的任务空间 [11] - 训练体系挑战:强化学习任务种类多样,序列长度和时间尺度差异大,智谱AI开发了全异步强化学习训练框架以实现不同任务的并行运行与动态收敛 [15] - 冷启动问题:许多应用场景几乎没有现成数据,解决方案是采用API与GUI操作的混合方案,在真实环境中采集交互数据并进行全异步强化学习 [16] - 能力平衡问题:在9B规模模型上引入大量智能体数据后,其智能体能力显著增强,但部分通用语言和推理能力会下降,未来需解决在强化智能体能力的同时避免损害通用能力的问题 [18] 未来突破方向与行业思考 - 多模态:建立类似人类视觉、听觉、触觉的原生多模态“感统”机制是关键方向 [21] - 记忆与持续学习:如何将个体记忆扩展到群体级、文明级的记忆结构,并纳入模型可持续学习框架 [22] - 反思与自我认知能力:学界存在分歧,但值得探索,可能参考人类双系统认知(系统一与系统二)并引入“自学习”模块 [23] - 继续Scaling的三个维度:Scaling数据与模型规模以提升智能上限;Scaling推理以延长思考时间;Scaling自学习环境以增加与外界交互的机会 [24] - 需要寻找超越单纯Scaling的新范式,让机器能独立定义奖励函数、交互方法甚至训练任务来进行Scaling [24] 智谱AI(唐杰)的实践与展望 - 公司发展源于2019年在清华的成果转化,长期专注于两件事:早年做AMiner以及当前的大模型 [8] - 2025年是GLM模型的开源年,从1月到12月陆续开源了多条模型线,涵盖语言模型、智能体及多模态模型 [19] - 在Artificial Analysis榜单上,前五名中的蓝色模型几乎全部来自中国,显示中国在开源大模型领域的影响力 [19] - 2026年及以后的三个重点方向:继续Scaling但需区分已知路径与探索未知新范式;推进全新模型架构探索以解决超长上下文、高效知识压缩等问题;将多模态感统作为重点方向,以执行长链路、长时效的真实任务 [27] - 判断2025年很可能成为AI for Science的重要突破年份 [28] Kimi(杨植麟)的技术路径与世界观 - 大模型发展的第一性原理是Scaling Law,即把能源转化为智能,拥有更多算力、数据、参数可使模型损失(loss)线性下降 [30][32] - Transformer成为主流架构的核心原因是在Scaling Law上表现优于LSTM,能用更少的FLOPs或参数获得更好的Scaling效果 [33] - 优化围绕两个核心维度:Token效率(用尽可能少的Token获得相同效果)和长上下文(Long Context)能力,两者结合可实现优秀的智能体智能 [35][36] - 公司采用了MUON优化器(一种二阶优化器),相比传统Adam优化器能带来2倍的Token效率提升,相当于用50%的数据达到相同的测试损失,或用相同数据获得更低的损失 [36][38] - 最新研究的kimi Linear架构是一种新的线性注意力机制,旨在长程任务上效果优于全注意力机制,同时端到端速度有显著优势(如100万上下文下快6到10倍) [44][45] - 做模型的本质是在创造一种世界观,追求智能的“品位”(Taste),智能具有不可交换性,不同领域产生的智能不同,因此模型不会趋同,存在指数级的Taste空间 [47] 阿里千问(林俊旸)的进展与多模态探索 - 公司目标从通用模型(Generalist model)转向通用智能体(Generalist Agent),强调AI应像人一样自主使用工具 [53] - 2025年文本模型(Qwen3系列)的主要特点是总体能力提升,特别是推理能力增强,并支持119种语言及方言 [58][59] - 在编码(Coding)能力上,重点从解竞赛题转向软件工程,关注在真实环境中完成多轮交互的复杂任务,在SWE-bench等基准上取得高分(如70分) [61][62][64] - 坚信智能体天然应该是多模态的,致力于构建统一理解与生成的多模态基础模型 [55][56] - 在视觉语言模型上取得进展,使模型在拥有视觉理解能力的同时,语言智力不降低,与其235B纯文本模型能力持平 [65] - 在图像生成方面,从2025年8月到12月,生成图像的真实感显著提升,从“AI感重”到“接近真人”,并具备准确的图像编辑能力 [68][70] - 在语音模型上,开发了能听能说的Omni模型,其文本能力可达Qwen2.5水平,语音能力对标Qwen2.5 Pro水平 [71] - 未来方向包括构建全模态模型(理解并生成文本、视觉、音频),以及利用环境反馈进行多轮强化学习以实现长视野推理 [72][73][74] 行业路线分化观察 - 观察到to C和to B市场发生明显分化:对to C而言,大部分人大部分时候不需要用到那么强的智能,更多是搜索引擎的加强版;对to B而言,智能越高代表生产力越高,价值越大,用户愿意为最强模型支付溢价 [82][83] - 观察到垂直整合与模型应用分层出现分化:在to C应用上,模型与产品强耦合的垂直整合依然成立;但在to B场景,趋势似乎是模型越来越强,同时有许多应用层产品利用这些模型服务于不同生产力环节 [84] - 大公司做编码智能体的一个潜在优势是能利用自身庞大的内部应用场景和真实世界数据来改进模型,这不同于依赖有限标注商的创业公司 [85][86] - 中美市场存在差异:在美国,编码消耗量非常大;而在中国,这一现象尚不明显 [87] - 学术界与工业界存在分化:工业界领头狂奔,学术界需要跟上,解决工业界未及深入的理论问题,如智能上界、资源分配、持续学习中的噪音清理(类似人类睡眠机制)等 [88][89] - 对话模型替代搜索的战役在DeepSeek出现后已基本结束,行业需要寻找下一战,即让AI真正做事 [91] 关于自主学习(Self-Learning) - 自主学习是当前热门共识,但每个人对其定义和看法不同,它更关乎在何种场景下基于何种奖励函数执行何种任务,而非单一方法论 [93] - 自主学习已在多种场景下发生:例如ChatGPT利用用户数据弥合聊天风格,Claude编写自身项目95%的代码以帮助自己变得更好 [94] - 当前AI系统通常由模型和如何使用模型的代码库两部分组成,自主学习正在这些特定场景下渐变式发生,2025年已能看到信号,例如Cursor每几个小时就用最新用户数据学习 [94][95]
唐杰、杨植麟、姚顺雨、林俊旸罕见同台分享,这3个小时的信息密度实在太高了。
创业邦· 2026-01-11 11:22
文章核心观点 - 文章记录了AGI-NEXT活动中多位中国AI行业领袖的圆桌讨论,核心观点是:AI行业正从“聊天”范式转向“行动”范式,并出现明显的市场与技术分化,未来竞争的关键在于模型的“品味”与价值观注入,而非单一能力的比拼 [16][17][20][21] - 与会嘉宾普遍认为,下一阶段的竞争焦点是Agent(智能体)和自主学习,中国AI公司在工程实现和局部创新上具备优势,但要在全球引领新范式,仍需在基础算力、研究文化和冒险精神上取得突破 [17][42][71][73][76] 行业分化趋势 - **To C与To B市场明显分化**:To C产品(如ChatGPT)对普通用户而言体验变化不大,更多是搜索引擎的加强版;而To B市场对智能高度敏感,生产力提升与模型能力直接挂钩,用户愿意为最强模型支付高溢价(例如200美元/月 vs 20-50美元/月) [31][32][33] - **垂直整合与分层路线出现分化**:在To C场景,模型与产品强耦合的垂直整合模式依然成立(如ChatGPT、豆包);但在To B生产力场景,趋势是强大的基座模型与多样化的应用层产品分离,模型层与应用层所需能力不同 [34] - **中美市场应用重点不同**:美国市场Coding(编程)需求消耗量巨大,几乎全是Coding;而中国市场Coding消耗量相对较小,这导致自然的市场分化 [37][38] 技术范式与未来展望 - **当前范式收益接近瓶颈**:预训练走了3年,收益已达七八成;强化学习成为共识,做到了四五十的空间;后续增长需要依赖数据和环境 [43] - **“自主学习”是热门方向但定义多元**:它并非单一方法论,而是依赖于具体场景和奖励函数,例如聊天个性化、代码熟悉度提升、科学探索等,且该趋势已在发生(如Claude Code项目95%的代码由AI编写) [43][44] - **新范式可能在2026年出现**:有观点认为,当Scaling(规模扩展)的收益效率遇到瓶颈时(例如数据从10TB扩展到100TB但收益很小),追求“智能效率”的新范式就会出现,学术界与工业界的资源差距缩小(从万倍差缩小到十倍差)将助推创新 [56][57][58] - **联邦学习与协作模式受关注**:在医疗、金融等隐私要求高的领域,通用大模型与本地领域专家模型通过联邦学习等方式进行协作,成为一种重要趋势 [53][55] Agent(智能体)的发展战略 - **Agent是下一仗的核心**:行业共识是让AI从聊天转向“做事情”,Agent的本质被视为一个搜索问题 [17][18] - **To B Agent处于上升曲线**:其发展逻辑清晰,模型越智能,解决的任务越多,带来的收益就越大,目前没有放缓趋势 [60][61][62] - **环境与部署是关键瓶颈**:即使模型能力停止进步,将现有模型更好地部署到各行业,也能带来10倍或100倍的收益,对GDP产生5%-10%的影响,但目前影响不足1% [62] - **Agent的四个发展阶段**:从目标与规划均由人定义,最终发展到目标与规划均由大模型内生定义,目前处于非常初级的阶段 [68] - **通用Agent的机会**:解决长尾需求是AI的魅力所在,但通用Agent的竞争对创业者和模型公司各有机会,取决于能否比模型公司“套壳”做得更好,或模型公司能否实现“模型即产品” [65] 中国AI公司的机遇与挑战 - **成为全球领先的概率**:嘉宾对此看法不一,有观点表示乐观,认为概率很高;也有观点给出具体数字,认为3-5年后中国公司成为全球最领先的AI公司的概率约为20% [71][77][79] - **关键挑战一:算力与基础设施**:光刻机突破、算力瓶颈、软件生态是主要客观制约因素,中国虽有电力和基础设施优势,但算力规模与美国有1-2个数量级差距,且大量算力用于交付而非前沿研究 [72][76] - **关键挑战二:研究文化与冒险精神**:中国团队更倾向于做已被证明可行的“安全”事情,对刷榜和数字更看重;需要培养更多敢于进行前沿探索和范式突破的冒险精神,这需要文化积累和时间沉淀 [73][74][75][77] - **关键优势与机会**:中国在工程实现、局部优化、产业落地方面能力强,一旦技术被证明,能快速复现并做得更好;年轻一代(90后、00后)冒险精神更强;在To C市场有望百花齐放 [71][77][80][83] - **必要的环境改善**:需要改善营商环境,让顶尖人才有更多时间投入创新而非交付;需要更多资源(资金、算力)投入到AGI行业,支持年轻研究员 [83][85]