自主学习
搜索文档
姚顺雨林俊旸杨植麟齐聚,锐评大模型创业与下一代技术范式
第一财经· 2026-01-10 22:21
下一代AI技术范式 - 行业专家普遍认为,大模型发展面临缩放定律瓶颈,下一代技术范式成为焦点,其中“自主学习”是热门概念,指模型能自主生成学习信号、闭环迭代优化以持续进化[3] - 腾讯首席AI科学家姚顺雨指出,自主学习已在实际发生,但高度依赖具体数据与任务,是场景化实践,其范式迭代目前是渐变而非突变,例如Claude已能转型自身项目95%的代码以实现自我改进[3] - 阿里巴巴Qwen技术负责人林俊旸认为,当前强化学习范式仍处早期,下一代范式核心在于“自主进化”与“主动性”,但主动性会引发新的AI安全问题,需为AI注入正确价值观与约束[4] - Kimi创始人杨植麟透露,团队在探索下一代模型,最重要改进是线性注意力机制,旨在长程任务上超越全注意力机制[4] - 智谱创始人唐杰预测2026年将发生重大范式革新,包括持续学习、记忆和多模态,因学术界算力环境改善,与工业界算力差距已缩小至约10倍,具备孵化颠覆性技术的土壤[4] 范式创新的引领者 - 姚顺雨表示,尽管OpenAI经历商业化变化后创新基因被削弱,但其仍是最有可能率先诞生新范式的地方[4] - 关于三至五年后全球领先AI公司出自中国团队的概率,姚顺雨认为概率挺高,因中国具备快速复现与局部优化能力,关键取决于光刻机能否突破,中国市场有电力与基础设施优势,主要瓶颈在产能与软件生态[5] - 姚顺雨指出,中国需要培养更成熟的TO B市场或参与国际竞争,且国内环境对刷榜或数字看得更重,而像DeepSeek更注重做正确的事,Anthropic Claude在编程领域虽非榜单最高但被行业公认最好[5]
唐杰、杨植麟、林俊旸、姚顺雨罕见同台,「基模四杰」开聊中国AGI
36氪· 2026-01-10 22:14
文章核心观点 - 2025年中国AI行业形成的最大共识是基础模型的能力高低决定未来多场竞争的输赢 闭门会四位主角的共同主题是稳固基模第一梯队地位同时让模型驱动业务发展 [5] - 中国大模型靠快节奏迭代和持续开源在国际上获得声量 但中美大模型差距可能并未缩小 因为美国有大量闭源模型未开源 [6] - 随着AGI探索范式变化 制定衡量模型智力的新标准非常重要 嘉宾共同看好的下一阶段方向是AI的自主学习 [6][7] AGI下一代路线与范式探索 - 后DeepSeek时代 对话范式探索基本结束 智谱押注了集推理、Agentic、Coding能力于一体的新范式 其GLM-4.5是成功成果 [6] - 对Scaling Law信徒而言 下一阶段Scaling仍是重点 但新变化是在架构、优化器、数据层面做技术改进 目的是让模型拥有更好的“Taste”以避免趋同 [6] - 驱动不同AI探索范式的核心是目标选择 追求智力顶峰还是注重落地 这决定训练策略是垂直整合还是分化训练 [7] - 未来To C和To B的分化会越来越明显 AGI的本质是服务真实的人类场景 [7] - To C场景下垂直整合成立 模型和产品必须强耦合迭代才能做出好体验 To B场景则相反 模型公司专注做强模型 应用公司追求用最强模型提升生产力 两者分化 [8][11][13] - 这种分化是自然发生的 公司没有基因之分 服务真实需求是关键 例如美国API消耗量中Coding占据绝对主导 [8][17] 模型智力衡量新标准 - 定义的AI智力水平是Token效率和长文本的结合 即在不同Context长度下模型优势有多大 [7] - 定义了衡量智力水平的新范式“智能效率” 用于衡量模型投入和智力收益的ROI 因为当前疯狂的RL和Scaling收益已大不如前 [7] - 在To B市场 强模型和弱模型的分化会越来越明显 用户愿意为最强模型支付溢价 例如一个模型200美元/月 次强的50美元/月 因为强模型能显著提升工作效率 [10][11] 大模型公司的战略选择与瓶颈 - 腾讯作为To C基因更强的公司 思考如何让大模型给用户提供更多价值 认为To C的瓶颈常在于额外的上下文和环境 而非更强的模型 [13][14][15] - 在中国做To B很难 很多做Coding Agent的公司选择出海 大公司的优势在于自身拥有多样化应用场景和生产力需求 能利用真实世界数据训练模型 而创业公司依赖数据厂商 多样性受限 [16] - 智谱经过思考 认为Chat的竞争自DeepSeek出现后已结束 因此决定将所有精力押注在Coding上 [23] - 预训练已过去三年 RL成为共识 硅谷正在讨论下一个新范式“自主学习” [24] 对“自主学习”范式的展望 - 自主学习是非常热门的词 但每个人定义不同 它并非方法论 而是数据或任务 其挑战因场景而异 [25][26] - 自主学习已在发生 例如ChatGPT利用用户数据弥合聊天风格 Claude项目95%的代码由Claude自己编写 [27] - 自主学习更像是渐变而非突变 2025年已看到信号 例如Cursor每几小时用最新用户数据学习 [28][30] - 实现自主学习的最大问题之一是想象力 即需要先构想出它实现后的具体形态和效果 [30] - OpenAI仍是全球最有可能诞生新范式的地方 尽管其创新基因可能因商业化被削弱 [30] - 另一个值得思考的方向是“测试时扩展” 即通过吐出更多Token变得更强 以及AI实现更强的主动性 由环境触发而非人类提示 但这引发了安全问题 [32] - 自动化AI研究员甚至不需要自主学习 未来AI训练AI可能很快实现 更大的技术挑战在于如何评估个性化等指标 [33][34] 对Agent发展的预期 - 2026年对Agent的一大预期是它能自动化人类一周到两周的工作量 而不再仅是工具 这可能是Agent创造经济价值的关键一年 [44] - 在To B方面 Agent正处在不断上升的曲线上 目前没有变慢趋势 模型智能越高 解决任务越多 带来的收入越大 [44] - 当前除了模型本身 还有两个瓶颈 一是环境和部署问题 现有模型若广泛部署可能带来10倍或100倍收益 对GDP产生5%-10%的影响 但目前影响远不到1% 二是教育问题 会用AI工具的人与不会用的人差距在拉大 [46][47] - Agent未来需要与真实物理世界交互 而不仅限于电脑环境 这需要三到五年时间与具身智能结合 [54][56] - 通用Agent的魅力在于解决长尾问题 头部问题易解 但解决用户寻遍各处都找不到的问题才是AI最大魅力 [57] - Agent发展有四个阶段 目前处于最初级阶段 目标和规划均由人定义 未来应由大模型内生定义 [60][61] - Agent未来的走势取决于其解决的事情是否有价值、成本有多大以及开发应用的速度 [63] 中国AI公司的机遇与挑战 - 中国团队在三年和五年后成为全球最领先AI公司的概率较高 因为一旦技术被证明可行 中国能快速复现并在局部做得更好 如制造业和电动车先例 [65] - 关键条件包括 能否突破光刻机等算力瓶颈 中国有电力优势和基础设施优势 但产能和软件生态是问题 以及能否发展出更成熟或更好的To B市场或参与国际商业竞争 因为美国支付意愿更强 文化更成熟 [65][66][67] - 主观上需要更多有创业或冒险精神的人去做前沿探索和范式突破 中国在商业、产业设计和工程上已比美国做得更好 但引领新范式是唯一待解决的问题 [68][69][70][71] - 中国研究文化更倾向于做安全、已被证明可行的事情 对刷榜或数字看得更重 需要时间积累文化底蕴并走出榜单束缚 坚持做正确且体验好的事情 [71][72][73] - 中美算力差距有1-2个数量级 美国将大量算力投入下一代研究 中国则捉襟见肘 大部分算力用于交付 这是历史遗留问题 [75] - 从软硬结合角度 中国有机会做出下一代模型和芯片 但需要更紧密的跨领域协作 [76] - 中国年轻一代冒险精神在变强 营商环境在改善 这有利于创新 但历史积淀原因导致中国公司成为最领先者的概率约为20% [77][78][80] - 回顾互联网发展 中国很快赶上并诞生了世界第一的应用 看好AI技术在To C领域百花齐放 To B领域也会很快跟上 [81][82] - 中国需要敢于冒险的聪明人、更好的创新环境以及从业者自身的坚持 [86][87]
姚顺雨林俊旸杨植麟齐聚 锐评大模型创业与下一代技术范式
第一财经· 2026-01-10 22:06
下一代AI技术范式 - 行业共识认为下一代技术范式是“自主学习”,即大模型通过自主生成学习信号、闭环迭代优化实现持续进化,以摆脱对人工标注与离线预训练的强依赖 [1] - 自主学习并非通用方法论,而是高度依赖于具体“数据与任务”的场景化实践 [1] - 自主学习已在实践中发生,例如Claude模型能够转型自身项目95%的代码以帮助自身变得更好,但目前范式迭代更接近渐变而非突变 [1] 对范式创新引领者的看法 - 尽管OpenAI经历了商业化等变化,创新基因被削弱,但仍被视为最有可能诞生新范式的地方 [2] - 强化学习范式尚处早期,潜力远未被充分挖掘,下一代范式的核心在于“自主进化”与“主动性” [2] - 赋予AI主动性将引发新的安全问题,即AI可能基于自主意图采取现实行动,因此需要为其注入正确的价值观与约束 [2] 具体技术探索方向 - Kimi团队在探索下一代模型时,最重要的一项改进是线性注意力机制,尝试在长程任务上打败全注意力机制 [2] - 预测2026年将发生非常大的范式革新,持续学习、记忆、多模态都有可能发生 [2] - 过去工业界凭借万倍于学术界的算力优势主导发展,如今高校算力环境改善,尽管尚存约10倍的算力差距,但学术界已具备孵化颠覆性技术的土壤 [2] 对中国AI发展前景与挑战的评估 - 三至五年后,全球最领先的AI公司是中国团队的概率挺高,因为技术一旦被发现,在中国能够很快复现并在很多局部做得更好 [3] - 中国市场具备电力优势、基础设施优势,主要瓶颈在于芯片产能与软件生态,关键看中国光刻机能否实现突破 [3] - 中国需要培养更成熟的TO B市场,或尝试到国际商业环境中竞争,目前敢于突破新范式或做非常冒险事情的人可能还不够多,受经济环境、商业环境及文化等因素影响 [3] - 国内对刷榜或数字看得更重,相较而言,DeepSeek更注重“什么是正确的事”,而行业公认Anthropic Claude模型在编程领域是最好的,尽管其榜单排行不是最高 [3]
姚顺雨林俊旸杨植麟齐聚,锐评大模型创业与下一代技术范式
第一财经· 2026-01-10 22:03
下一代AI技术范式 - 行业共识认为下一代技术范式是自主学习 即大模型摆脱对人工标注与离线预训练的强依赖 通过自主生成学习信号和闭环迭代优化实现持续进化[2] - 自主学习并非通用方法论 而是高度依赖于具体数据与任务场景的实践 探索新科学或进化到专业领域也被视为一种自主学习[2] - 行业认为自主学习的范式迭代目前是渐变而非突变 该过程已经发生但受效率等因素限制仍存在各种问题[2] 对范式创新的看法与探索 - 行业观点认为OpenAI虽然创新基因被削弱 但仍是最有可能率先诞生新范式的地方[3] - 强化学习范式尚处早期 潜力远未被充分挖掘 下一代范式的核心在于自主进化与主动性[3] - 赋予AI主动性将引发新的安全问题 必须同时注入正确的价值观与约束[3] - Kimi团队在探索下一代模型时 最重要的一项改进是尝试在线性注意力机制上打败全注意力机制以应对长程任务[3] 未来技术发展与行业格局 - 预测2026年将发生非常大的范式革新 持续学习 记忆和多模态都有可能发生[4] - 过去工业界凭借万倍于学术界的算力优势主导发展 如今局面已显著改变 高校算力环境改善 尽管尚存约10倍的算力差距 但学术界已具备孵化颠覆性技术的土壤[4] - 对于三至五年后全球最领先的AI公司是中国团队的概率 行业观点认为概率挺高 因为中国具备快速复现并在局部做得更好的能力 关键取决于光刻机能否实现突破[4] - 中国市场具备电力优势和基础设施优势 主要瓶颈是产能与软件生态 其次需要培养更成熟的TO B市场或尝试国际竞争[4] - 行业指出中国想要突破新范式或做非常冒险事情的人可能还不够多 这受经济环境 商业环境和文化等因素影响[4] - 国内对刷榜或数字看得更重 相较而言 DeepSeek更注重什么是正确的事和用户体验 Anthropic Claude模型在编程领域的榜单排行不是最高 但行业公认其模型是最好的[4]
唐杰、杨植麟、姚顺雨、林俊旸罕见同台分享,这3个小时的信息密度实在太高了。
数字生命卡兹克· 2026-01-10 20:37
文章核心观点 - 多位中国AI行业领军人物在AGI-NEXT会议上探讨了行业发展趋势,核心观点认为Chat聊天范式竞争已结束,下一阶段竞争焦点转向Action(执行任务)和Agent(智能体)[6] - 行业将出现明显分化,包括To C与To B市场的分化,以及垂直整合与模型应用分层路径的分化[12] - 对下一代技术范式(如自主学习)持乐观态度,并认为2025-2026年可能出现关键信号[21][23][28] - 智能体(Agent)在2026年有望创造显著经济价值,能够处理更长时间跨度的任务[32] - 中国AI公司在未来3-5年有成为全球领先者的机会,但需克服算力、市场环境和文化等挑战[39][40][41][45][46] 行业分化趋势 - **To C与To B市场分化明显**:To C产品(如ChatGPT)对大部分用户而言是搜索引擎的加强版,用户感受变化不大;而To B市场对智能水平高度敏感,智能越高代表生产力越高,用户愿意为最强模型支付溢价(例如200美元/月 vs 50或20美元/月的次优模型)[13][14] - **To B市场呈现“赢家通吃”趋势**:最强的模型与稍弱模型之间的分化会越来越明显,因为用户无法预知次优模型在哪些任务上会出错,需要额外精力监控[15] - **技术路径出现分化**:垂直整合路线(模型与产品强耦合)在To C领域(如ChatGPT、豆包)依然成立;但在To B领域,趋势似乎是模型层与应用层分离,强大的模型被不同的应用用于各种生产力环节[15] 下一代技术范式展望 - **自主学习是热门方向但定义多样**:硅谷已形成共识,但具体指代的任务场景各异,例如聊天个性化、代码环境适应、探索新科学领域等[21] - **自主学习已在发生**:例如ChatGPT利用用户数据优化聊天风格,Claude Code项目95%的代码由Claude自身编写以帮助其变得更好[22] - **范式突破可能发生在2025-2026年**:例如Cursor等公司已开始每几小时用最新用户数据训练模型,被视为早期信号[23] - **学术界与工业界将协同创新**:随着学校算力资源增加(尽管与工业界仍有10倍差距),学术界具备创新基因,将研究工业界未及解决的问题,如智能上界、资源分配、幻觉与资源的平衡(类似经济学中的风险收益平衡)等[18][19][28] - **效率瓶颈驱动创新**:大模型投入巨大但效率不高,继续Scaling的收益递减。未来需要定义“智能效率”,即用更少投入获得同等智能增量,这将成为范式创新的驱动力[29][30] 智能体(Agent)发展战略 - **To B Agent价值明确且处于上升曲线**:其价值与模型智能水平直接正相关,模型越智能,解决任务越多,带来的收益越大[32][33] - **当前瓶颈在于部署与教育**:即使模型停止进步,将现有模型更好部署到各公司也能带来10倍或100倍的收益,对GDP产生5%-10%的影响(目前影响不足1%)。同时,教育用户使用工具至关重要[34] - **Agent进化方向是更长的任务时长与主动性**:期待2026年Agent能处理人类1-2周工作量的任务流。更高级的Agent应具备自主进化和主动思考能力,但这引发了安全问题[25][32][35] - **通用Agent的机会存在于长尾需求**:解决广泛、分散的长尾问题是AI的魅力所在,也是挑战。模型公司凭借算力和数据可能快速解决部分问题,但套壳应用若做得更好也有机会[36][37] - **Agent发展有四个阶段**:从目标与规划皆由人定义,最终发展到目标与规划皆由大模型内生定义[37] 中国AI公司的机遇与挑战 - **成为全球领先者的概率与条件**:有嘉宾认为概率很高,也有嘉宾给出20%的乐观估计[39][47]。关键条件包括:突破算力瓶颈(如光刻机)、发展更成熟的To B市场或参与国际竞争、以及培养更多具有冒险精神和前沿探索意愿的人才[40][41][46] - **中美研究文化差异**:中国团队更倾向于做已被证明可行的、确定性高的事情(如预训练),对刷榜和数字指标看得较重。需要积累文化底蕴,并敢于坚持自己认为正确的方向,而非仅受榜单束缚[43][44] - **算力分配制约创新**:美国公司将大量计算资源投入下一代研究,而中国公司的大量算力被交付任务占据,用于前沿探索的资源相对捉襟见肘[45] - **软硬结合与冒险精神**:存在通过模型与芯片协同设计实现创新的机会。年轻一代(90后、00后)冒险精神增强,营商环境的改善有助于创新[46][49] - **历史借鉴与未来信心**:回顾互联网发展,中国在应用层面实现了赶超。在AI领域,To C应用可能百花齐放,To B解决方案也将跟进,关键在于创造让聪明人敢于冒险的环境并坚持到底[48][49][50]
AI浪潮下,10年后的顶尖高校拼什么?丨GAIR 2025
雷峰网· 2025-12-19 08:28
文章核心观点 - 在AI时代,中国顶尖大学与海外顶尖大学已处于同一起跑线,教育竞争格局正在重塑 [11][13][15] - 高等教育的核心使命是培养“真人、善人、美人”,人文素养与数学、母语能力等基础学科比热门技术学科更为重要 [6][30][31] - AI正在推动教育民主化与自主学习,大学需改革课程体系,减少重复教学,注重培养学生运用知识的能力、创造力及沟通能力 [14][15][26] - 大学应摒弃“无限责任公司”的定位,建立合理的淘汰与分流机制,帮助学生发现自我并找到适合的赛道 [4][6][18][20] - 应鼓励学生积极使用AI工具进行学习与探索,阻挡孩子接触AI是时代的倒退 [7][37] 中外教育对比与竞争格局 - 中国高等教育在AI时代已实现对海外教育的“弯道超车”,与哈佛、MIT等名校站在同一起点上 [2][11][13] - 社会对大学的期望值过高,技术进步是全社会的事,不能全部归责或归功于教育 [11][13] - 英国教育体系强调自主学习,与AI时代的教育需求吻合度较高,课程精炼,讲课节奏快 [14] - 需要摆脱“超车”思维,创造属于自己的教育理念,而非沿用他人的话语体系 [15] AI时代的教育理念与大学改革 - AI使教育的自主性更强,传统教育功能已推向学生自主学习,大学入学的作用发生变化 [14][24] - 大学课程过多且存在重复,改革方向是减少课程,给学生更多时间,注重能力与实践性培养 [15] - 好大学、好学科的共同特征是数学和母语语言能力学习,而非当下热门的计算机或人工智能 [6][30] - 大学的竞争力最终体现在其培养的“人”对社会是否有用 [27] - 大学是能历经数百上千年的社会机构,其核心在于创造知识、培养人,并成为社会的“不动点” [6][30] 学生培养与评价体系 - 提出“三出两进出一流”的国际化人才培养评价标准 [4][17] - “三出”:清华本科毕业生能拿到美国学校offer、博士毕业生能拿到美国教职、中国教师能转到美国大学任教 [18] - “两进”:最好的学生愿意来中国读书,最好的老师愿意来中国教书,目前尚未完全达到 [18] - 高淘汰率是正常且有益的机制,例如美国公立大学本科四年毕业率仅为60%~70%,能帮助学生找到适合自己的道路 [6][18] - 应鼓励学生分流和选择,学生发现学校或专业不适合自己而离开是一种成功 [6][20] - 港科大采用入学不选专业、后期灵活选择的模式,并拥有浓厚的创业风气,支持学生创业 [6][23][24] 未来人才的核心技能 - 最重要的求生技能是强大的沟通能力(包括人机沟通)和创造力 [26] - 未来就业形态可能发生变化,独立创建AI原生公司(可能仅由数人组成)的能力比寻求雇佣更重要 [26] - 教育的重点是能力的培养,而非知识的灌输,因为所有知识都可以从ChatGPT获取 [15] AI工具的使用与教育方式 - 当前依赖刷题和补习班的教育方式浪费了家长的金钱和孩子的宝贵时光 [7][36] - AI可以帮助孩子以问答互动的方式了解世界,这是改变学习方式的第一步 [36] - 在校内应减少课堂教学、刷题和考试量,增加“体验”,如科研和人生的快乐,这是AI无法替代的 [7][36] - 阻挡孩子使用AI工具是开历史倒车,正确的做法是引导孩子分析AI的解题思路,学会好好利用工具 [7][37] 个性化发展与职业选择 - 教育者的任务不是“引导”孩子,而是提供环境让孩子“发现”自己的专长 [39] - 不仅要发现专长,也要认识自己的短板,并应“扬长避短”而非“扬长补短” [8][39] - “短板”造就了个体独特性,一个没有短板的人是很可怜的 [8][39]
对谈刘知远、肖朝军:密度法则、RL 的 Scaling Law 与智能的分布式未来丨晚点播客
晚点LatePost· 2025-12-12 11:09
文章核心观点 - 大模型的发展存在“规模法则”和“密度法则”两条主线,前者追求能力跃迁,后者追求效率提升,即单位算力/参数下智能的最大化 [12][13][18] - 行业正从盲目追求模型规模转向追求能力密度,效率提升将加速端侧智能(如手机、汽车)和分布式智能的发展,最终实现每个人的“专属大模型” [9][10][35] - 强化学习尚未出现清晰的Scaling Law,是当前主要瓶颈,未来的关键方向是自主学习(Self-Learning)和“AI造AI” [24][34][36] 大模型演进的明线与暗线 - **明线:规模法则 (Scaling Law)**:自2018年预训练模型出现后,每隔几年模型能力就会跳跃一次,模型正变得更通用,甚至开始接近或超越人类在某些领域的能力 [12] - **暗线:密度法则 (Densing Law)**:这是大模型时代的“摩尔定律”,关注如何用更少的计算和数据资源更高效地获得智能,核心是追求单位计算带来的智能最大化 [13][14][18] - **密度法则的量化表现**:根据研究,大模型的能力密度(衡量单位参数/算力下模型能力的指标)每3.5个月翻一倍,自2023年1月ChatGPT出现后,这一速度在加快 [4][7] 提升模型能力密度的具体方法 - **模型架构优化**:核心方向包括采用稀疏化的混合专家系统以降低算力消耗,以及对注意力机制进行各种效率改进以应对长文本和Agent任务的需求 [19][20] - **数据治理与合成**:通过高质量的数据清洗、精选和合成,可以大幅提升训练效率,例如将预训练数据集精炼至不到原始容量的1/10,效果反而更好 [22][23] - **学习算法演进**:当前重点转向强化学习,但其尚未出现清晰的Scaling Law,主要瓶颈在于难以构建可扩展的环境和可验证的激励 [24][25] - **软硬一体协同优化**:结合芯片制程进步(摩尔定律)与模型能力密度提升,共同推动端侧设备承载以往只能在云端运行的大模型能力 [30][31] 强化学习的现状与未来探索方向 - **当前瓶颈**:强化学习缺乏像预训练那样清晰的Scaling Law,大多数训练仅几千步,如何持续稳定训练并构建“不可破解”的学习环境是核心挑战 [24][25] - **两条探索路径**:一是继续扩大RL的规模,探索开放域的激励定义;二是寻找更高效的新学习方式,提高样本效率,让模型能像人一样通过少量反馈学习新任务 [26][27] - **RL的已验证能力**:只要有足够数据和反馈,强化学习已能在数学、代码等特定任务上达到人类前0.1%甚至0.01%的水平,预示了打造垂直领域“超级专家模型”的潜力 [25] 端侧智能与分布式智能的未来 - **端侧算力规模**:2023年全国端侧算力(主要是手机)是数据中心算力的12倍,信息化本质是分布式算力和信息的结构,智能化也将遵循这一路径 [9][35] - **端侧部署时间表**:结合密度法则提升和芯片路线图,预测到2030年左右,端侧可部署600亿以上参数的模型,5年内端侧很可能承载GPT-4至GPT-5能力的模型 [32] - **具体应用进展**:车端模型量产速度非常快,已与多家车企合作;预计2027年成为关键节点,届时手机可实现大规模强化学习,支持个人数据训练“专属大模型助理” [32][33] - **未来形态**:智能将分布式存在,形成“智能体的互联网”,个人拥有基于终端数据持续成长的“个人大模型”,云端则存在各垂直领域的“专家大模型” [10][35][36] 下一阶段的范式演进:自主学习与AI造AI - **核心方向**:预训练和强化学习之后,下一个大的方法改进是自主学习,即模型能作为一个高效的学习者,根据用户需求在终端上持续学习新技能 [34] - **发展三阶段**:第一阶段是实现自主学习;第二阶段是具备自主学习能力的AI之间的协作;第三阶段是具备创造新符号关系乃至新符号系统的创新能力 [34][35] - **AGI的雏形**:最早的AGI形态可能不是面向消费者的产品,而是面向生产的系统,具备“AI造AI”的能力,即能自主完成数据生产、环境构建、模型训练和部署的全流程 [36]
我们很可能正走向一个“无工作社会”|腾研对话海外名家
腾讯研究院· 2025-11-11 17:33
文章核心观点 - AI革命是继农业革命和工业革命后的第三次重大革命 其影响可能是工业革命的十倍且发生速度快十倍 [6] - 技术扩展人类能力的方向正从身体转向心智 AI革命的核心是提供"按需获取智能" [7] - AI革命不仅是经济变革 更是一场深刻的社会变革 将重塑工作 教育 分配制度 社会关系和全球格局 [8][9] 工作 教育与创造力 - AI将消解大多数专业职业岗位 未来组织可能出现"一个人+一百个AI"的运转模式 5-10年内专业人士需求将大幅减少 [11] - AI社会可能带来"有闲阶层"的崛起 大部分人将面临几乎无限的闲暇时间 需要为"闲暇世界"做好准备 [12][13] - 教育核心任务将从培养劳动力转变为教人激发潜能以享受生活 未来将进入"自主学习"时代 [14] - AI在绘画 作曲 设计等创造性领域展现出惊人能力 大部分创造性活动可被AI取代 挑战人类独特价值 [15] 分配制度与知识产权 - AI将冲击"因工作而获得报酬"的传统分配模式 可能走向"无工作社会" 需要重新思考整个经济体系 [17] - AI可能带来资源富足的"丰裕社会" 但经济利益也可能集中在控制AI系统的少数人手中 加剧贫富差距 [18] - AI时代个人贡献难以认定 知识产权制度可能向"创意共有"演变 个人知识产权保护将变得困难 [19] 社会关系结构 - AI将加速社会活动的"分散化" 远程办公 线上教学等趋势将使集中式组织时代终结 [21] - 医疗健康将被AI变革 智能设备实现日常监测 本地受训人员可处理多数疾病 医院和学校可能变得不必要 [22] - 人类需处理与AI新物种的关系 AI可提供情感价值应对孤独问题 但将迫使我们重新思考"人是什么" [23] 全球格局 - AI天生带有开放与协作基因 可能减轻民族主义隔阂 促进全球普惠发展 任何地方都可免费下载AI工具 [25] - AI革命可能为全球秩序重构提供新契机 中国提供更优越的国际治理模式 结合中西经验可创造更文明和平的世界 [26]
洋葱学园的解法:AI时代的自主学习革命
钛媒体APP· 2025-11-11 10:00
行业背景与痛点 - 当前教育行业面临从知识灌输向培养自主学习能力转变的关键节点,以适应未来对原研创新人才的需求[2][3] - 市场上AI伴学硬件产品功能多局限于拍照搜题和单向知识灌输,缺乏系统化培养自主学习能力的成熟产品体系[2] - 现有工具存在沦为“抄答案捷径”的风险,难以激发学生思维主动性,无法满足家长对能力培养的深层需求[2] 公司产品战略与定位 - 公司正式推出以“激发学习潜能、培养自主学习能力”为核心的「自学破壁计划1 0」,区别于以效率提升为主的AI辅助工具[3] - 产品定位转向对学生内在学习能力的深度唤醒,系统构建学生的目标感、判断力与自我驱动机制[3] - 公司产品设计逻辑为“绝不直接给答案”,旨在成为让家长放心交给孩子独立使用的学习伙伴[12] 自主学习能力解构 - 公司将自主学习能力解构为四个递进阶段:意识启动、动作固化、能力内化、价值观形成[6] - 自主学习是一种必须经由环境营造、刻意练习与持续引导方能形成的高阶能力,无法直接灌输[6] - 公司AI智能学伴系统通过“自驱动力、自学能力、规划意识、探索乐趣”四个核心维度构建自学支持体系[7] AI智能学伴系统功能 - 产品围绕预习、复习、作业、答疑、思考、规划与情感支持七大核心学习场景设计智能体模块[9] - 系统包含AI自学大师、AI私人助教、AI思维教练、AI规划导师、AI自律伙伴与AI情感树洞六大智能体[9] - AI自学大师模块近一个月访问量达393万次,互动量突破1212万次,AI私人助教互动量超过2591万次[12] - AI思维教练采用苏格拉底式追问引导学生构建逻辑,AI自律伙伴运用游戏化机制降低学习启动门槛[11] 技术壁垒与数据优势 - 公司拥有12年教研积累,覆盖1万+动画课程、5000亿条真实学习行为数据,累计服务全国1 1亿学生、400万教师[14] - 公司与超过2000所公立学校达成深度合作,构建了庞大而真实的数据基座[14] - 底层课程框架与资源实现共享,所有智能体通过统一知识图谱与标签体系记录学生画像,实现自适应学习节奏调整[15] 激励与情感支持体系 - 公司构建了高度多样化的激励系统,包括个性化书桌装扮、成就系统、勋章奖励等,适应不同学生偏好[16][17] - “情感树洞”智能体近一个月用户访问量达393万次,留言互动量约26万条,提供情感陪伴与支持[17] - 游戏化机制设计了“PK试验场”功能,学生可通过学习积累积分、提升段位,形成持续正向激励[16] 教育生态角色重塑 - 在AI赋能教育的新阶段,家长角色转变为鼓励与倾听,教师从“知识广播者”转变为“课堂导演”[18][19][20] - 公司开发“AI课堂”解决方案,重构45分钟课堂结构,将课堂时间充分还给学生进行自主学习和小组讨论[19] - 公司AI自主学习模式已在2000余所学校落地,校方成绩数据显示该系统在提升学生学业表现方面有显著成效[20] 长期愿景与市场影响 - 公司旨在打造让孩子开启自主学习之旅门槛最低的产品,最终目标是让学生不再需要外部工具,实现完全自主[21] - 产品超越了传统工具边界,成为塑造终身学习者的“元认知孵化器”,用技术重塑学习的底层逻辑[21]
马斯克预测Grok 5实现AGI概率达10%
环球网资讯· 2025-10-21 12:05
公司技术进展 - xAI公司正在研发的Grok 5大型语言模型有10%的概率实现通用人工智能,且该概率呈持续上升趋势 [1] - Grok 5被视为xAI技术跃迁的关键节点,其全新架构设计或突破现有模型对海量数据的依赖,通过更高效的自我学习系统降低训练成本 [3] - xAI通过优化基于Kubernetes、Rust和JAX的自定义训练堆栈框架,在资源利用率上实现突破 [4] 公司产品迭代 - 2023年11月推出的Grok-1模型以330亿参数实现接近LLaMA 2(700亿参数)的性能,仅用一半训练资源 [3] - 2024年4月发布的多模态大模型Grok-1.5V能通过视觉信息生成Python代码,在RealWorldQA基准测试中超越同类模型 [3] 行业技术定义与对比 - 通用人工智能被定义为能够完成人类通过计算机辅助实现的所有任务的智能系统,其能力上限不会超越全体人类与计算机协同工作的总体水平 [3] - 当前主流AI模型多聚焦于特定任务优化,而通用人工智能需具备跨领域知识迁移、自主学习及创造性思维等人类核心能力 [3] - Grok 5在AI工程领域的表现被称已超越Meta AI实验室前研究负责人安德烈·卡帕斯团队提出的模型规模即性能范式 [4]