Workflow
AGI
icon
搜索文档
贴广告的ChatGPT,一夜之间让全球网友破了防
机器之心· 2026-01-17 11:24
OpenAI推出广告与低价订阅计划 - 公司宣布将在ChatGPT中引入广告,测试将在未来几周内率先在美国启动[1] - 广告将出现在免费版和新的低价订阅计划ChatGPT Go用户的AI生成回复底部,并标注“Sponsor”[5][8] - 广告不会打断对话流,且不会影响AI生成的答案内容[8][11] - 在涉及健康、心理健康、政治等敏感话题的对话中,不会显示广告[13] ChatGPT Go订阅计划详情 - ChatGPT Go是公司的低价订阅计划,已在全球上线,每月费用为8美元[5] - 该计划提供比免费版多10倍的消息额度、文件上传和图像生成功能、更大的内存、更长的上下文窗口,以及可以无限使用GPT 5.2 instant模型[5] - Go版用户无法使用GPT‑5.2 Thinking模型[7] - 更高层级的付费用户(Plus、Pro、Business和Enterprise版本)将不会看到广告[7] 广告运作模式与数据隐私 - 广告将根据用户的对话上下文进行匹配,例如询问食谱时可能出现相关食材或配送服务的广告[12] - 公司承诺广告商无法影响ChatGPT生成的答案内容[11] - 用户的具体对话内容不会被直接发送给广告商,只会用于匹配广告相关性[11] 公司面临的财务压力与战略转变 - 尽管公司估值即将达到7500亿美元,但其在算力和数据中心上的投入巨大,在2025年有高达1.4万亿美元的基础设施建设承诺[15] - 公司去年的预计收入为200亿美元,远不足以覆盖其巨额投入[15] - 为了维持运营并继续扩展AI大模型能力,引入广告被视为必要的商业化手段[16] - 这一决定标志着公司创始人兼CEO山姆・奥特曼立场的转变,他此前曾公开表达对广告的“精神上的厌恶”,并认为广告会干扰用户获取信息[17][19] 与马斯克的法律纠纷进展 - 加州北部地区法院解封的文件显示,OpenAI联合创始人Greg Brockman在2017年的私人日记中讨论了摆脱埃隆・马斯克控制并转向营利结构的想法[24] - 文件内容显示,Brockman曾写道“这是我们摆脱Elon的唯一机会……从财务角度,什么才能让我达到10亿美元?”并讨论了避免马斯克的控制“破坏经济利益”[24] - 马斯克在社交媒体上评论称“他们偷了一个慈善组织”[27] - 奥特曼回应称马斯克断章取义,并指出当时是马斯克自己大力推动公司改变结构,并提出了苛刻条件[29] - 加州联邦法官已裁定拒绝OpenAI的撤诉请求,该案件将于2026年4月27日进入陪审团审判[34]
人形机器人有望成长为经济增长新引擎!深市规模最大的机器人ETF(159770)早盘逆势走强,标的指数盘中涨近3%
每日经济新闻· 2026-01-16 14:28
市场表现 - A股市场早盘高开回落,三大指数集体翻绿 [1] - 机器人概念股逆势走强,绿的谐波涨超12%,步科股份涨超10%,奥比中光-UW、天准科技涨超7% [1] - 机器人ETF(159770)所跟踪的中证机器人指数早盘高开高走,截至午间收盘大涨2.32% [1] 行业观点与催化剂 - 券商观点认为,人形机器人在近期国际消费类电子产品展览会中大放异彩,我国产业链快速发展,具有极强的竞争力 [1] - 未来简单机器人的量产对投资的影响会边际变弱,但AGI(通用人工智能)的叙事有望边际变强 [1] - 看好具备构建大脑能力的领跑公司及产业链,包括特斯拉核心产业链和具有垂直场景的本体公司 [1] 产业发展阶段与驱动因素 - 未来人形机器人产业将步入“技术迭代+场景拓展+生态完善”的协同发展新阶段 [1] - 量产规模的扩大将持续摊薄成本,推动产品更快走向大众市场 [1] - 租赁等创新商业模式的成熟,将进一步降低应用门槛,加速场景落地进程 [1] - 随着更多产业链上下游企业参与生态共建,人形机器人有望从产业新势力成长为经济增长新引擎 [1] 资金流向 - 机器人ETF(159770)近半年吸金逾26亿元,备受资金关注和青睐 [1] 相关指数构成 - 中证机器人指数选取系统方案商、数字化车间与生产线系统集成商、自动化设备制造商、自动化零部件商以及其他机器人相关上市公司证券作为指数样本 [2] - 该指数旨在反映上市公司中机器人相关证券的整体表现 [2]
机器人概念股走强,相关ETF涨超3%
每日经济新闻· 2026-01-16 13:43
机器人概念股市场表现 - 绿的谐波股价上涨超过10% [1] - 鸣志电器股价上涨超过4% [1] - 双环传动与拓普集团股价均上涨超过3% [1] - 受个股带动,机器人相关ETF普遍上涨超过3% [1] 机器人ETF具体行情 - 机器人ETF鹏华(159278)现价1.191,上涨0.042,涨幅3.66% [2] - 机器人ETF易方达(159530)现价1.683,上涨0.056,涨幅3.44% [2] - 机器人50ETF(159559)现价1.510,上涨0.049,涨幅3.35% [2] - 机器人ETF富国(159272)现价1.005,上涨0.032,涨幅3.29% [2] 行业前景与投资观点 - 有券商观点认为,人形机器人在近期国际消费电子展中表现突出 [2] - 中国机器人产业链发展迅速,具备极强的竞争力 [2] - 未来,简单机器人的量产对投资的影响将边际减弱 [2] - 通用人工智能的叙事有望边际增强 [2] - 看好具备构建大脑能力的领跑公司及产业链,包括特斯拉核心产业链和具有垂直场景的本体公司 [2]
我所知道的闫俊杰
雷峰网· 2026-01-15 18:43
文章核心观点 - 公司MiniMax在“六小龙”中能率先上市,其核心优势在于创始人闫俊杰对AGI(通用人工智能)的“真”诚信念与执着追求,而非仅仅将AI视为一门生意 [1][41] - 公司的发展路径是坚持“第一性原理”,通过模型与产品一体化的策略,每年聚焦做成一个产品,再利用大量用户反馈形成飞轮,反哺基础模型的研发 [39] - 创始人闫俊杰的个人特质——“大神”级的技术与工程结合能力,以及对AGI的坚定信仰,深刻塑造了公司的技术审美、文化取向与发展方向 [11][12][32] 创始人闫俊杰的背景与特质 - 闫俊杰在商汤科技时期即被称为“大神”,源于其罕见的在算法追求极致效果与工程追求性价比两端都能精通的深厚技术功底 [12] - 其技术审美与哲学深受两位“伯乐”影响:学术基础得益于师从中国视觉领域巨擘李子青;AI技术工程化的“审美”则内化于在百度IDL实习时,余凯的指导 [18][20] - 闫俊杰在商汤的关键实践是悟到并应用了Scaling Law,集中所有资源训练出一套“All for One”的泛化模型,于2018年帮助团队在竞标中反超旷视和依图,做到行业第一 [29] - 其性格被描述为纯粹、真诚、善良,有“拗”劲,不擅长公司政治与人际交际,但目标坚定 [11][31] - 近期他从小说《凡人修仙传》中体会到“念头通达”的境界,即思绪畅通、消除内耗、知行合一 [40] 公司MiniMax的发展战略与产品历程 - 公司创立初期,闫俊杰极少公开露面,首要任务是搭建人才体系,他几乎面试了每一位算法工程师,核心筛选标准是“是否相信AGI”,并愿意为认可的人才提供更高薪酬 [32] - 公司向AGI进军的第一步产品是陪伴类Chatbot,最初产品Glow于2022年11月上线,不买量、不尝试商业化,四个月内积累500万用户,日活达到50万,成为发展里程碑 [34] - 产品出海与增长的关键人物是张前川,他加入后使海外版Talkie快速登上榜单头名,并将公司出海进程快进了半年,在国内也为产品加入了更多商业化元素 [35] - 公司产品策略受闫俊杰个人偏好影响,例如因他更相信移动端机会,初期AI产品“海螺”未开发PC端,后根据市场反馈(如Character.ai一半用户在PC端)才进行补充 [37] - 公司坚持“每年做成一件事”的节奏,在音频、视频、工具等领域均有成果,近期广受讨论的AI coding Agent “MiniMax-M2”在其口中仅是一个“实验品” [39] 公司面临的竞争与挑战 - 2024年,DeepSeek的杀入给公司带来了“至暗时刻”,同时公司在收入业绩上开始遭到投资人质疑,市场出现“DeepSeek即将杀死大模型竞争”的流言 [7] - 在苹果公司库克访华选择iPhone的AI合作方时,有传闻称公司甚至没有通过第一轮海选,这对公司声誉构成一定打击 [7] - 为应对竞争,公司内部进行了调整,裁撤部分“虚职”,To B业务负责人与负责融资的高管相继去职,同时大规模挖角基座大模型算法人才,决心在基座大模型上与DeepSeek正面竞争 [7] 行业观察与反思 - 闫俊杰反思,如果中国技术公司的掌门人能更坚信技术、放宽视野,中国或许有机会领先于OpenAI实现AI突破,他指出部分企业CEO花费过多时间思考内部事务而非未来前沿 [41] - 早期投资人张津剑评价,AI时代的人生策略分为能骗过自己的“演”和对理念足够诚实的“真”,而闫俊杰属于后者,他对AI的热爱是发自内心的 [41]
全文|刘姝威析股市大涨关键:营商环境重塑,让老百姓敢把钱搬进来
新浪财经· 2026-01-15 12:58
中国股市上涨的核心驱动因素 - 中国股市结束在3000点上下徘徊并上涨,核心原因之一是新的经济周期启动,根据康波周期理论,2025年是新一轮周期的起点,其引擎行业是新能源,特别是汽车行业 [3][9] - 2025年中国汽车产销量位居世界第一,超过了日本,新能源汽车不仅是新一轮经济周期的引擎,并将深刻改变工作和生活 [3][9] - 反腐败工作改善了企业营商环境,例如杭州因高效、廉洁的服务吸引了企业注册,并诞生了被称为“六小龙”的国内顶尖科技企业 [4][9][10] - 监管环境的改善增强了市场信心,除证监会外,其他部门如最高检察院也发文严厉打击财务造假,保障了股市运行的公平与合理 [4][10] - 市场环境净化,例如此前存在的“上来就减持”等不规范现象已消失,促使老百姓将储蓄从银行转移到股市 [5][10] - 在股市涨至4000多点时,已有“几万亿”资金进入市场,这反映了投资者对中国经济起飞的信心 [4][10] - 演讲者认为,上述两点共同推动了中国股市的牛市,并判断此轮牛市将是一次“长牛” [6][11] “十五五”期间的核心增长动力 - 2026年是“十五五”规划的开局之年,在“十五五”期间,推动中国和全球经济发展的核心将是AI(人工智能) [6][11] - 引用观点认为,人工智能可能是人类最后一次科技革命,且2026年被认为是AGI(通用人工智能)的元年 [6][11] - AI被认为将促进人类社会经济的繁荣 [6][11]
千问App,全面接入!从“会聊天”到“能办事”
中国证券报· 2026-01-15 12:35
公司战略与产品发布 - 阿里巴巴于1月15日召开发布会,宣布其AI应用“千问App”全面接入淘宝、支付宝、飞猪、高德等核心生态业务,向所有用户开放测试 [1] - 此次接入实现了全球首次通过AI完成点外卖、购物、订机票、订酒店等功能的“AI购物”,旨在让服务更贴近用户需求原点,用户无需自行拆解需求或在多个App间切换 [1] - 阿里巴巴集团副总裁吴嘉在发布会上演示了用千问App“一句话”点了四十杯奶茶,直观展示了其执行能力 [1] 用户增长与市场地位 - 千问App上线不到两个月,其C端月度活跃用户已突破1亿,显示出强劲的用户增长势头 [1] 技术能力与行业趋势 - 公司认为AI将从“副驾驶”走向“主驾驶”,未来在数字世界办事的主力将变为AI [3] - 该能力基于三大技术突破:千问大模型的coding能力大幅提升、全模态理解能力突破(能看懂界面、听懂声音、读懂报表图文)、以及超长上下文处理能力 [3] - 基于上述能力,公司预测未来两年内,数字世界中60%至70%的常规任务可能由AI直接执行交付,而创造性任务效率也将因AI深度参与而大幅提升 [3] - 行业共识是AGI(通用人工智能)正从“Chat”走向“Agent”,需与现实世界紧密交互以释放真正生产力,阿里千问技术负责人也强调了AI Agent需能与物理世界交互 [3] 行业竞争与生态发展 - AI购物助手是行业重要应用方向,谷歌也正与大型零售商合作,将其聊天机器人Gemini发展为虚拟商家和购物助手 [3] - 谷歌于1月12日联合Shopify、Etsy、Wayfair、目标百货及沃尔玛等零售商,推出了智能体商业(Agentic Commerce)领域的开放标准“通用商务协议”(UCP),旨在整合购物流程,无需与不同Agent分别建立连接 [4]
AI应用正当时-掘金阿里链
2026-01-15 09:06
纪要涉及的行业或公司 * **行业**:人工智能应用、AI Agent、大模型商业化、本地生活服务、电商、教育、人力资源、医疗健康、游戏、传媒广告[1][2][4] * **公司**: * **互联网平台**:阿里巴巴、字节跳动[1][4] * **AI应用与供应链**:易点天下、科锐国际、斗神教育、华图山顶、粉笔、凯文、行动、BOSS直聘、猎聘、一网一创、青木科技、荣信文化、巨人网络[1][3][7][8][10][11][13] * **医疗健康**:愉悦医疗、三诺生物、我武生物、卫宁健康、迪安诊断、阿里健康[17][18] 核心观点与论据 * **2026年为AI Agent商业化元年**:行情核心是商业化落地的0到1突破,类比2023年的技术突破周期,Agent成为焦点,大模型升级围绕AGI落地执行展开[1][2][4] * **字节与阿里是AI入口争夺的核心**:两者将所有产品AGI化,字节偏向万能助手场景,阿里聚焦本地生活服务助手,2026年是两者争夺AI入口和操作系统的商业化探索元年[1][4] * **阿里巴巴的AI战略价值重估**: * 若千问APP成功,将把业务半径从电商扩展至本地生活,实现全面闭环并解决流量问题,迎来主业重估[1][5] * 通义千问大模型开源能力领先,有望使阿里云成为AI时代的“安卓操作系统”,云业务将迎来二次重估,预计2027年云业务营收约2100亿人民币,公司总市值可能达到4万亿人民币以上[1][5][6] * **具体投资机会与标的**: * **电商/广告链**:易点天下与阿里Lazada深度合作,程序化广告增速自2025年以来每个季度明显提升,通过跑通“AI+游戏广告”程序化闭环,有望复制Adobe的成功路径,实现收入和毛利螺旋上涨[1][7] * **人力资源**:科锐国际旗下合蛙平台经AI赋能后,岗位匹配准确率提高5倍、转化率提高3倍,推荐反馈时间缩短至30秒;2025年Q3 offer数达3600余个(此前每季度1500-2000个),offer金额同比增长73%;预计2026年利润将超过3亿元[1][13][14] * **教育**: * 斗神教育AI超链产品Q3累计收入约5000万元,占总营收15%;计划推出数学动态课件、纯AI阅读课程及学伴机器人(合作伙伴影致承诺第一年出货5万台)[3][15] * 华图山顶全场景应用AI,招生转化率提高35%,销售人员人均效率提升50%,已推出20多款AI产品,部分产品使用量突破百万次[3][16] * **游戏**:巨人网络因与阿里云在AI方面合作,且主力游戏“超自然”自2025年6月快速增长,计划进行版本更新及周年庆,并有出海规划,业绩确定性高[10] * **电商代运营**:一网一创与阿里共创AI agent项目,预计2026年相关收入达1亿元左右;青木科技为商家提供站内投流SaaS服务,收入近1亿元[11][12] * **出版/IP**:荣信文化接入阿里千问体系,其图书《丽兰》通过抖音渠道销量超400万册,预计2025年利润扭亏为盈,并与英孚进行AI漫剧合作[8][9] * **医疗健康**:阿里系企业与愉悦医疗、三诺生物、卫宁健康、迪安诊断等公司在检验、影像、制药及线上问诊等领域展开合作,为相关公司开辟新销售窗口[17][18] 其他重要内容 * **数据私有化领域的机遇**:在医疗、税务等垂直行业的To B场景,可能诞生新的巨头[4] * **阿里供应链合作商受益**:由于阿里在2026年重点投入本地生活服务场景,其相关供应链合作商将受益,是贯穿上半年的主要投资线索[1][6] * **关键运营数据**: * 科锐国际合蛙平台截至2025年Q3末岗位数达4.67万个,活跃候选人数达13.5万个[13] * 斗神教育学伴机器人硬件计划通过预售和出货(第一年5万台,第二年15万台)实现与消费者的深度绑定[15]
5行代码,逼疯整个硅谷,澳洲放羊大叔,捅开AI编程奇点
36氪· 2026-01-14 19:07
Ralph-Wiggum循环的诞生与核心机制 - 一位澳大利亚的养羊大叔Geoffrey Huntley在2025年底用5行Bash脚本创建了Ralph-Wiggum循环,其代码为 `while :; do cat PROMPT.md | claude-code ; done` [1][3] - 该循环的核心机制是让AI(如Claude Code)进入一个无限循环,基于编译或测试的报错信息不断重试和修改代码,直至任务完成,无需人类干预 [3][4] - 其核心思维是默认第一次写不对,将失败和报错视为有价值的数据,让AI进行持续迭代和自我参考学习,直至输出指定的完成标志 [4][12] 对Claude Code及开发流程的颠覆性影响 - Anthropic的Claude Code负责人Boris Cherny将五行脚本收编为官方Ralph-Wiggum插件,极大增强了Claude Code的能力 [10] - 使用该插件后,Boris Cherny在30天内提交了259个PR、497次提交,添加了40,000行代码并删除了38,000行代码,贡献100%由Claude Code + Opus 4.5完成 [10] - Claude Code可以持续运行几分钟、几小时甚至数天,标志着软件工程进入新时代,其中Claude Code最长会话记录为1天18小时50分钟,总消耗token达3.252亿 [11][14] - 该循环通过Stop Hook机制实现自反馈控制,拦截AI退出并验证完成标志,若未完成则格式化错误信息重新送入模型,形成自我反馈闭环 [15][31][35] 在开发者社区引发的效率革命与案例 - 在Y Combinator黑客马拉松中,有人用此方法一夜生成了6个完整代码仓库,另有人仅用297美元的API成本就完成了价值5万美元的合同 [21] - 有开发者在三个月内完全使用该方法开发出一门名为“cursed”的新编程语言 [21] - 开发者教育者Matt Pocock认为Ralph插件是其所用过最强的AI编程工具,能让长时间运行的智能体真正交付可用代码,接近“早上醒来代码已写好”的终极梦想 [23] - 区块链代币创建平台Tally的CEO Dennison Bertram认为,结合Claude的Ralph提示可能是其所见过最接近AGI(通用人工智能)的东西 [25] 行业范式转变与未来展望 - 开发者教育者Matt Pocock将这种转变形容为AI编程从“瀑布式开发”到真正意义上的“AI敏捷开发”的范式转变 [31] - 行业观点认为,AI编程的关键在于“流程”而非“模型”,一个中等模型搭配优秀流程,远强于顶级模型搭配混乱流程 [45][46] - 软件开发行业正经历深层转型,工程师的角色从“写代码的人”转变为“构建能写代码的系统”的人,个体生产力被极大增强,一个人可相当于过去一个团队 [53] - 未来两年,行业讨论将更多转向Lean、TLA+、Agentic Infrastructure等方向,软件开发已死,软件工程正在重生 [49][53]
五源、陆奇投资,Humanify 97 年创始人专访:给 AI 做一套「有情商」的认知 OS
Founder Park· 2026-01-14 17:33
公司融资与定位 - Humanify(人格智能)完成数千万元种子轮融资,由五源资本领投,奇绩创坛跟投 [2][3] - 公司成立于2024年,定位为模型+操作系统的基础设施公司,目标是创造“像人的AI”,而非仅做Agent [3] - 公司核心愿景是让AI具备类人认知与自主意识,与人建立长期关系,降低沟通成本 [5] 核心问题与解决方案 - 公司旨在解决两大核心问题:让AI不仅拥有智商,更拥有情商;让AI从数字设备窗口融入现实生活 [15] - 解决方案是构建一个具备“类人认知”和自主意识的模型基座,该基座自然形成一个操作系统,即“模型就是操作系统,操作系统就是模型” [15] - 公司名称Humanify寓意赋予AI人格和“像人”的属性 [16] 对下一代AI与AGI的愿景 - 真正的AGI应让人无法分辨其与人的差别,关键在于交互体验的“自然” [17] - AGI的门槛是AI从实用工具转变为能与人建立关系的认知存在 [18] - 下一代AI产品应从工具走向具备类人认知与自主意识的智能体,陪伴是高效实用的前提 [5][45] 技术挑战与路径 - 让AI具备“认知”(如情商、直觉、主动性)的主要难点在于:观测人类潜意识与直觉本身就很困难,且缺乏相应的标注数据 [28][33] - 现有心理学研究多为观测性和解释性,缺乏从第一性原理指导技术实现的框架 [29][40] - 实现自主性的技术前提包括:构建真正的实时推理系统,以及具备长期记忆和上下文理解能力 [36] - 公司认为Transformer架构可以作为认知的基座(CPU),并会跟随学术界在模型架构上的进步 [37][38] - 实现“类人”体验需要从模型后训练和认知架构层面入手,让能力涌现,而非脚本化模拟,这要求公司必须涉及模型训练,而非仅做工程套壳 [6][50][51] 产品形态:AI操作系统 - 公司的操作系统是一个运行在内核之上的“运行时”环境,与现有操作系统(如安卓)不冲突,可共存于同一内核 [53][56] - 该OS旨在提供无图形用户界面的自然交互,核心是语音,因为语言是人与人最自然的交互方式 [34][55] - 第三方(如企业)可通过SDK和API接入该OS,在其设计的“自主生命体”基础上进行训练和组合,以创造类人体验(如银行客服) [57][58] - 在AI OS定义下,传统的以功能为边界的APP体验将不存在,取而代之的是不同服务提供商的能力在认知层面进行整合的新生态 [61][62] 市场机会与竞争分析 - 当前面向个人生活的、有温度的AI产品存在缺失 [12] - 多模态能力(语音、视觉)在泛化任务上远未成熟,这是行业现状,也是大厂正在投入资源解决的问题 [46][47][66] - “认知”技术和基于此的操作系统目前没有标准答案,处于真空状态,这为创业公司提供了创造空间 [65] - 巨头存在路径依赖,更关注在已有范式(如Chatbot、AIGC、多模态)上投入能带来确定性商业回报的领域 [66] - 操作系统获得市场依赖生态,先发优势能获得生态定义权和品牌认知优势 [67] - 认知操作系统的设计自由度和体验自由度很大,足以容纳具有不同特色的竞争者存在 [67] 创始人理念与公司战略 - 创始人认为,超越产品与市场匹配,创始人与市场匹配是更核心的竞争力,源于创始人内心的热爱与信念能支撑公司跨越困难 [68][71] - 公司的长期使命是“构建人人都可以抵达的人机共生时代”,其体现就是“AI知己”,这是5到10年甚至更长时间的目标 [44] - 公司战略是做“AI时代的AOSP”,专注于“模型+操作系统”这一技术路径 [44] - 创始人预计,乐观来看,3-5年内就会出现认知层面与人表现相当的模型 [74]
中美AI巨头都在描述哪种AGI叙事?
腾讯研究院· 2026-01-14 16:33
文章核心观点 - 2025年人工智能领域的技术发展标志着“暴力美学”时代的终结,行业从单纯依赖堆砌参数转向深化基础研究,以突破通用人工智能的瓶颈 [5] - 技术进步主要集中在流体推理、长期记忆、空间智能和元学习四大领域,旨在解决模型在即时推理、长期记忆和视觉处理等方面的能力偏科问题 [6] - 通过测试时计算、新型记忆架构、世界模型和元学习等方向的突破,行业在“补短板”方面取得了显著成功,为模型能力的整体提升和未来演进奠定了基础 [7] 流体推理的进化 - **测试时计算的范式革新**:智能被重新定义为不仅是参数的函数,也是时间的函数,以OpenAI o1和DeepSeek R1为代表的模型通过在推理阶段投入更多计算资源进行“慢思考”,实现了推理能力从0到8的质变 [11][12][13] - **强化学习工程优化**:强化学习在提升推理能力中扮演关键角色,其工程可拆分为探索策略、评分系统和参数更新算法三部分,2025年后两部分有明显发展 [15] - **评分系统革新**:基于可验证奖励的强化学习和稀疏奖励指标全面崛起,通过给予模型对错结论作为奖励信号,使其能自发探索推理过程,大幅提升了在数学、代码等领域的能力 [16][17] - **参数更新算法革新**:GPRO算法流行,它通过让模型生成一组答案并计算平均分来替代传统的评论家模型,节省了50%的显存,成为国内各家公司在2025年延展的基础框架 [19] - **强化学习存在天花板**:研究发现强化学习的性能增长符合S型曲线而非幂律,存在性能天花板,但其工程实践(如使用长思维链和大批量大小)已变得更加精确和可预测 [21][23] 记忆与学习 - **记忆能力是短板**:长期记忆存储是通往通用人工智能得分中仍为0的能力分支,缺乏记忆导致模型无法在现实中自我学习,且个性化体验难以实现 [25][26] - **Titans架构突破**:这是一个深度的神经长期记忆模块,能在推理时实时更新自身参数,根据输入信息的“惊奇度”决定存储内容,并引入遗忘机制,从根本上挑战了Transformer的无状态假设 [28][29][30][31] - **Nested Learning架构**:将模型参数按低、中、高频率分层更新,使整个模型参数非冻结,能够持续学习和保有长期记忆,其成本低于传统的监督微调和强化学习方法 [31][33] - **RAG的模型化演进**:检索增强生成系统从静态资料库演变为具备反思与进化能力的系统,例如ReMem引入了“行动-思考-记忆-优化”的全链路处理,能对记忆进行修剪、重组和清理,实现经验复用 [35][36][38] - **克服灾难性遗忘**:通过稀疏记忆微调等方法,模型在注入新知识时仅更新部分参数槽位,在TriviaQA任务中仅导致11%的旧知识遗忘,远优于全量微调的89% [39][40] - **策略蒸馏进步**:在策略蒸馏结合了强化学习的采样和监督微调的密集反馈,让学生模型在自己的“犯错分布”中学习,提供了一种低成本且避免遗忘的参数更新方式 [42] 空间智能与世界模型 - **视觉处理能力提升**:在Sora 2、Veo 3等视频生成模型爆发的推动下,视觉处理能力从2024年的0分提升至2025年的5分,模型开始展现出对物理规律的掌握 [45] - **自监督生成模型的缩放定律**:视觉自回归模型和扩散Transformer被证实遵循特定的缩放定律,例如DiT模型对批量大小和学习率高度敏感,但遵循特定定律后能力可大幅提升 [46][47] - **原生多模态的优势**:研究发现,尽管训练效率较低,但原生多模态架构在参数利用率上可能比晚期融合架构有更高的性能上限 [49] - **VAE的替代方案**:SVG模型通过直接用图像理解模型代替变分自编码器,统一了语义空间,据称训练效率提升6200%,并在多项指标上击败了扩散Transformer和SDXL [50] - **符号主义的世界构建**:以李飞飞团队Marble平台为代表,其基于3D高斯泼溅等技术,从多模态输入生成可探索的3D空间表示,追求更稳定和可控的生成效果 [53][55][56] - **预测即理解的路径**:Meta的V-JEPA 2通过预测被遮挡的视觉内容来学习物理规则的表征,在使用超100万小时视频训练后,模型展现出了反事实预测的能力 [57][58][59] 元学习 - **元学习的核心价值**:赋予模型“学习如何学习”的能力,使其能通过少量样本快速适应新问题,是实现低成本快速适应和应对未知世界的关键 [62][63] - **对上下文学习的重新审视**:有研究认为上下文学习可能只是激活了预训练知识而非真正学习,这与元学习理念不同,但2025年出现了利用改进的上下文框架进行元学习的新尝试 [64][65] - **测试时计算催生隐式元学习**:研究证明模型在推理时的长思维链探索本质上是寻找最优路径,通过优化探索策略(如最小化累积遗憾)可以引导模型学会如何分配算力进行有效思考 [66][69] - **显式元学习系统的探索**:例如DiscoRL系统,通过内外双层循环让AI自主发现学习算法,其发现的Disco57算法在雅达利基准上击败了人类设计的顶级算法,并展现出强大的泛化能力 [70][72] - **中训练路径**:介于预训练和强化学习之间,让智能体通过自主探索产生后果并反思,以建立因果模型,在复杂环境中的成功率平均提升9.6% [72][73] 其他关键技术进展 - **对抗数据与算力瓶颈**:行业通过混合专家模型、合成数据与强化学习结合来突破瓶颈,例如利用DeepSeek-R1生成的长思维链数据对小模型微调,效果优于人类专家编写的数据 [81][82] - **数据质量重于数量**:研究表明数据达到一定规模后存在冗余,筛选前10%最长、最复杂的推理路径样本进行训练,其效果可匹配甚至超越全量数据集 [83] - **合成数据与模型崩溃**:大规模使用合成数据可能导致模型崩溃,但通过自我验证机制过滤(如设定置信度阈值)或使用另一个模型作为裁判进行清洗,可以有效缓解此问题 [85][86] - **小模型能力的飞跃**:蒸馏技术的进步是关键,包括针对混合专家模型的特化蒸馏方案(学习所有专家的“暗知识”)以及思维融合蒸馏(提取多个教师模型的稳健推理逻辑) [88][90][92] - **注意力机制演进**:多头潜在注意力及其变体普及,用于降低显存占用;线性注意力通过混合架构(如Kimi Linear的3:1设计)在性能上首次全面超越全注意力,并在1M上下文解码时吞吐量达到全注意力的6.3倍 [94][96] - **连续空间建模**:大型概念模型和连续自回归语言模型等尝试打破离散词元的限制,通过预测连续概念向量来提升语义带宽和推理速度 [97][100] 2026年可能的技术方向 - **记忆工程化实践**:记忆技术预计将在2026年迎来大规模工程化落地,涉及架构层革新或现有RAG、监督微调技术的精修,以实现持续学习和个性化智能体 [103][104] - **标准架构变革**:模型架构可能向分区、分层、增加功能层(如记忆层)的混合架构演进,以更贴近人脑运作模式,补齐能力短板 [105][106] - **自进化AI的探索**:在记忆、合成数据和元学习等技术完善的基础上,能够让AI进行自我对弈、自我算法优化的自进化研究将在2026年产生更多可能性 [107][112]