Workflow
量子位
icon
搜索文档
机器人集体到香港户外极限挑战,狗比人强
量子位· 2025-12-08 14:07
只不过,有看头的比赛从来不缺反转。 原以为是主办方预判的翻车局,选手们却一个比一个能整活,奇招不断,狠狠破局。 henry 发自 凹非寺 量子位 | 公众号 QbitAI 平时一看机器人比赛,就说遥操,遥操。今儿个,鼓励"自力更生的",来了! 就在这周末刚刚收官的ATEC2025线下挑战赛,主办方不仅鼓励机器人自主完成任务,还首次在无遥操的情况下,把机器人从实验室拉到户外 遛了一圈。 拱桥、山地、缓坡、吊桥、操场,全靠AI自主闯关,而且还是one-shot。 对于这次比赛的难度,作为"出题人"的主办方可谓相当自信,比赛还未开打,就提前透露: 这可能会是一场翻车无数的比赛! 经过两天的激烈较量,前三赛队新鲜出炉:浙江大学 Wongtsai 摘得桂冠,上海交通大学 IRMV 和北京理工大学 CyberPrime 团队紧随其 后,分获亚军、季军。(均为机器狗方案) △ 浙江大学Wongtsai赛队 更离谱的是——浙大团队在夺冠后还"凡尔赛"地说,他们其实准备了更难的预案。 本次赛事的专家评审阵容包括 刘云辉 、 谢立华 、 Masayoshi Tomizuka 等多位国际知名机器人学者。 线下赛共设置: 垃圾分拣 ...
哈萨比斯:DeepMind才是Scaling Law发现者,现在也没看到瓶颈
量子位· 2025-12-08 14:07
Scaling Law的现状与历史 - 谷歌DeepMind首席执行官哈萨比斯在Axios AI+峰会上力挺Scaling Law,认为其对于实现AGI至关重要[1][6] - 哈萨比斯指出,Scaling Law最早的发现者并非OpenAI,而是DeepMind团队,其内部在2017至2018年期间的研究已发现相关规律,并称之为“Chinchilla Scaling Laws”[6][14][17] - 基于对Scaling Law有效性的确认,DeepMind调整了研究方向并投入更多资源,这被认为是其在大模型领域取得成功、推动Gemini从1.0演进到3.0时代的关键[18] Scaling Law与AGI(通用人工智能)的关系 - 公司认为,无论AGI最终形态如何,Scaling都将是其中的关键组成部分,且当前Scaling尚未到达极限,有必要继续沿此路线将系统推向最大化[21][22] - 哈萨比斯提出,单靠Scaling Law也有可能达成AGI,因为大量数据和计算资源的投入是展现类人智慧能力的合理途径[7][23] - 同时,他也猜测实现AGI可能还需要一两个类似Transformer或AlphaGo级别的重大突破,并预测这个时间点可能在5到10年内[24][26] 对未来12个月AI发展的预测 - **多模态融合**:完整的多模态融合将是主流演进方向,谷歌DeepMind正全力推进,旨在通过交叉融合图像、视频、文本和音频来全面提升模型的推理和创造力[27][28][30] - **视觉智能突破**:以谷歌Nano Banana Pro等图像模型为例,视觉理解能力有显著进展,未来将在更丰富的分析、故事讲述和分步视觉推理方面继续探索[31][32][33] - **世界模型普及**:世界模型是行业关注重点,也是哈萨比斯个人的工作重点,例如谷歌8月上线的世界模型Genie 3,预计下一年该领域将持续受到业界关注[35][36][37] - **Agent可靠性提升**:哈萨比斯认为,现有Agent系统尚不完全可靠,但预计再有一年时间,Agent将能开始接近于可靠地完成委托任务[38][39][40] Gemini的发展与目标 - Gemini 3的成功验证了Scaling Law的有效性,其全网爆火被视为谷歌打了一场漂亮的翻身仗[4][5] - Gemini 3的独到之处在于个性化的深度、简洁的回答、温和反驳不合理观点的能力,并能一键式生成商业级游戏,展现了其基座架构在理解高层次指令和输出高精度细节方面的优势[43][44][45][46] - 公司对Gemini设定的最终目标是成为“通用万能助手”或“通用助手”,下一代Gemini将延续现有优势,出现在更多设备上并无缝融入日常生活,其使用频率将变得和使用手机一样频繁[9][41][46][47]
英伟达4B小模型击败GPT-5 Pro!成本仅1/36
量子位· 2025-12-08 14:07
英伟达小模型持续获胜。 ARC-AGI 2最新成绩,4B小模型 NVARC 以 27.64% 的公开榜成绩力 压GPT-5 Pro 18.3%登顶榜首。 且每任务成本仅20美分,大约是GPT-5 Pro单任务成本(超过7美元)的 1/36。 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 据官方分析,此次NVARC夺冠的亮点在于 零预训练深度学习方法 ,没有依赖大规模通用数据集进行前期预训练, 规避了预训练模型的领域 偏见、数据依赖等问题。 而ARC-AGI 2确实是一个消除了与公共训练数据重叠的更高难度测试, 主要是看测试模型能否高效地获取超出其训练数据的新技能。 快来看看"性价比之王"是如何"练"成的? 不靠参数堆料 英伟达的策略是将复杂推理移至离线的合成数据管道, 训练能在评估时快速运行的较小模型。 简单来说就是 大规模合成高质量数据 ,然后对现有模型进行优化, 并且 将昂贵的计算工作转移到离线进行 。 为了确保数据质量,他们将复杂的推理管线拆分成不同的阶段,每个阶段都可以独立验证。 通过这种方式,他们建立了一个含320万+ 增强样本的合成数据集,其中每个样本最多有7对输入/输出。 | Sourc ...
本周三!量子位的这件大事就要来了|MEET2026
量子位· 2025-12-08 14:07
大会概览 - MEET2026智能未来大会将于2025年12月10日在北京金茂万丽酒店举办,主题为“共生无界,智启未来” [24][37][39] - 大会是AI圈一年一度的盛宴,预计将获得数千万媒体曝光,吸引千位线下观众与超300万名在线观众 [36] - 大会将发布《2025年度AI十大趋势报告》与《2025人工智能年度榜单》两份重要文件 [35][39][47] 核心议题与亮点 - 大会设置两场高浓度对话:一场是文远知行创始人韩旭与量子位总编辑李根关于GenAI赋能自动驾驶的对话;另一场是探讨AI Agent革新千行百业进程的圆桌论坛 [7][8][13] - 议题内容覆盖大语言模型、多模态、具身智能、自动驾驶、云计算及具体应用等AI主流方向 [3] - 重点关注AI从数字世界迈向物理世界、从“思考的AI”到“行动的AI”的转变,以及Agent如何从陪聊进化为超级助理 [12][16][41][43] 嘉宾阵容 - 大会累计邀请近三十位重量级嘉宾,涵盖学术界、产业界与前沿创业一线 [17] - 学术界嘉宾包括清华大学张亚勤院士、孙茂松教授,智源研究院王仲远院长,交大高金朱宁教授等,将分享对“人工智能+”趋势、大模型发展等根本问题的深度判断 [1][17][41][45] - 产业界阵容覆盖芯片、云、模型到终端的全栈力量,包括百度、小米、商汤、蚂蚁、谷歌云、亚马逊云科技、高通、昆仑万维、潞晨科技、PPIO、中关村科金等最具代表性的企业 [1][21][41][42][43][44] - 新生创业力量如卓世科技、太初元碁、RockAI、自变量机器人、光轮智能、灵心巧手等也将亲临现场 [28][42][44][45] 议程与内容 - 上午议程聚焦宏观趋势与基础技术,包括“人工智能+趋势”、AI打造超级智能体、混合AI、Agentic AI未来等话题 [41] - 下午议程深入多模态、智能体、算力生态及行业应用,涵盖AI技术突破、基础设施、硬件创新及具身智能平台等 [43][44][45] - 会议以两场重磅发布收尾,分别是《2025人工智能年度榜单》和《2025年度AI十大趋势报告》的发布 [35][42][45] 参会价值 - 大会提供与学术界大咖、产业界领袖及高精尖企业管理层观众交流的机会 [1][31] - 参会者可获得最前瞻的观点、第一视角的实战经验与深度思考,洞悉技术路线、产品逻辑及创业机会的变化 [4][6][11] - 大会内容旨在解决AI落地真实挑战,探讨AI从理论、平台、应用到终端的完整落地路径,寻找从hype走向impact的真实路径 [33][34]
嚯,38%斯坦福本科生是“残疾人”
量子位· 2025-12-08 12:00
鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 而且绝非个例……常春藤里有一个算一个,"残疾"比例都高到离谱。 蛤? 38% 的斯坦福本科生都是"残疾人"??? 不过,你要是以为这是"身残志坚"的励志故事,那就大错特错,NoNoNo! 他们的目的只有一个—— 考试时间能延长50%! 斯坦福38%本科生注册"残疾" 根据数据显示,今年38%的 斯坦福大学 本科生注册为"有残疾",其中24%的学生都在秋季学期享受学术或住房特殊照顾。 但事实上,在他们当中,绝大多数并非传统意义上的身体残疾,而是ADHD (注意力缺陷多动障碍) 、焦虑抑郁诸如此类的心理问题。 获得该"残疾"认证的方式也相当简单, 只需要一张基础的医生证明 。 过去可能需要对应的临床数据佐证,例如药物治疗、相关病史等,但随着2008年《美国残疾人法案》 (ADA) 的修订,法律上对残疾的定 义扩充到"阅读、学习、集中注意力、思考"等认知学习过程受影响的群体。 高等教育与残疾协会 (AHEAD) 也随之发布指南,要求高校采取更为宽松的审核制度——更重视学生的个人感受,而不是仅依赖医学诊 断。 与此同时,诊断标准也在逐步放宽,2013年美国精神病学 ...
英伟达自毁CUDA门槛!15行Python写GPU内核,性能匹敌200行C++
量子位· 2025-12-08 12:00
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI GPU编程变天了。 英伟达发布最新版 CUDA 13.1 ,官方直接定性: 这是自2006年诞生以来最大的进步 。 核心变化是推出全新的 CUDA Tile编程模型 ,让开发者可以 用Python写GPU内核 ,15行代码就能达到200行CUDA C++代码的性能。 消息一出,芯片界传奇人物 Jim Keller 立即发问: 英伟达是不是亲手终结了CUDA的"护城河"?如果英伟达也转向Tile模型,AI内核将更容易移植到其他硬件上。 Jim Keller参与设计过AMD Zen架构、苹果A系列芯片、特斯拉自动驾驶芯片的"硅仙人",他的判断在行业里相当有分量。 那么问题来了:CUDA这次到底改了什么?为什么会被认为是"自毁长城"? GPU编程范式从"线程"到"瓦片" 要理解这次更新的意义,得先回顾一下传统CUDA编程有多折磨人。 过去20年,CUDA一直采用 SIMT(单指令多线程)模型 ,开发者写代码时,需要手动管理线程索引、线程块、共享内存布局、线程同步, 每一个细节都要自己操心。 想要充分利用GPU性能,特别是用上Tensor Core这类专用模块,更 ...
打工15年,被大厂裁4次了
量子位· 2025-12-07 19:00
文章核心观点 - AI技术引发的结构性失业正在重塑科技行业就业格局,企业倾向于用技术或懂AI的员工替代传统劳动力,导致大量岗位永久消失[30][31][38][39][40][41][51][57][59] - 面对行业剧变,科技从业者需转变观念并积极学习AI技能以适应新环境,部分人通过转型为“超级个体”或加入非传统科技公司找到了新的职业路径[69][70][74][76][78][82][83] 科技行业裁员现状与规模 - 2025年开年以来,已有超过200家科技公司宣布裁员,约11万名科技从业人员失去工作[31] - 具体案例包括:亚马逊在2025年10月裁员1.4万人[32];英特尔在2025年7月宣布裁员2.4万人,约占其员工总数的22%[33];微软在2025年5月和7月共裁员1.5万人[34] AI驱动裁员的经济学逻辑 - 当前失业主要是由技术变革引起的“结构性失业”,岗位需求因新技术发生根本性变化,难以挽回[38][39][40] - 企业决策依据是单位产出成本:当AI的单位技术成本远低于人类劳动的单位成本时,企业会选择技术替代[41][45][46] - AI具备主体性特征,能独立完成整段工作流程,企业在投入技术时无需按以往比例投入劳动力,导致工作岗位永久消失[49][50][51] 企业业绩与裁员并存的矛盾现象 - 亚马逊2025年第二季度销售额同比增长13%,达到1677亿美元,业绩超出预期,但仍在10月执行裁员计划[53][54] - 企业裁员并非因为暂时雇不起员工,而是根本不再需要那么多员工,AI被用于提高效率并减少员工总数[55][56][57] 从业者的应对与转型路径 - 短期应对策略是“团队重组”,用懂AI的员工替换不懂AI的员工[59] - 长期趋势催生了“超级个体”与“一人公司”的兴起,2024年美国新注册的初创企业中,有35%由单一创始人独立创立,该比例是2017年的两倍多[69][70] - 具体转型案例包括:前大厂员工开设24小时棋牌室并运营社群[67]、转型为旅游陪玩兼摄影师[67]、产品经理开设融合文创与社交的包子铺[68] - 主人公老李(Lee Givens)在失业半年后,通过恶补AI知识(如学习PyTorch等框架),最终在丰田子公司Woven by Toyota找到产品经理工作,年收入达六位数美元,高于其在Meta和苹果时期的收入[76][78][80]
实测完豆包Seedream 4.5,替我设计师朋友哭了
量子位· 2025-12-07 17:00
嘻疯 发自 凹非寺 量子位 | 公众号 QbitAI 豆包升级上新,火山引擎带着 图 像创作模型 Doubao-Seedream-4.5 来了。 新模型有三个主打点。 一是强化了 原 图保持能 力 ,最大化保持原图的人脸、光影与色调、画面细节,可以用来P图。 例如"只保留绿线中的人物,将其他角色都删掉": 再复杂一些,将白天变为黑夜: 二是重点强化了 多图组合生成能力 。 在官方展示中,输入8张参考图,并指定画面布局后,让它生成图画故事书封面: 童话故事书封面:小女孩与小狐狸站在发光森林小屋前,月亮巨大而梦幻,星尘在他们周围飘浮;萤火虫的光点点亮草地;小白花细致 点缀;雾气营造柔和深度;古铜色童话边框华丽包围整个场景;色调是蓝紫与暖金对撞;角色面部特征保持原图一致;整体梦幻、温 柔、魔法感强烈,适合作为儿童绘本封面。 把图片中的英文转成手写体中文: Seedream-4.5 能 精准执 行复杂指令,将多种元素精准识别提取出来 ,并自然融合: 同样地,让多个角色"拍"一张大合照: 模型也能生成无违和感的群像画面: 反过来,根据一张参考图,一次性生成6张海报,比例分别改成1:1、2:3、4:3、16:9、1:2、 ...
他们让万亿参数RL学会了「省着跑」,顺便砍掉九成算力
量子位· 2025-12-07 17:00
AI大模型竞争焦点转移 - 行业竞争焦点正从预训练和数据红利,转向强化学习(RL),RL正从“锦上添花”变为大模型进化的主战场 [1][2][3] - 证据包括:DeepSeek V3.2的RL训练算力投入已超过预训练的10%,且性能曲线仍在上升;OpenAI的o系列、Claude的推理能力及Gemini的多模态表现背后均有大规模RL支撑 [2][10] 万亿参数RL训练的成本挑战与突破 - 在万亿参数模型上进行全参数RL训练成本极高,需要上千张顶级GPU、训练周期数周,形成资源垄断,绝大多数团队无法负担 [4][11] - Mind Lab团队取得突破,实现了全球首个在1T参数模型上的LoRA高效强化学习训练,将GPU消耗降低90% [5] - 该方案并非简单的工程优化,而是训练范式的根本性转变,相关代码已由NVIDIA Megatron-Bridge和Seed verl官方合并并开源 [6] 技术方案:LoRA RL在万亿参数MoE模型上的实现 - 核心解法:采用LoRA进行参数高效适配,配合专为万亿参数MoE模型设计的混合并行引擎,将RL计算量降至十分之一且性能不打折 [13] - 在Kimi K2模型上的验证显示,仅使用64张NVIDIA H800 GPU即可完成万亿参数RL训练 [14] - 验证取得三项关键成果:1) GPU消耗仅为传统全参数RL的10%左右;2) 训练稳定收敛;3) 在提升特定任务表现的同时,保留了基座模型的通用能力 [18][19][20] 克服MoE架构下的技术难题 - 在MoE架构上应用LoRA RL面临三大挑战:路由不均衡、通信压力爆炸、并行布局复杂 [21][22] - Mind Lab的解决方案是设计了一套混合协同并行引擎,统一调度Tensor、Pipeline、Expert、Sequence四种并行方式,并将并行视为可调度资源 [26] - 针对训练与推理使用不同后端导致的策略不匹配问题,引入了截断重要性采样比率进行显式修正,以控制梯度方差 [29][30] “大先验+小LoRA”策略的经济性优势 - 实验对比了不同规模模型采用全参数RL与LoRA RL的效果,为公平比较,控制了总RL FLOPs、环境交互次数及奖励模型等变量 [36][40] - 使用“headroom-normalized”指标评估,结论显示:32B参数模型配合rank=8的LoRA,在相同RL计算预算下,获得的性能提升比例最大 [37] - 在域外任务GPQA上,32B+LoRA的迁移效果也最好,表明“大先验+小LoRA”策略比“小模型全参数RL”更划算,因为大模型已编码丰富先验知识,RL可在此基础上精修 [38][39] 配套技术创新:Memory Diffusion记忆机制 - Mind Lab提出名为“Memory Diffusion”的新记忆机制,灵感源于人类“智慧地遗忘”,通过“遮蔽-分配-重填”三步动态压缩轨迹记忆 [45][46][47] - 该方法时间复杂度为O(1),不改变模型架构,严格遵守上下文预算 [48] - 在Locomo基准测试上,该机制达到了93%的准确率,刷新了SOTA记录 [49] 研产共设理念与产品化成果 - Mind Lab提出“研产共设”理念,认为真实产品是天然的RL环境,能提供持续、接地气的奖励信号,如用户使用模式、任务完成率等,有助于避免奖励模型被“破解” [50][51][54] - 在前端代码生成任务实验中,使用真实人类反馈训练的奖励模型显著优于仅预训练的模型,基于此的RL也显著优于监督微调 [56] - 技术已落地于Macaron AI产品,使其Mini-app生成速度从20分钟提升至2分钟,速度提升10倍,并上线了新功能 [57] 行业展望与Mind Lab定位 - 行业观点认为,以“算力规模化”为核心的预训练时代正在走向终结,下一个时代将是“经验智能”时代,智能需在真实世界中成长 [58][59][61] - Mind Lab定位为全球首个专门为“后预训练时代”而生的研究实验室,其核心命题是“智能如何在真实世界中成长”,主张下一个时代属于能通过交互不断更新的“心智” [60][61] - 团队核心研究方向包括:1) 基础设施;2) 超越预训练;3) 开放与可复现 [65]
下周三!量子位的这件大事就要来了|MEET2026
量子位· 2025-12-07 12:35
大会概览 - 会议名称为MEET2026智能未来大会,主题为“共生无界,智启未来”,关注AI技术如何穿透产业、学科与场景边界 [39] - 大会将于2025年12月10日在北京金茂万丽酒店举办,线下报名通道已开启 [24][37][39] - 大会是业界最具代表性的年度智能商业峰会之一,每年获数千万媒体曝光,吸引千位线下观众与超300万名在线观众 [36] 核心议题与亮点 - 大会将深入探讨生成式AI与智能体等年度最热议题,包括大语言模型、多模态、具身智能、自动驾驶、云计算等主流AI相关领域 [3][5] - 设置两场高浓度对话:一场是文远知行创始人韩旭与量子位总编辑李根关于“第一批自动驾驶创业者的第二个八年”的GenAI Talk [7][8][11] - 另一场是题为“距离AI Agent革新千行百业还有多久”的圆桌讨论,汇聚小宿科技、联汇科技、蚂蚁百宝箱等平台方、技术方与应用方嘉宾 [13][16] - 大会将发布《2025年度AI十大趋势报告》与《2025人工智能年度榜单》,前者梳理年度进展与预见趋势,后者从企业、人物、产品三大维度筛选行业领军者 [35][47] 嘉宾阵容 - 大会累计邀请近三十位重量级嘉宾,覆盖学术界、产业界与前沿创业一线 [17] - 学术界嘉宾包括清华大学张亚勤院士、孙茂松教授,智源研究院王仲远院长,交大高金朱宁教授等 [1][17] - 产业界阵容覆盖芯片、云、模型到终端的全栈力量,包括百度、小米、商汤、蚂蚁、谷歌云、亚马逊云科技、高通、昆仑万维、潞晨科技、PPIO、中关村科金等代表性企业 [1][21] - 新生力量包括卓世科技、太初元碁、RockAI、自变量机器人、光轮智能、云徙科技、灵心巧手等前沿创业公司 [28] 会议议程要点 - 上午议程包括张亚勤院士谈“人工智能+”趋势、百度王颖谈AI打造超级智能体、智源王仲远谈AI从数字世界迈向物理世界、高通谈混合AI、亚马逊云科技谈Agentic AI等 [41] - 上午议程还包括中关村科金谈企业智能体、Google Cloud谈赋能初创企业出海、交大高金朱宁教授进行AI时代的经济学思考、卓世科技谈行业大模型破局等 [42] - 上午以文远知行韩旭的GenAI Talk对话及“2025人工智能年度榜单”发布收尾 [42] - 下午议程聚焦多模态与智能体,包括昆仑万维、商汤、小米、PPIO、潞晨科技、太初元碁、RockAI、百度智能云、自变量机器人、光轮智能、灵心巧手等公司的技术分享与应用探讨 [43][44][45] - 下午压轴环节为孙茂松教授谈生成式AI前沿态势,以及“距离AI Agent革新千行百业还有多久”的前沿圆桌讨论,最后发布《2025年度AI十大趋势报告》 [45]