量子位 - 财报，业绩电话会，研报，新闻

量子位

搜索文档

量子位· 2025-10-23 13:18

融资事件与行业意义 - Liblib AI完成1.3亿美元B轮融资，由红杉中国、CMC资本及一战略投资方联合领投，老股东均超额增持 [1] - 该融资是2025年迄今为止国内资本市场AI应用赛道最大的一笔融资 [2] - 此轮融资标志着AI投资热点正从底层模型转向应用层 [2] 公司业务与市场地位 - Liblib AI是中国最大的多模态模型与创作社区，平台整合了图像、视频、3D、LoRA训练等多模态能力 [5] - 公司覆盖从灵感生成、视觉设计到动态视频制作的完整AI工作流，孵化了超过2000万AI创作者 [5] - 在AI基础模型趋同背景下，公司凭借“工具集成+社区生态”的战略路径脱颖而出 [7] 产品战略与版本更新 - 平台通过模型轻量级训练与创作者激励机制，形成了独特的模型-场景-创作者共创生态 [7] - 2025年10月发布2.0版本，将“聚合工具”升级为“AI专业创作工作室”，强化视频生成能力，支持多模型生成与专业级特效模板 [7] - 新版本实现从灵感到成片的端到端体验，为AI视频制作打开了新标准 [7] 未来发展计划 - 融资完成后，Liblib AI将加速全球化布局，打造全球创作者共创的多模态内容生态 [9]

大模型推理学习新范式！ExGRPO框架：从盲目刷题到聪明复盘

量子位· 2025-10-23 13:18

ExGRPO团队投稿量子位 | 公众号 QbitAI 大模型在强化学习过程中，终于知道什么经验更宝贵了！来自上海人工智能实验室、澳门大学、南京大学和香港中文大学的研究团队，最近提出了一套经验管理和学习框架ExGRPO —— 通过科学地识别、存储、筛选和学习有价值的经验，让大模型在优化推理能力的道路上，走得更稳、更快、更远。实验结果显示，与传统的在线策略RLVR （基于可验证奖励的强化学习）方法相比，ExGRPO在不同基准上均带来了一定程度的性能提升。尤其在一些极具挑战性的任务（如AIME数学竞赛题）上，提升效果更为明显，证明了ExGRPO在攻克复杂推理难题上的有效性。而且该研究也揭示了一些有趣的现象，比如滚雪球效应。不过在展开之前，我们先来回答一个核心问题—— 大模型推理的下一步，为什么我们需要"经验驱动"的训练方法？ 2025年初以来，赋能大模型推理能力的技术路线以基于可验证奖励的强化学习（Reinforcement Learning from Verifiable Rewards）为主导。简单来说，就是让模型像个学生一样，不断地"刷题" （生成推理步骤），然后由"判卷老师" ...

顶会直聘！大厂ICCV现场玩出新模式，还是鹅会玩

量子位· 2025-10-23 13:18

鱼羊闻乐发自凹非寺量子位 | 公众号 QbitAI 羡慕现在搞AI的大家。去一下学术顶会，工作机会现场就来了。是的，大厂AI招聘的风，已经吹到ICCV 2025。之前吧，印象里大厂的顶会摊位，向来是科研成果的秀场。而今年的ICCV一逛，我们还真看到了点不一样的花活—— 顶会直聘。比如鹅厂，来了好多核心业务大佬直接在展台"坐班" 。不仅现场跟学生们展开交流技术，连"进厂指南"都聊起来了（手动狗头）。还不是泛泛而聊，路过一听，都是什么"技术路线踩了哪些坑"、"A方案为什么比B方案跑得快"、"快发个简历"…… 说起来，腾讯对这次ICCV可谓重磅投入，单从展台看，就是全场规模第二大的存在。展示技术实力这一块，更是当家AI业务全员出动，多领域论文库库发。但你要说单纯秀技术肌肉吧，又好像不是那么回事，稍微一琢磨，就发觉这哪是单纯来参加顶会，也是在组团抢先招人了…… △ 腾讯杰出科学家/青云导师Shanying 吸睛先搭台，第一步：ICCV展台全面升级想要摸清大厂的脑回路，咱们先从这全场第二大展台看起。不得不说，鹅厂"壕"气出手，视觉上就很吸睛。内容上，腾讯也下足了功夫。这一回，当家 ...

太疯狂了！Meta裁员裁到田渊栋头上，连组员一锅端

量子位· 2025-10-23 11:52

很疯狂，Meta AI裁员能裁到田渊栋头上，而且是整组整组的裁。田渊栋在Meta工作已超过十年，现任 FAIR研究科学家总监（Research Scientist Director），他领导开发了早于AlphaGo的围棋AI"Dark Forest"，近期在大模型领域也推出了整合快慢思考的Dualformer模型、以及开创性的"连续思维链"（Coconut）范式。这样一位大佬突然面临找工作了，OpenAI以及各路初创公司反应都很快，直接开始在评论区排队抢人。梦晨发自凹非寺量子位 | 公众号 QbitAI | 10:00 | | | --- | --- | | | Dar Mehta � @dar mehta · 25分钟 | | | Sorry to hear, would love to connect, we're | | | building Al physics models to predict and | | | control the weather, dm me | | | 11 1 1294 | | | JimZ > @moonares . 6分钟 | | | My com ...

Meta Platforms(US:META)

人工智能

Artificial Intelligence

Artificial Intelligence

Dark Forest

Dualformer

Coconut

中国模型打服硅谷：Airbnb联创CEO感叹又快又好又便宜！把ChatGPT合作都拒了

量子位· 2025-10-23 11:52

中国大模型全球竞争力 - 中国大模型技术实力获得全球企业认可，爱彼迎CEO公开表示很大程度上依赖阿里巴巴的Qwen模型，认为其非常好、速度快且便宜[2] - 当AI技术红利期逐渐过去，成本、效率、稳定性等实际指标成为企业选择模型的关键因素[5] - 中国大模型在成本、效率和质量方面展现出优势，正越来越受到全球企业的认可[6][10] 阿里巴巴Qwen模型应用案例 - 爱彼迎使用Qwen等13个AI模型组成"模型矩阵"上线AI客服Agent，使依赖人工客服的用户量下降15%，平均问题解决时间从近三小时压缩至6秒[8][9] - Qwen在成本、效率和质量三重考验下表现抢眼，被评价为"又好又快又便宜"[10][11] - 开源模型允许企业自行托管并使用公司数据训练，这被认为是所有公司最终会采用的人工智能使用方式[14] Kimi K2模型性能表现 - Kimi K2开源模型在基准测试中表现优异，比GPT-5快5倍且准确率高出50%[16] - 具体测试数据显示：Kimi K2仅需2分钟运行时间且准确率超60%，而GPT-5耗时10分钟准确率不足40%，Claude Sonnet-4.5耗时8分钟准确率不足50%[17][20] - Kimi K2已获得多家知名编程和Agent应用接入，包括Cline、Cursor、Visual Studio Code等[21] DeepSeek模型技术创新 - DeepSeek R1成果获得Nature封面认证，被赞为"首个经历同行评审的大型语言模型"[22] - DeepSeek-V3.2-Exp引入新的注意力机制DeepSeek Sparse Attention，开源了更高效的GPU算子[24] - DeepSeek-OCR模型以3B规模实现指数级效能变革，在硅谷引发热议并被认为开源了谷歌Gemini的商业机密[26] 中国模型全球应用生态 - 除Qwen外，Kimi、DeepSeek、GLM等多款中国模型都在凭实力全球圈粉[7] - 中国模型以"开放"为旗帜，在全球AI竞赛中开辟出独特路径，成为真正意义上的"Open"标准[29][30] - 国外初创公司GlueAI创始人证实团队频繁使用Kimi K2，显示中国模型的国际影响力[19]

一个指令误导智能模型！北航等首创3D语义攻击框架，成功率暴涨119%

量子位· 2025-10-23 11:52

核心观点 - 北京航空航天大学与中关村实验室团队提出全新框架InSUR，旨在解决人工智能模型安全对齐中的语义约束对抗样本生成问题 [2] - InSUR框架基于指令不确定性约简思想，实现独立于具体任务与模型的对立样本生成，其工作已入选NeurIPS 2025 [2] - 该框架首次实现了3D语义约束对抗样本生成，为自动驾驶、具身智能等安全关键系统生成高逼真度对抗测试场景提供了新思路 [6][45] 技术框架与创新点 - InSUR框架从“采样方法”、“任务建模”、“生成器评估”三个维度突破，实现“可迁移、可适应、高效能验证”的SemanticAE生成 [9] - 针对人类指令中固有的不确定性导致的三大痛点（指称多样性、描述不完整性、边界模糊性），框架提供了相应解决方案 [8][14] - 框架整体采用扩散模型实现，并在对抗采样器、上下文编码和生成器评估上引入新机制 [11] 采样方法创新 - 设计了残差引导的对抗DDIM采样器（ResAdv-DDIM），解决扩散模型对抗采样问题 [12] - 通过“粗预测语言引导的采样过程”，提前锁定对抗优化方向，避免不同采样步骤中对抗特征优化方向反复跳跃 [12][15] - 加入L2范数约束，确保生成样本不偏离指令语义，显著提升对抗迁移能力与鲁棒性 [16][20] 任务建模突破 - 引入任务目标嵌入策略，实现更好的2D语义约束对抗样本生成，并首次实现3D语义约束对抗样本生成 [22] - 在2D生成中，通过差异化引导掩码控制扩散模型生成内容的语义引导空间分布 [23][26] - 在3D生成中，整合可微分渲染管线，包含3D高斯泼溅渲染器、可微渲染器和ResAdv-DDIM嵌入 [27][29][31] 评估体系构建 - 提供自动评估的任务构建方法，利用WordNet分类体系提升抽象层次来重新构建评估标签 [28][32] - 提出非对抗性样本生成子任务，要求生成对抗样本同时生成可被正确分类的“范例”样本 [33] - 定义相对攻击成功率和语义差异度指标，若在两个指标上都获得高分可充分证明生成器性能 [34] 实验结果 - 在2D SemanticAE上，InSUR在4种代理模型和2种任务设置中，所有目标模型至少实现1.19倍平均ASR提升和1.08倍最小ASR提升 [40] - 在3D SemanticAE生成中，InSUR方法攻击成功率达到92.2%，而非对抗性基线仅为45.1% [42] - 可视化结果表明InSUR生成的对抗样本在迁移攻击性、真实性方面展现出显著优越性 [43][44] 应用前景 - InSUR设计与具体模型和任务解耦，展现出良好可扩展性，为测试时的红队评估框架提供新思路 [45] - 可作为高质量对抗训练数据生成器，利用扩散模型生成的“困难样本”反向提升模型鲁棒性 [45] - 未来可与现有3D场景生成管线集成，应用于自动驾驶、具身智能体等安全关键系统 [45][46]

不改模型也能提升推理性能？ICLR投稿提出测试时扩展新范式OTV

量子位· 2025-10-23 08:08

ICLR 2026 投稿量子位 | 公众号 QbitAI 近年来，大语言模型在各类任务上表现出色，但幻觉、逻辑错误、推理漏洞等问题仍屡见不鲜。这促使研究者持续探索提升模型输出可靠性的新路径。现有主流范式各有优势，也存在局限。有没有可能在不改动原始模型结构和参数的前提下，实现对推理过程的"实时自主监控"？ ICLR 2026一篇投稿论文提出了一个全新思路：单token验证（One-Token Verification，OTV），这是一种测试时扩展的新机制，让模型能"边推理，边判断自己是否推理正确"。目前主流范式优缺点如下： LoRA微调：作为当前主流的参数高效微调手段，虽然无需全参数训练、便于部署，但往往依赖详细的监督数据，且仍会引发"遗忘效应"。通过对模型已生成结果进行质量筛选，可增强输出可信度，但往往滞后发生，难以及时纠偏模型的思路，且无法窥探模型的内部推理过程。在面对复杂推理任务时，单一路径生成往往难以稳定产出正确答案。为此，研究者们近年来提出了并行思考（Parallel Thinking）的推理框架：让语言模型同时生成多条推理路径，再通过一定机制进行甄别筛选。 OTV正是构建 ...

大语言模型推理性能提升

单Token验证（OTV）

并行思考（Parallel Thinking）

可验证奖励强化学习（RLVR）

Artificial Intelligence

单Token验证（OTV）框架

大语言模型推理性能提升

单Token验证（OTV）

并行思考（Parallel Thinking）

可验证奖励强化学习（RLVR）

Artificial Intelligence

单Token验证（OTV）框架

Meta AI大裁600人，亚历山大王操刀重点砍向LeCun团队

量子位· 2025-10-23 08:08

公司重组与裁员 - Meta AI部门进行大规模重组，计划从超级智能实验室裁掉600名员工[1] - 由新任首席AI官亚历山大王操刀，旨在解决部门过于官僚化的问题，以创建更敏捷的运营模式[5] - 裁员涉及FAIR实验室、AI产品部门和基础设施部门，而新成立的TBD Lab则毫发无损且仍在招人[1][2] 组织架构与战略调整 - 公司成立新组织TBD Lab，该部门不仅未受裁员影响，还从Thinking Machines和OpenAI等公司积极招募人才[2] - 从2023年初至近期，Llama 2、3和4项目由GenAI组织负责，现已移交至TBD Lab管理[12] - 公司实施新政策，要求FAIR实验室对外发表论文前必须经过TBD Lab审核，若论文价值大则需优先推动成果在产品中落地[9] 关键人物动态与观点 - 公司CEO对AI进展感到焦虑，担心近期未有突破或性能改进[8] - 新任首席AI官对公司的模型训练、计算计划和产品构建表示兴奋，并对迈向超级智能的道路充满信心[8] - FAIR首席科学家Yann LeCun澄清自己与Llama项目无关，仅间接参与Llama-1并推动Llama-2开源，其工作重点在于下一代超越大语言模型的AI系统[12] - 新论文审核政策对坚持学术自由的LeCun造成冲击，有消息称其可能因此辞去FAIR首席科学家职务[9][10]

Meta Platforms(US:META)

超级智能

Artificial Intelligence

Llama

超级智能

Artificial Intelligence

Llama

用激光给芯片散热，摩尔定律天花板盖不住了

量子位· 2025-10-23 08:08

鹭羽发自凹非寺量子位 | 公众号 QbitAI 风冷、液冷OUT！芯片散热有了新方法——用激光。现在热量不仅仅可以"移动"，还能直接"消失"。嘶，听起来是不是有点反物理学常识？却正在成为可能。初创公司Maxwell Labs最新提出的光子冷却方法，可以直接将热量转化成光，并在芯片内部去除。其中由于吸收的能量远高于发射能量，能量的差异往往导致材料升温，但换言之，如果采取一定手段，吸收的是低能光、发射的变成高能光，那么材料就会降温。而这种现象在物理学中被称为反斯托克斯冷却：对于照射在特殊材料上的窄范围激光，离子可以有效地吸收入射光，并结合材料晶格振动（声子）触发发射更高能量的光。不过期间需要注意尽快让发射光逸出，否则会被再次吸收，导致温度回升。借助该原理，Maxwell Labs将其集成到薄膜芯片级光子冷板上，从而实现芯片的光子冷却。无需再像传统方法一样整块芯片降温，光子冷却精确瞄准芯片热点，效率提升好几个level。而且该技术一旦彻底成熟，不仅单颗芯片的可用功率实现大幅提升、3D芯片堆叠散热问题得以解决，甚至也将有利于建立大规模数据中心。言归正传，具体细节如下： ...

量子位· 2025-10-22 23:27

BesiegeField团队投稿量子位 | 公众号 QbitAI 让LLM扔块石头，结果它发明了投石机？大模型接到任务："造一个能把石头扔远的结构。" 谁成想，它真的开始动手造了，在一个真实的物理仿真世界里，一边搭零件，一边看效果，一边修改。最后，它造的投石机，把石头扔了出去。这就是来自港中大（深圳）、港中大的研究团队（Wenqian Zhang, Weiyang Liu, Zhen Liu）带来的最新研究—— 《Agentic Design of Compositional Machines》。他们推出了一个叫 BesiegeField 的新平台，它就像一个给大模型的"机械工程师训练场"，专门测试AI能不能像人一样，从零开始设计并造出能动的、有功能的复杂机器。这还没完。 BesiegeField支持上百次的并行实验，一旦引入强化学习（Reinforcement Learning），大模型就能 "自我进化" ：从反馈中调整策略，逐步学会结构设计的物理逻辑，最终学会如何 "造出能动的结构" 。说白了，就是把机械结构限定在"用标准零件组装"这个范围里。每个零件（比如支架、关节）都有标准 ...