量子位
搜索文档
1.3亿美元!LiblibAI拿下国内AI应用赛道年度最大融资
量子位· 2025-10-23 13:18
融资事件与行业意义 - Liblib AI完成1.3亿美元B轮融资,由红杉中国、CMC资本及一战略投资方联合领投,老股东均超额增持 [1] - 该融资是2025年迄今为止国内资本市场AI应用赛道最大的一笔融资 [2] - 此轮融资标志着AI投资热点正从底层模型转向应用层 [2] 公司业务与市场地位 - Liblib AI是中国最大的多模态模型与创作社区,平台整合了图像、视频、3D、LoRA训练等多模态能力 [5] - 公司覆盖从灵感生成、视觉设计到动态视频制作的完整AI工作流,孵化了超过2000万AI创作者 [5] - 在AI基础模型趋同背景下,公司凭借“工具集成+社区生态”的战略路径脱颖而出 [7] 产品战略与版本更新 - 平台通过模型轻量级训练与创作者激励机制,形成了独特的模型-场景-创作者共创生态 [7] - 2025年10月发布2.0版本,将“聚合工具”升级为“AI专业创作工作室”,强化视频生成能力,支持多模型生成与专业级特效模板 [7] - 新版本实现从灵感到成片的端到端体验,为AI视频制作打开了新标准 [7] 未来发展计划 - 融资完成后,Liblib AI将加速全球化布局,打造全球创作者共创的多模态内容生态 [9]
大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘
量子位· 2025-10-23 13:18
ExGRPO团队 投稿 量子位 | 公众号 QbitAI 大模型在强化学习过程中,终于知道什么经验更宝贵了! 来自上海人工智能实验室、澳门大学、南京大学和香港中文大学的研究团队,最近提出了 一套经验管理和学习框架ExGRPO —— 通过科学地识别、存储、筛选和学习有价值的经验,让大模型在优化推理能力的道路上,走得更稳、更快、更远。 实验结果显示,与传统的在线策略RLVR (基于可验证奖励的强化学习) 方法相比,ExGRPO在不同基准上均带来了一定程度的性能提升。 尤其在一些极具挑战性的任务 (如AIME数学竞赛题) 上,提升效果更为明显,证明了ExGRPO在攻克复杂推理难题上的有效性。 而且该研究也揭示了一些有趣的现象,比如滚雪球效应。 不过在展开之前,我们先来回答一个核心问题—— 大模型推理的下一步,为什么我们需要"经验驱动"的训练方法? 2025年初以来,赋能大模型推理能力的技术路线以基于可验证奖励的强化学习 (Reinforcement Learning from Verifiable Rewards) 为 主导。 简单来说,就是让模型像个学生一样,不断地"刷题" (生成推理步骤) ,然后由"判卷老师" ...
顶会直聘!大厂ICCV现场玩出新模式,还是鹅会玩
量子位· 2025-10-23 13:18
鱼羊 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 羡慕现在搞AI的大家。 去一下学术顶会,工作机会现场就来了。 是的,大厂AI招聘的风,已经吹到ICCV 2025。 之前吧,印象里大厂的顶会摊位,向来是科研成果的秀场。 而今年的ICCV一逛,我们还真看到了点不一样的花活—— 顶会直聘 。 比如鹅厂,来了 好多核心业务大佬直接在展台"坐班" 。不仅现场跟学生们展开交流技术,连"进厂指南"都聊起来了(手动狗头)。 还不是泛泛而聊,路过一听,都是什么"技术路线踩了哪些坑"、"A方案为什么比B方案跑得快"、"快发个简历"…… 说起来,腾讯对这次ICCV可谓重磅投入,单从展台看,就是 全场规模第二大 的存在。展示技术实力这一块,更是当家AI业务全员出动,多 领域论文库库发。 但你要说单纯秀技术肌肉吧,又好像不是那么回事,稍微一琢磨,就发觉这哪是单纯来参加顶会,也是在 组团抢先招人 了…… △ 腾讯杰出科学家/青云导师Shanying 吸睛先搭台,第一步:ICCV展台全面升级 想要摸清大厂的脑回路,咱们先从这全场第二大展台看起。不得不说,鹅厂"壕"气出手,视觉上就很吸睛。 内容上,腾讯也下足了功夫。这一回,当家 ...
太疯狂了!Meta裁员裁到田渊栋头上,连组员一锅端
量子位· 2025-10-23 11:52
很疯狂,Meta AI裁员能裁到 田渊栋 头上,而且是整组整组的裁。 田渊栋在Meta工作已超过十年,现任 FAIR研究科学家总监 (Research Scientist Director),他领导开发了早于AlphaGo的围棋AI"Dark Forest",近期在大模型领域也推出了整合快慢思考的Dualformer模型、以及开创性的"连续思维链"(Coconut)范式。 这样一位大佬突然面临找工作了,OpenAI以及各路初创公司反应都很快,直接开始在评论区排队抢人。 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI | 10:00 | | | --- | --- | | | Dar Mehta � @dar mehta · 25分钟 | | | Sorry to hear, would love to connect, we're | | | building Al physics models to predict and | | | control the weather, dm me | | | 11 1 1294 | | | JimZ > @moonares . 6分钟 | | | My com ...
中国模型打服硅谷:Airbnb联创CEO感叹又快又好又便宜!把ChatGPT合作都拒了
量子位· 2025-10-23 11:52
中国大模型全球竞争力 - 中国大模型技术实力获得全球企业认可,爱彼迎CEO公开表示很大程度上依赖阿里巴巴的Qwen模型,认为其非常好、速度快且便宜[2] - 当AI技术红利期逐渐过去,成本、效率、稳定性等实际指标成为企业选择模型的关键因素[5] - 中国大模型在成本、效率和质量方面展现出优势,正越来越受到全球企业的认可[6][10] 阿里巴巴Qwen模型应用案例 - 爱彼迎使用Qwen等13个AI模型组成"模型矩阵"上线AI客服Agent,使依赖人工客服的用户量下降15%,平均问题解决时间从近三小时压缩至6秒[8][9] - Qwen在成本、效率和质量三重考验下表现抢眼,被评价为"又好又快又便宜"[10][11] - 开源模型允许企业自行托管并使用公司数据训练,这被认为是所有公司最终会采用的人工智能使用方式[14] Kimi K2模型性能表现 - Kimi K2开源模型在基准测试中表现优异,比GPT-5快5倍且准确率高出50%[16] - 具体测试数据显示:Kimi K2仅需2分钟运行时间且准确率超60%,而GPT-5耗时10分钟准确率不足40%,Claude Sonnet-4.5耗时8分钟准确率不足50%[17][20] - Kimi K2已获得多家知名编程和Agent应用接入,包括Cline、Cursor、Visual Studio Code等[21] DeepSeek模型技术创新 - DeepSeek R1成果获得Nature封面认证,被赞为"首个经历同行评审的大型语言模型"[22] - DeepSeek-V3.2-Exp引入新的注意力机制DeepSeek Sparse Attention,开源了更高效的GPU算子[24] - DeepSeek-OCR模型以3B规模实现指数级效能变革,在硅谷引发热议并被认为开源了谷歌Gemini的商业机密[26] 中国模型全球应用生态 - 除Qwen外,Kimi、DeepSeek、GLM等多款中国模型都在凭实力全球圈粉[7] - 中国模型以"开放"为旗帜,在全球AI竞赛中开辟出独特路径,成为真正意义上的"Open"标准[29][30] - 国外初创公司GlueAI创始人证实团队频繁使用Kimi K2,显示中国模型的国际影响力[19]
一个指令误导智能模型!北航等首创3D语义攻击框架,成功率暴涨119%
量子位· 2025-10-23 11:52
核心观点 - 北京航空航天大学与中关村实验室团队提出全新框架InSUR,旨在解决人工智能模型安全对齐中的语义约束对抗样本生成问题 [2] - InSUR框架基于指令不确定性约简思想,实现独立于具体任务与模型的对立样本生成,其工作已入选NeurIPS 2025 [2] - 该框架首次实现了3D语义约束对抗样本生成,为自动驾驶、具身智能等安全关键系统生成高逼真度对抗测试场景提供了新思路 [6][45] 技术框架与创新点 - InSUR框架从“采样方法”、“任务建模”、“生成器评估”三个维度突破,实现“可迁移、可适应、高效能验证”的SemanticAE生成 [9] - 针对人类指令中固有的不确定性导致的三大痛点(指称多样性、描述不完整性、边界模糊性),框架提供了相应解决方案 [8][14] - 框架整体采用扩散模型实现,并在对抗采样器、上下文编码和生成器评估上引入新机制 [11] 采样方法创新 - 设计了残差引导的对抗DDIM采样器(ResAdv-DDIM),解决扩散模型对抗采样问题 [12] - 通过“粗预测语言引导的采样过程”,提前锁定对抗优化方向,避免不同采样步骤中对抗特征优化方向反复跳跃 [12][15] - 加入L2范数约束,确保生成样本不偏离指令语义,显著提升对抗迁移能力与鲁棒性 [16][20] 任务建模突破 - 引入任务目标嵌入策略,实现更好的2D语义约束对抗样本生成,并首次实现3D语义约束对抗样本生成 [22] - 在2D生成中,通过差异化引导掩码控制扩散模型生成内容的语义引导空间分布 [23][26] - 在3D生成中,整合可微分渲染管线,包含3D高斯泼溅渲染器、可微渲染器和ResAdv-DDIM嵌入 [27][29][31] 评估体系构建 - 提供自动评估的任务构建方法,利用WordNet分类体系提升抽象层次来重新构建评估标签 [28][32] - 提出非对抗性样本生成子任务,要求生成对抗样本同时生成可被正确分类的“范例”样本 [33] - 定义相对攻击成功率和语义差异度指标,若在两个指标上都获得高分可充分证明生成器性能 [34] 实验结果 - 在2D SemanticAE上,InSUR在4种代理模型和2种任务设置中,所有目标模型至少实现1.19倍平均ASR提升和1.08倍最小ASR提升 [40] - 在3D SemanticAE生成中,InSUR方法攻击成功率达到92.2%,而非对抗性基线仅为45.1% [42] - 可视化结果表明InSUR生成的对抗样本在迁移攻击性、真实性方面展现出显著优越性 [43][44] 应用前景 - InSUR设计与具体模型和任务解耦,展现出良好可扩展性,为测试时的红队评估框架提供新思路 [45] - 可作为高质量对抗训练数据生成器,利用扩散模型生成的“困难样本”反向提升模型鲁棒性 [45] - 未来可与现有3D场景生成管线集成,应用于自动驾驶、具身智能体等安全关键系统 [45][46]
不改模型也能提升推理性能?ICLR投稿提出测试时扩展新范式OTV
量子位· 2025-10-23 08:08
ICLR 2026 投稿 量子位 | 公众号 QbitAI 近年来,大语言模型在各类任务上表现出色,但幻觉、逻辑错误、推理漏洞等问题仍屡见不鲜。这促使研究者持续探索提升模型输出可靠性的 新路径。现有主流范式各有优势,也存在局限。 有没有可能在 不改动原始模型结构和参数 的前提下,实现对推理过程的"实时自主监控"? ICLR 2026一篇投稿论文提出了一个全新思路:单token验证(One-Token Verification,OTV),这是一种测试时扩展的新机制,让模型 能"边推理,边判断自己是否推理正确"。 目前主流范式优缺点如下: LoRA微调: 作为当前主流的参数高效微调手段,虽然无需全参数训练、便于部署,但往往依赖详细的监督数据,且仍会引发"遗忘效应"。 通过对模型已生成结果进行质量筛选,可增强输出可信度,但往往滞后发生,难以及时纠偏模型的思路,且无法窥探模型的内部推理过 程。 在面对复杂推理任务时,单一路径生成往往难以稳定产出正确答案。为此,研究者们近年来提出了 并行思考(Parallel Thinking) 的推理 框架:让语言模型同时生成多条推理路径,再通过一定机制进行甄别筛选。 OTV正是构建 ...
Meta AI大裁600人,亚历山大王操刀重点砍向LeCun团队
量子位· 2025-10-23 08:08
公司重组与裁员 - Meta AI部门进行大规模重组,计划从超级智能实验室裁掉600名员工[1] - 由新任首席AI官亚历山大王操刀,旨在解决部门过于官僚化的问题,以创建更敏捷的运营模式[5] - 裁员涉及FAIR实验室、AI产品部门和基础设施部门,而新成立的TBD Lab则毫发无损且仍在招人[1][2] 组织架构与战略调整 - 公司成立新组织TBD Lab,该部门不仅未受裁员影响,还从Thinking Machines和OpenAI等公司积极招募人才[2] - 从2023年初至近期,Llama 2、3和4项目由GenAI组织负责,现已移交至TBD Lab管理[12] - 公司实施新政策,要求FAIR实验室对外发表论文前必须经过TBD Lab审核,若论文价值大则需优先推动成果在产品中落地[9] 关键人物动态与观点 - 公司CEO对AI进展感到焦虑,担心近期未有突破或性能改进[8] - 新任首席AI官对公司的模型训练、计算计划和产品构建表示兴奋,并对迈向超级智能的道路充满信心[8] - FAIR首席科学家Yann LeCun澄清自己与Llama项目无关,仅间接参与Llama-1并推动Llama-2开源,其工作重点在于下一代超越大语言模型的AI系统[12] - 新论文审核政策对坚持学术自由的LeCun造成冲击,有消息称其可能因此辞去FAIR首席科学家职务[9][10]
用激光给芯片散热,摩尔定律天花板盖不住了
量子位· 2025-10-23 08:08
鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 风冷、液冷OUT!芯片散热有了新方法——用 激光 。 现在热量不仅仅可以"移动",还能直接"消失"。 嘶,听起来是不是有点反物理学常识?却正在成为可能。 初创公司Maxwell Labs最新提出的 光子冷却 方法,可以直接将热量转化成光,并在芯片内部去除。 其中由于吸收的能量远高于发射能量,能量的差异往往导致材料升温,但换言之,如果采取一定手段,吸收的是低能光、发射的变成高能光, 那么材料就会降温。 而这种现象在物理学中被称为 反斯托克斯冷却 :对于照射在特殊材料上的窄范围激光,离子可以有效地吸收入射光,并结合材料晶格振动 (声子) 触发发射更高能量的光。 不过期间需要注意尽快让发射光逸出,否则会被再次吸收,导致温度回升。 借助该原理,Maxwell Labs将其集成到 薄膜芯片级 光子冷板上,从而实现芯片的光子冷却。 无需再像传统方法一样整块芯片降温,光子冷却精确瞄准芯片热点,效率提升好几个level。 而且该技术一旦彻底成熟,不仅单颗芯片的可用功率实现大幅提升、3D芯片堆叠散热问题得以解决,甚至也将有利于建立大规模数据中心。 言归正传,具体细节如下: ...
让LLM扔块石头,它居然造了个投石机
量子位· 2025-10-22 23:27
BesiegeField团队 投稿 量子位 | 公众号 QbitAI 让LLM扔块石头,结果它发明了投石机? 大模型接到任务:"造一个能把石头扔远的结构。" 谁成想,它真的开始动手造了,在一个真实的物理仿真世界里,一边搭零件,一边看效果,一边修改。 最后,它造的投石机,把石头扔了出去。 这就是来自港中大(深圳)、港中大的研究团队(Wenqian Zhang, Weiyang Liu, Zhen Liu)带来的最新研究—— 《Agentic Design of Compositional Machines》 。 他们推出了一个叫 BesiegeField 的新平台,它就像一个给大模型的"机械工程师训练场",专门测试AI能不能像人一样,从零开始设计并造出 能动的、有功能的复杂机器。 这还没完。 BesiegeField支持上百次的并行实验 ,一旦引入 强化学习(Reinforcement Learning) ,大模型就能 "自我进化" :从反馈 中调整策略,逐步学会结构设计的物理逻辑,最终学会如何 "造出能动的结构" 。 说白了,就是把机械结构限定在"用标准零件组装"这个范围里。每个零件(比如支架、关节)都有标准 ...