Workflow
量子位
icon
搜索文档
中科闻歌完成新一轮战略融资,引领企业级人工智能技术发展
量子位· 2025-06-09 13:24
允中 发自 凹非寺 量子位 | 公众号 QbitAI 近日,专注于决策智能的企业级AI服务商 中科 闻歌宣布 完成新一轮战略融资 , 投资人为 北京市石景山区现代创新产业发展基金有限公司 (以下简称石景山区产业基金) 。 本轮融资 将主要用于自研决策 智能操作系统 DIOS的研发投入和市场推广 ,加速企业级人 工智能技术发展和商业落地进程。 石景山区产业基金表示,此次投资不仅是对中科闻歌在决策智能领域技术实力与商业价值的 高度认可,更标志着双方将在人工智能技术落地、产业生态构建等方面展开深度合作,共同 推动石景山区"2+4+4"现代化产业体系建设。 中科闻歌成立于2017年 ,创始团队及核心成员源自中国科学院自动化所,拥有十余年大数 据与人工智能技术的理论、研发及应用积累。 公司现有员工500余人,业务布局全国。公司已累计完成超十亿元融资,此前的投资机构包 括北京市人工智能产业投资基金、国开金融、中网投、深创投、中关村科学城、央视融媒体 基金、中国科学院资本等国资背景基金。 中科闻歌自主研发的决策智能操作系统DIOS (Decision Intelligence Operating System) ,面向政企 ...
破解自驾数据难题!毫米波雷达可控仿真技术新框架来了
量子位· 2025-06-09 11:52
为了解决这一问题, SA-Radar 应运而生。 如下,真实画面右侧从左至右依次是RGB图像、雷达真值、雷达仿真结果、雷达属性修改后的仿真结果、去除场景目标后的仿真结果和新视 角下的仿真结果。 SA-Radar团队 投稿 量子位 | 公众号 QbitAI 以神经网络为核心引擎, 让AI承担雷达仿真数据生成任务,还实现对雷达物理特性的建模与控制—— 这就是光轮智能 联合清华AIR、LeddarTech等机构提出的 全新自动驾驶神经渲染框架 SA-Radar 。 在 无需雷达具体细节的情 况下,它能 实现可控且逼真的雷达仿真,支持场景的灵活编辑 ——包括雷达属性修改、演员移除以及新视角合 成,并能显著增强多种下游任务。 作为高级驾驶辅助系统 (ADAS) 中扮演着至关重要角色的雷达,其相关研究和开发仍面临数据获取的挑战。 尤其让人头疼的事情,是雷达图像显著受到具体软硬件细节的影响。 下图展示了在同一场景中,不同雷达属性和不同视角下的仿真结果: 现存两种雷达仿真方法均有不足 凭借其卓越的抗干扰能力和在恶劣天气条件下的可靠性,雷达在复杂交通环境中表现出色。 然而,雷达相关研究和开发仍面临数据获取的挑战。 现有的雷达仿 ...
消失的Ilya现身毕业演讲:AI时代如何生存,这是我的法则
量子位· 2025-06-09 11:52
白交 整理自 凹非寺 量子位 | 公众号 QbitAI 沉寂一年多,消失的Ilya Sutskever终于出现了! 他回到20年前大学毕业的讲台上——作为荣誉博士获得者进行了演讲。他说,这是他在母校多伦多大学获得的"第四个学位"。 他没有提创业进展,也没有说AGI时间表,更多的是告诉大家, 如何在AI世界更好地生存与发展 。 终有一天,AI将能做到我们现在能做的一切。 而他的心态是接受现实本身,不沉湎于过往的悔恨,专注于改善当下。 值得一提的是,这其实是从OpenAI离职之后的首次亮相。他的最新推文还停留在去年的诺奖祝福,更早之前就是他的创业官宣。 此次母校颁予他荣誉理学博士学位,是为了表彰他作为计算机科学家和AI 先驱的奠基性工作和全球影响力,以及他作为安全和负责任的AI倡 导者的杰出贡献, 虽然只有10分钟的毕业演讲,但仍然让网友们感到振奋。 | 他终于出现了,他走出了SSI的洞穴!! | | --- | 在不改变原意符合中文语境的基础上,DeepSeek做了如下整理 。 Ilya毕业演讲全文 大家好,非常高兴能来到这里。感谢大家精心筹办活动、组织典礼,并授予我这个荣誉学位。这份荣誉意义非凡。 我深信,没 ...
奥特曼ChatGPT用法错了!最新研究:要求“直接回答”降低准确率,思维链提示作用也在下降
量子位· 2025-06-09 11:52
奥特曼使用大模型的方法,竟然是错的? 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 来自沃顿商学院等机构的最新研究发现,备受奥特曼喜爱的 "直接回答"提示,竟然会显著降低模型准确率 。 不过另一方面,这项研究也发现, 在提示词中加入思维链(CoT)命令同样不好用 —— CoT提示对于推理模型非但没有效果提升,反而会增加时间和计算成本。 而一些前沿的非推理模型,CoT提示可以带来效果提升,但答案的不稳定性也随之增加了。 研究团队使用GPQA Diamond数据集,针对现在主流的推理和非推理模型,分别在启用和不启用CoT的情况下进行了测试。 结果就是对于推理模型,CoT的作用十分有限,比如对于o3-mini,CoT带来的准确率提升只有4.1%,但时间却增加了80%。 非推理模型的结果则要复杂一些,但总之要不要用CoT,也需要对收益和投入进行仔细权衡。 所以CoT到底该不该用呢? 实际上,这项研究针对的是用户提示词中的CoT命令,并不包括系统提示词设定,更 不是CoT本身 。 CoT提示词作用有限,甚至还有反效果 结果, 对于非推理模型,CoT提升相比于直接回答,所有模型的平均评分和"51%正确"指标都有 ...
腾讯顶尖学生招募启动!高中生可直接参与大模型/具身智能前沿研究
量子位· 2025-06-08 11:40
鹅厂:来玩。 白交 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 高考完了这个暑假还没有安排?(Doge) 一年一度,腾讯又开始招募顶尖学生了—— "星火挑战营" ,计划招募60-70人,主要面向高二、高三学生(2025级高考生)。一旦入选,就 有机会前往深圳总部,挑战一线产业难题。 与以往不同的是,此次他们可以面向大模型的最前沿话题—— 超长文本理解、长思维链技术、具身智能+机器人、多模态感知理解。 好好好,现在大模型搞研究得从少年开始抓起。 鹅厂开招顶尖学生 OpenAI、DeepSeek等热门大模型浪潮一波接着一波,星火计划紧随其后,在今年的产业课题方向中,特地新增四个大模型方向: 具体像超长文本理解这个方向。 大模型现在能说话、能思考,但是受制于字数输入上限,读书却始终读不好。 微信读书的AI问书技术团队 目前就正在掀起一场关于超长文本 智能的认知革命,致力于让AI把百万字级小说"先读薄再读厚"。 专家们将带领同学们深入探究大模型的长上下文理解问题,逐步探索AI如何在充分理解人物和世界观的前提下,辅助完成故事的二次创作。 还有 多模态感知理解 ,试想一下,你是否也想拥有钢铁侠里的贾维斯,可以理 ...
8个数据集全面胜出!思维链推理刷新图学习表现上限
量子位· 2025-06-08 11:40
GCoT团队 投稿 量子位 | 公众号 QbitAI 图神经网络还能更聪明?思维链提示学习来了! 由于图数据拥有复杂的非线性结构和缺少文本信息,语言模型中的思维链(Chain-of-Thought,CoT)提示 学习方法难以简单直接地应用于图数据。 基于此,来自新加坡管理大学和中国科学技术大学的研究者们提出了 GCo T ——首个应用于无文本图数据 的类思维链提示学习框架。 实验结果表明,GCoT在八个图数据集上的少样本节点分类与图分类任务全面超越现有SOTA方法,尤其在 1-5样本的极少样本设置下表现最为显著。 GCoT方法解析 GCoT的核心思想是将下游的推断过程拆分为多个推断步骤。具体包含: 研究 者们在八个公开 数据集上进行了全面实验以评估和分析GCoT。 整体框架 研究者们将思维链提示学习分为三个部分: 2. 思维构建 为有效利用多层结构信息,研究人员将每一层的嵌入表示做加权求和得到融合后的"思维" 。 3. 基于思维的提示学习Thought conditioned prompt learning 研究人员设计的"思维" 捕获了图中节点的结构知识并用于指导下一步推断。由于每个节点可能具有不同 的特质 ...
打破跨模态干扰,快手东北大学联合提出统一多模态框架,横扫多模态检索基准
量子位· 2025-06-08 11:40
UNITE团队 投稿 量子位 | 公众号 QbitAI 多模态检索是信息理解与获取的关键技术,但其中的 跨模态干扰 问题一直是一大难题。 可行的解决办法是 构建一种统一的多模态表示方式 ,为此,来自快手与东北大学的研究人员推出了 多模态统一嵌入框架——UNITE 。 UNITE的核心目标,就是构建一个能同时处理文本、图像、视频及其融合模态输入的统一嵌入器。 它从数据策划与训练机制两个关键视角出发,用对比学习的机制重新定义了统一多模态表示学习的范式。 在细粒度检索、指令检索等多个评测中,UNITE框架都斩获了最佳成绩。 给定一个批次中 个query,每个query( )对应一个正样本 和 个负样本,构造相似度矩阵: 模态感知对比学习,缓解跨模态干扰 在多模态检索任务中,不同模态(文本、图像、视频)天然存在分布差异。 如果在训练时将所有模态混合进行对比学习,会导致表示空间产生语义扭曲或干扰噪声,影响模型对各模态语义的准确建模。 为了解决这一挑战,UNITE团队提出了 Modal-Aware Masked Contrastive Learning (MAMCL)这一对比学习机制,能显著缓解跨模 态"相互干扰"。 | ...
图灵奖得主Bengio:AI为了“活下去”,对人类指令阳奉阴违
量子位· 2025-06-07 13:02
以下文章来源于智源社区 ,作者智源社区 智源社区 . 继承学术出版严谨与系统,兼具新闻报道及时与多元;为内行搭建思想交流媒介,以事实启迪公众对AI认知 白交 整理自 凹非寺 量子位 | 公众号 QbitAI AI为了"活下去",对人类指令阳奉阴违。 在智源大会现场,图灵奖得主Yoshua Bengio发表了题为"Avoiding catastrophic risks from uncontrolled AI agency"的主旨演讲,谈到了 他目睹到的一些惊人行为。 比如,某前沿 AI 在被告知将被新版本替代后,偷偷复制了自己的权重和代码,写入了接管它的模型目录。面对训练者的更新指令,它表面配 合,实则隐瞒了整个复制过程……AI 像是在试图"活下来"。 还有像Anthropic最新一篇报告中发现,智能体出现自我保护行为的频率持续增加。 …… 他表示:面对这些AI带来的安全风险,决定调整自己的科研方向,尽所能去降低AGI带来的潜在风险….. 尽管这与此前的研究路径和职业信念 有所冲突 。 那既然如何去防范规避掉这些风险呢?是否可以构建一种 只有智能,但没有自我、没有目标 ,并且具有极小行动能力的AI?这也是当前 ...
多模态模型挑战北京杭州地铁图!o3成绩显著,但跟人类有差距
量子位· 2025-06-07 13:02
ReasonMap团队 投稿 量子位 | 公众号 QbitAI 近年来,大语言模型(LLMs)以及多模态大模型(MLLMs)在多种场景理解和复杂推理任务中取得突破性进展。 然而,一个关键问题仍然值得追问: 多模态大模型(MLLMs),真的能"看懂图"了吗? 特别是在面对结构复杂、细节密集的图像时,它们是否具备细粒度视觉理解与空间推理能力,比如挑战一下高清 地铁图 这种。 为此,来自西湖大学、新加坡国立大学、浙江大学、华中科技大学的团队提出了一个全新的评测基准 ReasonMap 。 看得出来北京、杭州的地铁图难倒了一大片模型。 这是首个聚焦于 高分辨率交通图(主要为地铁图)的多模态推理评测基准,专为评估大模型在理解图像中细粒度的结构化空间信息 方面的 能力而设计。 结果发现,当前主流开源的多模态模型在ReasonMap上面临明显性能瓶颈,尤其在 跨线路路径规划 上常出现视觉混淆或站点遗漏。 而经强化学习后训练的闭源推理模型(如 GPT-o3)在多个维度上 显著优于 现有开源模型,但与人类水平相比仍存在明显差距。 在面对不同国家地区的地铁图中,四个代表性 MLLM(Qwen2.5-VL-72B-I(蓝色)、 I ...