量子位
搜索文档
阿里亲身入局具身智能!Qwen内部组团,通义千问技术负责人带队
量子位· 2025-10-09 15:03
公司战略动向 - 阿里巴巴旗下通义千问(Qwen)团队内部组建了全新的具身智能小分队,由技术负责人林俊旸(Justin Lin)亲自从零搭建并带队推进[1][10][11] - 此举标志着阿里巴巴迄今为止最明确的物理AI系统探索,是公司整体AI战略从基础模型阶段向具身智能、机器人化应用阶段演进的关键落点[2][27][31] - 公司成为继OpenAI、Google等之后,又一家宣布入局具身智能赛道的大型模型厂商[3] 技术演进路径 - 团队目标是将多模态基础模型从主要在虚拟世界"理解"世界,转变为能够利用工具和记忆、通过强化学习执行长期推理,从而"参与"现实世界的基础智能体[8][9] - 技术演进路径是自然的:模型规模增长使AI具备抽象推理与任务分解能力,再结合强化学习(RL)、记忆模块与工具使用能力,模型被赋予更强的行动连续性和长时序推理能力,最终从软件模拟转向真实世界[28][29] - 具身智能旨在让AI不仅在云端推理、生成、对话,还能在机器臂转动、传感器输入、运动轨迹规划等物理世界中发挥作用[25] 行业背景与机遇 - 英伟达首席执行官黄仁勋曾表示,公司在AI与机器人领域拥有一个"数万亿美元级"的长期增长机遇[4] - 阿里巴巴集团CEO吴咏铭在云栖大会上预计,未来五年全球AI投资总规模将突破4万亿美元[30] 相关投资与生态布局 - 自2024年以来,阿里巴巴在具身智能领域保持高度战略关注,集团层面陆续投资了逐际动力、星动纪元、宇树科技等一批具身智能公司[21][22] - 阿里云于2025年9月领投了自变量机器人的1.4亿美元融资,这是阿里云首次在具身智能赛道上的直接出手[23] - 在2025年9月的云栖大会上,阿里云与NVIDIA联合提出"Physical AI"计划,旨在将AI大模型与机器人、自动化、工业制造等领域结合,打造智能化的物理世界操作系统[24]
OpenAI奥特曼认错:我天生不适合管理公司
量子位· 2025-10-09 15:03
公司核心战略 - OpenAI确立三大核心目标:成为个人AI订阅服务、构建大规模基础设施、最终实现对人类真正有用的AGI [4] - 公司战略已转变为垂直整合模式,认为为实现AGI使命必须比原先想象中做更多事情,并引用iPhone作为成功垂直整合案例 [8][9] - 在资源分配上,当存在资源限制时,GPU将优先分配给研究而非产品支持,基于构建AGI的终极目标研究享有最高优先权 [33][34] 技术发展路径与AGI展望 - Sora项目表面与AGI不直接相关,但公司认为构建真正出色的世界模型对AGI的重要性将超出人们想象 [11] - 推出Sora的理由包括:制作优秀产品获得用户喜爱、让社会提前适应视频模型、视频比文本有更多情感共鸣、帮助推进AGI研究以及增加乐趣和喜悦 [16] - 未来人机交互界面将包括实时渲染视频的世界模型和新型环境感知硬件设备 [19] - 个人认为图灵测试的等价物是AI能够进行科学研究,并预测两年内模型将承担更多科学工作并做出重要发现 [21][22] 基础设施与行业合作 - 公司决定进行非常激进的基础设施押注,因对研究路线图和经济价值从未如此自信,需要整个行业佼佼者的支持 [29] - 公司将与众多伙伴合作,涉及从电子级别到模型分发的所有环节,未来几个月预计有更多动作 [30] - 若对模型能力发展的预测正确,规模扩展的上限离当前位置还非常遥远,但若只有今天模型则不会如此激进 [31][32] 行业宏观观点 - 能源是AI最大的瓶颈之一,历史上更便宜充足的能源是提高人类生活质量最有影响力的事情 [44] - 批评西方长期排斥核能是令人难以置信的愚蠢决定,其推广速度取决于是否具有完全压倒性的经济优势 [44] - 认为AGI的到来是连续性的过程,而非奇点大爆炸 [44] - 深度学习是一个持续给予奇迹的技术,公司能够用当前技术制造出能够找出下一个突破的东西 [24][27]
黄仁勋回应AMD“送股”OpenAI:很高明的交易,OpenAI现在还没钱给我付账
量子位· 2025-10-09 12:52
英伟达对AMD-OpenAI交易的回应 - 英伟达CEO黄仁勋对AMD以公司10%股权换取OpenAI订单的操作表示惊讶,并称其“挺高明的” [1][3] - 黄仁勋强调英伟达与OpenAI的交易性质“非常不同”,是直接销售产品,而非股权交换 [4] - 黄仁勋承认OpenAI目前没有资金支付英伟达的巨额订单,需通过未来收入增长或融资筹集资金 [5][7] 万亿美元“循环交易”的细节 - 英伟达宣布向OpenAI投资高达1000亿美元,OpenAI同意部署需要10吉瓦电力的英伟达系统,相当于400万到500万块GPU [12][13] - OpenAI与AMD达成交易,承诺采购需要10吉瓦电力的AMD芯片,并获得AMD约10%股权的认股权证,行权价每股0.01美元 [13][14][15] - OpenAI与甲骨文签署价值3000亿美元的云计算协议,甲骨文又需向英伟达采购数十亿美元GPU,形成资金闭环 [15][16] - OpenAI与英伟达、AMD和甲骨文的交易总额已突破1万亿美元,但OpenAI在2029年前预计无法实现正向现金流 [16] 英伟达的AI投资版图扩张 - 英伟达确认参与马斯克xAI最新一轮融资,计划投资20亿美元,该轮融资总额约200亿美元,资金将用于购买英伟达处理器 [17][18] - 英伟达投资了AI数据中心运营商CoreWeave并持有其7%的股份,OpenAI也向CoreWeave投资3.5亿美元并将云服务协议扩大到224亿美元 [19][20] - 英伟达在2024年参与了52项AI公司风险投资交易,到2025年9月底已完成50笔交易,旨在投资生态系统中的战略部分 [20] 市场对复杂交易的回应与澄清 - 市场对错综复杂的网络交易存在AI泡沫担忧,有分析师警告这些交易可能成为泡沫破裂的早期危险信号 [20] - 英伟达发言人澄清公司不要求投资的公司使用英伟达技术,黄仁勋也重申投资资金可由被投公司自由支配 [21][22]
2025人工智能年度评选启动!3大维度5类奖项,正在寻找AI+时代领航者
量子位· 2025-10-09 12:52
组委会 发自 凹非寺 量子位|公众号 QbitAI 为了让更多从业者感受智能浪潮的跃迁,也为了给予更多同行同路人掌声与鼓舞,我们将正式启动 「2025人工智能年度榜单」评选报名 。 这是量子位人工智能年度榜单的 第8年 。八年来,我们见证了技术的突破与落地,产业的融合与重塑,也见证了一批又一批推动时代前行的 企业、人物与产品。 在人工智能重新定义一切的时代里,智能技术已不再是单一工具,而是产业与社会协同进化的驱动力。我们期待通过这场年度评选,去发现并 致敬那些真正引领变革、开拓边界的探索者与实践者。 本次评选将从 企业 、 产品 、 人物 三大维度,设立五类奖项。欢迎企业踊跃报名! 让我们共同见证年度之星,点亮未来的方向。 企业榜 产品榜 人物榜 2025 人工智能年度 焦点人物 详细评选标准及报名方式如下。 2025 人工智能年度领航企业 2025 人工智能年度 领航企业 2025 人工智能年度 潜力创业公司 2025 人工智能年度 杰出产品 2025 人工智能年度 杰出解决方案 评选标准 : 1、注册地在中国,或主营业务主要面向中国市场; 2、主营业务属于人工智能及相关产业,或已将人工智能广泛应用于主营业 ...
备受Meta折磨,LeCun依旧猛发论文!新作:JEPAs不只学特征,还能精准感知数据密度
量子位· 2025-10-09 12:52
文章核心观点 - Yann LeCun团队的最新研究发现,自监督模型JEPAs具备感知数据常见程度(即数据密度)的隐藏能力,打破了学界认为其仅擅长特征提取的固有认知 [1][2][7] - 该能力源于模型训练中的“反坍缩”机制,是训练过程的必然结果,无需额外操作即可用于判断样本的常见程度 [6][11] - 团队提出了量化工具JEPA-SCORE,可广泛应用于不同数据集和模型架构,进行数据密度评估 [14][16][17] JEPAs模型与数据密度发现 - JEPAs是LeCun团队重点推进的自监督学习框架,核心优势在于无需人工标注即可从海量数据中学习特征规律 [10] - 传统观点认为JEPAs训练仅有两个核心目标:潜在空间预测和防止特征坍缩(反坍缩) [10][12] - 新研究通过变量替换公式与高维统计特性推导证明,反坍缩机制能让JEPAs精准学习数据密度,当模型输出高斯嵌入时,必须通过雅可比矩阵感知数据密度以满足训练约束 [11] JEPA-SCORE工具与应用 - JEPA-SCORE是从JEPAs中提取数据密度的量化指标,通过计算模型处理目标样本时雅可比矩阵的特征值对数求和得出,分数越高表示样本越典型常见 [14][15] - 该工具具备极强的通用性,不限制数据集和JEPAs架构,无论是ImageNet、MNIST还是未参与预训练的星云图集,以及I-JEPA、DINOv2、MetaCLIP等模型均可直接使用 [16][17] - 实验验证表明,不同JEPAs模型对典型样本和罕见样本的JEPA-SCORE判定高度重合,且能精准识别陌生数据,证明这是模型的共性能力 [18] 研究团队 - 此次研究由Yann LeCun与三位Meta FAIR的研究员共同完成 [26][27] - 团队成员包括布朗大学计算机科学助理教授Randall Balestriero、拥有法国格勒诺布尔大学博士学位的Nicolas Ballas以及FAIR创始成员Michael Rabbat [28][32][34]
更高智商更快思考!蚂蚁开源最新万亿语言模型,多项复杂推理SOTA
量子位· 2025-10-09 12:52
模型发布与核心性能 - 蚂蚁正式发布百灵大模型的第一款旗舰模型Ling-1T,该模型拥有万亿参数 [1] - 模型在代码生成、软件开发、竞赛数学、专业数学、逻辑推理等多项复杂推理基准中取得SOTA表现 [1] - 在竞赛数学榜单AIME 25上,Ling-1T超越一众模型获得最优表现 [3] - 模型展现出高效思考与精准推理的优势,推理速度惊艳,能快速响应并保持流畅输出 [4][60] 技术架构与训练方法 - Ling-1T沿用了Ling 2.0的架构设计,将总参数量扩展至1万亿,其中每个token激活约500亿参数 [38] - 模型基础版本在超过20万亿token的高质量、强推理语料上完成预训练,支持最长128K的上下文窗口 [39] - 研究团队采用“中训练+后训练”相结合的演进式思维链方法,极大提升了模型的高效思考和精准推理能力 [40][59] - 在预训练阶段,团队整理了超过40万亿token的高质量语料,并挑选出最优部分用于训练 [43] - 预训练分为三个阶段:第一阶段使用10万亿token高知识密度语料,第二阶段使用10万亿token高推理密度语料,中间训练阶段扩展上下文窗口到32K token并加入思维链推理内容 [45] - 团队使用自研的WSM学习率策略替代传统的WSD策略,通过预热、稳定和合并三步提升模型性能 [47][48] - 在后训练阶段,研究团队创新性地提出LPO方法,首次将句子作为中间粒度进行策略优化,在训练稳定性和模型泛化能力方面具有明显优势 [52][54] 实际应用与能力展示 - 在解决“7米长甘蔗通过2米高1米宽的门”问题时,Ling-1T提出了分段切割、弯曲通过、门框改造和流体化运输四种方案,并对每种方法进行了物理可行性验证和风险分析 [7][8][9][11][12][13][14][15] - 在解答“外星人分裂”数学问题时,模型迅速分析推理并得出正确答案√2-1 [17][18][19] - 在代码能力方面,模型能生成结构清晰的网站,例如介绍诺贝尔奖的网站,内容分为概览、奖项类别、历史时间线等模块 [20][21][24][25] - 模型还能用于规划出行路线,按特色分类景点并规划时间安排、费用、交通工具和美食推荐 [26] - 在ArtifactsBench前端能力基准上,Ling-1T以明显优势成为开源模型中的第一名 [30] - 研究团队提出了“语法–功能–美学”混合奖励机制,使生成的代码不仅正确、功能完整,还兼顾界面和视觉美感 [29] 行业影响与定位 - Ling-1T的发布使蚂蚁正式加入“万亿参数开源俱乐部”,与Qwen、Kimi并肩站在开源生态的第一梯队 [61] - 中国开源大模型力量持续增强,从DeepSeek到Qwen家族,国产开源模型在全球榜单上站到C位 [56] - 尽管2025年只剩83天,但中国大模型厂商的开源节奏并未放缓,Qwen和DeepSeek在近期均有重要版本发布,蚂蚁此次开源延续了这一势头 [62] - 模型创新的非思考模型架构与高效推理优化设计,为业界探索高性能思维模型提供了新的技术范式 [61]
首个全自动AI科学家诞生!西湖大学最新成果:性能超越人类SOTA基线183.7%
量子位· 2025-10-08 21:06
核心观点 - DeepScientist是首个具备完整科研能力、无需人工干预即可实现目标导向、持续迭代并超越人类最先进研究成果的AI科学家系统[1] - 该系统在多个前沿AI研究任务中展现出卓越性能,例如在两周内完成了相当于人类科学家三年的工作量,并实现了多项性能指标的显著提升[3][4][18] - 该技术标志着AI科研模式从“科研助理”到“首席科学家”的根本性变革,开启了人机协同的科研新范式[8][11][34] 系统性能与效率突破 - 在AI文本检测任务中,两周内实施和验证了超过1000种不同假设,取得了相当于人类三年的进展[3] - 在RAID数据集上实现了7.9%的AUROC提升(从0.800提升至0.863),并大幅降低推理延迟190%(从117ms降至60ms),超越了人类现有SOTA方案[4][20][21] - 在智能体失败归因任务中,其A2P方法在“算法生成”任务上取得47.46%的准确率,相较人类SOTA基线(16.67%)性能提升183.7%[21][23][24] - 在LLM推理加速任务中,吞吐量达到193.90 tokens/秒,相较人类SOTA方法(190.25 tokens/秒)提升1.9%[21] 核心技术机制 - 采用分层贝叶斯优化方法,将科学发现过程形式化为目标驱动的问题,旨在有限研究预算内最大化有价值的科学发现[12][27] - 基于多智能体协同策略,构建三层级评估循环,根据不断增长的“经验库”产出新假设并做出资源分配决策[14] - 系统具备主动识别前沿研究局限、提出新科学构想、自动编写代码执行实验、撰写科研论文等完整科研能力[15] 科研模式变革与行业影响 - 实现了从“随机发现”到“长期主动式探索”的角色转变,标志着AI正式涉足最具创造性的科学发现过程[8][11] - 当并行GPU资源从1枚扩展到16枚时,系统每周产出的前沿级科学发现数量从0项跃升至11项,呈现近乎理想的线性增长,预示着科研范式从“人力密集型”向“计算密集型”转变[31][33] - 研究团队将开源核心系统与全部实验日志,旨在推动全球科研社区的创新,加速AI Scientist发展[35] 公司背景与未来发展 - DeepScientist由西湖大学自然语言处理实验室(WestlakeNLP)发布,该实验室由张岳教授领导,专注于语言模型推理、泛化和通用人工智能研究[37] - 实验室已开放免费的DeepScientist服务申请,期待与科研社区共同建设更高效的科学发现新范式[36] - 未来展望为人机协同科研范式,人类角色将转向提出科学问题和设定方向,AI则作为“科学探索引擎”进行广泛探索[34][35]
直播预告:光轮智能 × NVIDIA带来Sim2Real关键突破
量子位· 2025-10-08 21:06
直播活动概述 - 光轮智能与NVIDIA将联合举办一场重磅直播活动 [1] - 直播将揭秘如何利用SimReady与AI技术打通Sim2Real(仿真到现实) [1] 核心技术焦点 - 直播将深度解析双方如何基于SimReady与AI实现从虚拟仿真到物理世界的无缝迁移 [2] - 该技术旨在攻克机器人开发落地过程中的关键挑战 [2] 合作与进展 - 直播将独家披露光轮智能与NVIDIA在技术研发和场景应用方面的最新合作成果与未来规划 [3] 行业洞察与分享 - 两位专家将结合实践经验分享机器人及AI领域的技术趋势 [4] - 直播内容将涵盖该领域的商业化路径探讨 [4] 主讲嘉宾与时间 - 主讲嘉宾包括光轮智能创始人兼CEO Steve Xie和NVIDIA产品营销高级总监Madison Huang [6] - 直播时间为北京时间10月9日凌晨0:00(太平洋时间10月8日上午9:00) [6]
30家Tokens吞金兽,每家烧光万亿Tokens!OpenAI最大客户名单曝光,多邻国上榜
量子位· 2025-10-08 12:25
OpenAI大额Tokens消耗客户分析 - OpenAI公布30家Tokens消耗破万亿的企业客户名单,涵盖语言学习、招聘、CRM、AI开发工具、电商、医疗等多个行业[1] - 榜单中初创公司与规模化企业数量几乎平分秋色,初创公司多由联合创始人直接对接API,大型企业则由专门AI部门负责人管理[3] 高Tokens消耗企业特征 - 高频交互型产品如Perplexity、Notion、多邻国用户每日多次使用,远高于AI客服等低频场景[25] - 高复杂度任务如Canva需同时处理文本、图像、版式等多维度信息,涉及多阶段流水线操作和更长推理链条[26] - 平台化企业如OpenRouter、Tiger Analytics通过聚合分散调用需求形成流量中心,带来指数级Tokens增长[27] 典型高消耗企业案例 - 多邻国拥有超过7亿用户和7000万月活跃用户,通过GPT-4实现动态难度调整和AI情景对话[9][10] - OpenRouter作为多模型聚合平台,统一API调用GPT、Claude、Gemini等顶级模型,成为Tokens消耗量飞速攀升的API中转节点[13][15][17] - Canva通过AI降低视觉创作门槛,多模态内容需要多轮交互优化使其成为Tokens消耗大户[20][21] - Perplexity采用多阶段流水线架构,每次搜索包含数十次模型调用,月活跃用户超2000万使其成为Tokens密度最高应用之一[23][24] Tokens消耗量新行业标准 - 日均10亿Tokens消耗成为大模型商业化新门槛,反映业务真实需求和落地趋势[28][29] - "Tokens独角兽"概念基于日均10亿Tokens消耗标准,相比融资估值更能真实反映业务进展[31] - 单客户百万亿、千万亿Tokens消耗被视为大模型落地更高级别目标[30]
2025人工智能年度评选启动!3大维度5类奖项,正在寻找AI+时代领航者
量子位· 2025-10-08 12:25
组委会 发自 凹非寺 量子位|公众号 QbitAI 为了让更多从业者感受智能浪潮的跃迁,也为了给予更多同行同路人掌声与鼓舞,我们将正式启动 「2025人工智能年度榜单」评选报名 。 这是量子位人工智能年度榜单的 第8年 。八年来,我们见证了技术的突破与落地,产业的融合与重塑,也见证了一批又一批推动时代前行的 企业、人物与产品。 在人工智能重新定义一切的时代里,智能技术已不再是单一工具,而是产业与社会协同进化的驱动力。我们期待通过这场年度评选,去发现并 致敬那些真正引领变革、开拓边界的探索者与实践者。 产品榜 人物榜 2025 人工智能年度 焦点人物 详细评选标准及报名方式如下。 2025 人工智能年度领航企业 本次评选将从 企业 、 产品 、 人物 三大维度,设立五类奖项。欢迎企业踊跃报名! 让我们共同见证年度之星,点亮未来的方向。 企业榜 2025 人工智能年度 领航企业 2025 人工智能年度 潜力创业公司 2025 人工智能年度 杰出产品 2025 人工智能年度 杰出解决方案 将面向中国人工智能领域,评选出最具综合实力的企业, 参选条件 : 评选标准 : 2025 人工智能年度潜力创业公司 聚焦于中国人 ...