Workflow
量子位
icon
搜索文档
CMU教授万字反思:西方式AGI永远到不了
量子位· 2025-12-20 15:38
文章核心观点 - 卡内基梅隆大学教授Tim Dettmers认为,通用人工智能(AGI)是一个违背物理规律的幻想工程,其核心障碍在于计算的物理枷锁,而非哲学或算法问题 [1][4] - 硬件性能的瓶颈、资源成本的指数级增长以及现实世界数据收集的困难,共同决定了AGI无法实现 [1][12][18] - AI的未来在于物理约束内的渐进式改进、经济扩散和实际应用,而非追求超越人类的超级智能 [20] 硬件与物理限制 - 所有智能都需扎根于物理现实,依赖芯片、计算机等硬件实现,而硬件必然受到物理规律的限制 [2][3][4] - 信息移动成本是核心物理限制之一,其成本随距离呈平方级上升,这体现在芯片缓存设计中(如L2、L3缓存比L1大但速度更慢)[5] - 现代芯片设计面临内存与计算单元的权衡,晶体管尺寸缩小降低了计算成本,但内存成本越来越高,导致芯片上大部分空间用于内存,计算单元占比微乎其微 [7] - 当前主流的Transformer架构本质上是硬件信息处理效率的物理优化,且已接近物理最优 [8] 资源投入与收益递减 - 系统性能的线性进步需要指数级增长的资源投入,这在物理和理论层面都存在限制 [9] - 物理学的发展是例证:过去个人可取得理论突破,现在却很难;实验物理如耗资数十亿的大型强子对撞机也未能解开暗能量、暗物质谜团 [10][11] - AI领域同理,试图通过堆叠资源实现AGI的通用能力,其成本迟早会超出实际承受范围 [12] - 过去GPU的指数级进步能抵消模型规模扩张的资源消耗,但现在GPU进步停滞,想获得线性性能提升需投入指数级成本,这在物理上很快将不可行 [16] GPU算力增长已达瓶颈 - GPU的性价比在2018年已达到峰值,之后的改进(如16位精度、张量核心、HBM内存)均为一次性功能,潜力即将耗尽 [14] - 行业寄希望于机架级优化(如更高效调度AI键值缓存),但此类优化设计思路单一,本质上只有一种最优设计方式,各公司基础设施差距很小 [14] - 机架或数据中心级别的优化优势预计在2026-2027年就会耗尽,GPU的算力增长线已快走到尽头 [14][15] AGI与超级智能的不可行性 - AGI要求能处理物理世界的复杂任务,但物理世界数据的收集成本极高(例如训练工厂机器人应对零件磨损、天气变化)[18] - 超级智能假设AI能自我迭代、无限变强,但变聪明需要资源,性能每提升1%,所需的资金和算力可能增加10倍,而AI无法凭空创造资源,因此无法实现无限增强 [19] - 结论是AGI不会实现,超级智能亦是幻想 [17][19] AI的未来发展路径 - AI的未来是在物理约束内进行渐进式改进,通过经济扩散和实际应用创造价值 [20] - 具体方向包括开发更节省算力的算法、推广开源AI模型以扩大使用范围,以及将AI应用于医疗、农业、制造业等领域以提升效率 [21] - 美国科技巨头倾向于“赢者通吃”,投入巨资追求不切实际的AGI [21] - 中国的发展路径更聚焦于AI的落地实用,关注其提升生产力的能力,并通过补贴推动AI融入各行各业,被认为更贴合现实 [22]
字节全员涨薪底气曝光:2025年利润500亿美元,跟Meta一个水平了
量子位· 2025-12-20 14:30
字节跳动核心财务业绩 - 2025年前三季度利润已突破400亿美元,预计全年利润将达到500亿美元(约合人民币3520.8亿元),平均每天净赚9.64亿元 [5] - 2025年营收预计将达到1860亿美元,相比去年增长20%,净利润率预计为26.9% [7] - 业绩增长带动估值大幅提升,从9月的3300亿美元内部回购估值,升至11月部分股权交易对应的4800亿美元估值 [8] 全员薪酬激励政策调整 - 2025全年绩效评估周期,公司调薪投入将比上个周期上涨1.5倍,用于提高员工薪资总包 [10] - 薪酬发放提高现金占比,总包类期权/RSU发放从1次发4年(20%-25%-25%-30%)调整为1次发3年(30%-30%-40%) [10] - 公司总体奖金投入将比上个周期上涨35%,通过增加绩效M及以上的年终奖月数体现 [10] - 激励月数超过3个月的部分,发放形式从100%发绩效期权调整为25%发现金,75%发绩效期权 [10] - 从2026年1月起,新授予的绩效期权/RSU中,55%可在归属后立即参与回购,其余部分可在3年内逐步参与回购(每年15%) [10][21] 职级体系改革 - 职级体系将从原有的“1-1或2-2”等形式,调整为L1-L10共十级 [12] - 新职级与旧职级并非一一对应,目前使用率低的“1-1”将与“1-2”整合为新职级L1 [12][23] - 新职级体系提高了所有职级薪酬总包区间的上限和下限,旨在为员工提供更大的涨薪空间 [13][19][23] - 新体系将于2026年1月1日启用,2025年绩效评估将根据员工现有职级、薪酬总包、能力和绩效情况匹配新职级 [23] 行业背景与公司战略动机 - 公司所处的行业正面临新的机遇和挑战,此次调整旨在更好地吸引、激励和保留优秀人才 [15][19] - 调整与人工智能大模型浪潮带来的行业竞争相关,公司将人才争夺从顶尖人才扩展至全体员工,以保障技术全面落地所需的团队 [16][17] - 公司希望通过提高薪酬竞争力和激励回报的天花板,确保其在各市场领先于头部水平 [19]
北大华为联队夺冠:形式化数学竞赛33支队伍角逐,国产大模型啃下形式化证明硬骨头
量子位· 2025-12-20 14:30
赛事与成果概述 - 中国计算机学会主办的“面向大模型的形式化数学竞赛”旨在解决大模型在数学推理中的“幻觉”和不可靠问题[2] - 赛事吸引了来自全球的33支顶尖团队参与,参赛人数超过600人[2][6] - 一支名为“Lean说的都队”的北大华为联合队伍以总分57.21分获得冠军,从33支队伍中脱颖而出[1][6] 竞赛任务与意义 - 竞赛要求模型将自然语言描述的数学问题直接转化为能被计算机验证的形式化证明代码,禁止使用自然语言解释[4] - 赛题是对大模型形式化推理能力的系统性检验,为未来构建可信赖的大模型提供技术路径和评估基准[6] 冠军团队成绩 - 初赛阶段:正确解答181道题目(共220道),初赛分数82.27分[6] - 决赛阶段:正确解答5道高难度题目(共50道),决赛分数10分[6] - 方案评审:技术方案获得87分的高分[6] - 最终总分:57.21分,位列榜首[6] 核心技术:openPangu大模型 - 团队采用华为openPangu-Ultra-MoE-718B作为核心模型之一,总参数量达7180亿,激活参数量390亿[9] - 该模型在形式化数学推理任务中展现出强大的语义理解能力和形式化表达能力,尤其在数论和代数问题上性能强劲[9] - 实测表明,该模型在Lean语法检查通过率方面与国际前沿的Gemini 2.5 Pro和GPT-5模型表现相当,在形式化命题的可证明命题比例方面更具优势[10] 创新的混合式系统架构 - 系统采用协同式求解系统,结合大模型的形式推理能力与专用证明器的高效性[7] - 核心特点包括动态切换策略:先尝试流水线方法,失败则回退到单体模型方法[13] - 建立了多层质量检查体系,包括语法验证和严格的语义对齐检查[14] - 采用多模型协同,根据模型的知识边界和成本效率进行智能调度[14] 关键技术创新:语义分解验证 - 团队创新性地引入了基于语义分解的多层级验证机制,将自然语言问题解构为数据类型、前提条件和证明目标三个正交维度[16] - 该方法解决了传统LLM-as-a-Judge方法“判定过松”的问题,实现了从整体模糊匹配到结构化精确对齐的范式转变[16][17] - 相比传统方法,这一改进显著降低了误判率,为形式化结果的可靠性提供了保障[19] 技术应用与实战案例 - 案例一(抽象代数):成功处理环的整扩张与幂零根相关的命题,生成了严谨的Lean代码[20] - 案例二(复数计算):成功处理求满足复数方程实数个数的问题,展示了拆解子问题与生成完整证明的能力[22] 当前局限与未来展望 - 现有证明器主要在高中竞赛题目上训练,对微积分、代数几何等高度专业化数学分支的掌握仍显不足[23] - 单题平均约1小时的求解时间限制了在时间敏感场景下的应用[23] - 未来建议通过主动学习构建专门化证明器,探索动态采样策略,并关注人机协作的交互式证明模式[23] 行业影响与意义 - 此次突破为中国在AI形式化推理领域赢得了荣誉,为攻克严谨数学证明这一“最后堡垒”提供了可行的技术路线[31] - 随着openPangu等国产大模型的持续进化,AI有望在数学研究、科学发现、教育辅助和软件验证等领域扮演更重要角色[31]
首个文本到3D生成RL范式诞生,攻克几何与物理合理性
量子位· 2025-12-20 12:20
文章核心观点 - 一项由多所高校及实验室合作的研究,系统性地探讨了强化学习在文本到3D生成领域的应用可行性,并提出了层次化强化学习范式Hi-GRPO,构建了首个针对3D推理场景的评测基准MME-3DR,研究显示强化学习能有效提升3D自回归模型的生成质量与隐式推理能力[2][3][14] 奖励设计层 - 研究团队系统对比了人类偏好、文本对齐、多视图一致性、3D美学等多种奖励组合,发现对齐人类偏好信号是提升整体3D质量的关键,其他奖励维度单独使用提升有限,但叠加到偏好奖励上能持续带来增益[7] - 对于同一奖励维度,专门化的奖励模型通常比大型多模态模型表现出更强的鲁棒性,但通用多模态模型在3D相关属性上出乎意料地鲁棒,为低成本奖励提供了可能[7] 算法适配层 - 在3D自回归生成中,强化学习更偏好token级策略而非序列级操作,在相同奖励模型配置下,token级平均策略带来的提升显著大于序列级的重要性采样与剪切方法[8] - 简单的技巧即可稳定训练,尤其是动态采样,只要策略更新受控,完全移除KL惩罚会导致性能下降,而鼓励对低概率token探索的方法仍能带来性能增益[9] - 扩大量级的训练数据能有效缓解偏好奖励带来的偏差并提升整体表现,适度增加强化学习迭代能进一步优化模型,但过度训练可能损害泛化能力[9] 评测基准层 - 研究构建了首个针对3D推理场景的系统评测基准MME-3DR,该基准由空间与结构几何、机械可供性与物理合理性、生物或有机形态、长尾稀有实体和风格化或抽象形态五类组成[10] - 近期的文本到3D模型在机械结构和非刚性生物体上表现尚可,但在其余三个类别上仍存在明显不足,而强化学习训练在所有五类任务上都带来了显著提升[11] - MME-3DR能同时评估隐式推理与通用3D生成能力,在随机采样的Toys4K测试集上,Trellis模型明显优于ShapeLLM-Omni,这一性能差距在MME-3DR中依然保持,验证了其多样化物体覆盖带来的评测有效性[11] 层次化强化学习范式 - 研究将3D生成视为从粗到细的自然过程:第一步由高层语义决定整体几何骨架,第二步在几何稳定的前提下细化纹理与局部结构,并针对两个步骤单独设计专有奖励模型进行监督[14] - 基于此,研究提出了层次化强化学习范式Hi-GRPO,并实现了首个强化学习加持的文本到3D自回归模型AR3D-R1[14] 关键发现与模型能力 - 强化学习正在帮助3D生成模型学会思考,不仅仅是调整美观度,在MME-3DR基准上,经过强化学习训练的模型在空间几何、一致性和物理可行性等维度都有显著提升,表现出隐式3D推理能力的增强[15] - 范式对齐结构先验很重要,尊重先几何、后纹理的层次结构设计,比简单在最终图像上打分更有效,也更可解释[16] - 性能与稳定性存在二元博弈,奖励过于稀疏或强化学习迭代数过大会导致训练不稳定和模式坍缩,而高质量人类偏好或强多模态奖励可以在同等训练预算下取得更高回报[17] - 结果也清晰显示了当前模型的能力边界,对于极复杂几何、长尾概念和强风格化场景,模型仍会出现逻辑崩坏,真正可扩展的3D强化学习仍受限于算力与奖励获取成本[18]
卡帕西2025大模型总结火爆硅谷
量子位· 2025-12-20 12:20
文章核心观点 - 行业专家卡帕西认为,大模型的潜力仅被挖掘了10%,2025年将是AI技术范式、应用和交互方式发生关键变革的一年 [6][7] 大模型训练新范式:RLVR - 2025年,大模型训练范式从预训练、SFT、RLHF演进至RLVR(可验证奖励强化学习)阶段 [8][14] - RLVR使模型能在可自动验证的奖励环境中进行强化学习,自发形成复杂的推理策略(如问题分解、循环计算),这些策略在旧范式中极难实现 [8] - 与SFT和RLHF不同,RLVR涉及客观奖励函数训练,优化时间较长,但能带来更高的“能力/成本”比,并消耗原先用于预训练的计算资源 [10] - RLVR成为2025年大模型能力增长的重要驱动因素,在模型规模相当的前提下,强化学习的运行时间大幅延长 [11] - RLVR带来了新的调控手段和Scaling Law,可通过生成更长的推理轨迹和增加思考时间,来控制能力作为测试时间计算量的函数 [11] - 2024年末的o1模型是首个RLVR展示,而2025年初o3的发布是明显的拐点 [12] 对大模型智能本质的新认知 - 大模型的智能不应被简单类比为动物智能,其技术栈(神经架构、训练数据、训练算法、优化压力)的不同导致智能实体差异巨大 [13][16] - 人类神经网络为生存而优化,大模型神经网络则为模仿人类、获得奖励而优化 [17] - 随着RLVR在可验证领域的应用,大模型性能将快速爆发并呈现“锯齿状”特征,即“锯齿智能” [18] - “锯齿智能”模型既是通才,也存在认知局限,可能被越狱攻击导致数据泄漏 [19] - 基准测试因构建于可验证环境,极易受RLVR和合成数据影响,导致研发团队围绕基准测试优化,形成在测试集上训练的现象 [20][21] - 这解释了为何当前大模型能在基准测试中取得压倒性胜利,却仍未实现AGI [22] 应用层演进:Cursor与“Cursor for X” - Cursor的出现揭示了大模型应用的新层面,即“Cursor for X”,它不仅是模型接口,更是围绕模型调用构建的应用层 [23][24] - 该应用层能进行上下文工程、协调多个模型调用组成复杂DAG(需权衡性能与成本)、提供特定应用GUI、并带有自主性滑块 [24][30] - 行业在讨论新AI应用层的“厚度”,即其价值会被底层模型实验室榨干,还是为垂直领域应用开发者留下空间 [24] - 卡帕西预测,大模型实验室将趋向于培养“能力全面的大学毕业生”,而应用开发者则负责组织、微调,并让这支“学生团队”在特定行业(通过引入私有数据、传感器、执行器及反馈闭环)中成为可部署、可交付成果的专业人才 [24] 智能体发展:Claude Code加速端侧普及 - Claude Code是首个令人信服的大模型智能体范例,它采用循环方式结合工具使用与推理以解决复杂问题 [26][27] - 其关键优势在于能在个人电脑上运行,充分利用用户的私有环境、数据和上下文 [27] - 与OpenAI将精力集中于由ChatGPT编排的云部署容器不同,Claude Code专注于端侧部署 [28] - 尽管云端智能体集群被视为AGI的终极形态,但当前大模型能力参差不齐,发展处于缓慢过渡阶段 [29] - 在此现实下,Claude Code让智能体本地运行、适配开发者工作流,更贴合实际需求,并以美观简约的命令行界面改变了人们对AI的传统认知,使其如同栖息在个人电脑中的小精灵 [32][33] 编程范式变革:Vibe Coding - 2025年,AI跨越能力门槛,可通过自然语言构建程序,即“氛围编程” [34] - 氛围编程使编程不再局限于专业人士,任何人都能参与,专业人士也能借此编写更多有意思的软件 [37] - 例如,卡帕西在nanochat项目中,就用氛围编程的方式在Rust语言中编写了定制的高效BPE分词器,而无需采用现有库或学习更多Rust知识 [37] - 氛围编程将重塑软件行业并改变现有的工作内容 [38] 人机交互新范式:Nano Banana - 谷歌的Gemini Nano Banana是2025年最令人惊讶、最具范式转移意义的模型之一 [40] - 大模型被视为继计算机时代后的下一个主要计算范式,尤其在用户界面和用户体验方面与计算机有相似性 [42] - 由于人们喜欢以视觉和空间方式获取信息,大模型也应提供类似格式,对文本进行美化和视觉排版 [43] - Nano Banana展现了这一趋势,它并非只关注图像生成,而是将文本生成、图像生成和世界知识融合在一起,为未来大模型GUI发展提供了参考 [43]
奥迪+华为=油车智能天花板?
量子位· 2025-12-20 12:20
文章核心观点 - 一汽奥迪A5L乾崑智驾版作为全球首款搭载华为乾崑智驾系统的燃油车,成功打破了“燃油车不智能”的行业刻板印象,标志着燃油车正式进入“原生智能”时代,并可能引发油电产品在智能化赛道的新竞争格局 [1][2][3][57][60][62] 产品体验与性能 - 在长达82公里的早高峰实际道路测试中,车辆有93%的里程处于智能辅助驾驶状态,覆盖城区、高架及复杂路况 [9] - 系统在无明显车道线路段能丝滑绕开临停车辆和对向来车 [10] - 系统能够识别并避让逆向行驶的非机动车 [12] - 车辆可自动识别匝道并汇入高架 [14] - 系统会主动变道超越前方慢速行驶的大车 [16] - 面对加塞车辆,系统风格偏向保守,采取主动让行策略以减少急刹 [18] - 系统能自主判断时机,在确保安全后迅速变道超越慢速路政车辆 [20] - 车辆能够稳健通过大曲率弯道 [22] - 在桥洞等光线明暗变化盲区,车辆会先谨慎观察再汇入车流,操作稳健 [24] - 系统能够准确通过复杂环岛并找到正确出口 [26][28] - 高级泊车辅助功能支持在无标识路段进行侧方停车 [31] - 具备跨层记忆泊车(导航泊车辅助)功能,可在昏暗地下停车场根据记忆路线行驶,并在大量空闲车位中自由选择泊入 [34][36] - 车辆操控体验优秀,转向精准,动力充沛 [40] - 智能辅助驾驶系统加减速和转向平滑,提升了驾乘舒适性 [42] 行业背景与市场现状 - 2025年1-10月,国内燃油车销量为1467万辆,仍占据一半市场份额,用户基础庞大 [45] - 2025年1-7月,中国汽车辅助驾驶渗透率已超过62%,智能驾驶已成为市场主流 [57] - 智能辅助驾驶因能解放司机精力、提升安全性,成为用户购车关键因素,渗透率连年增长 [46] - 市场存在对燃油车驾控和智能化体验均有强烈需求的用户群体 [57] 技术实现路径 - 燃油车智能化面临底层架构、电力供应、指令传输、散热等一系列技术挑战 [46] - 奥迪与华为的合作并非简单套用现有方案,而是基于燃油车平台全新定制开发 [49] - 华为主要负责云端层、应用软件层和基础软件层,为车辆提供智能“大脑” [49] - 华为乾崑智驾ADS4采用WEWA架构,云端“世界引擎”可生成边缘场景数据训练算法,车端应用层采用MoE架构以调用不同场景专家能力 [49] - 奥迪负责电子电气架构层、能源层和机械层,打造敏捷的“神经”和灵活的“躯体” [49] - 传统燃油车电子电气架构割裂,控制器众多,导致指令延迟高 [49] - 奥迪将分散的控制器整合为5大域控,显著缩短通信延迟 [50] - 车辆运动管理模块作为关键中间层,采用面向服务架构,将底层硬件能力封装成接口供上层算法调用,实现软硬解耦,使指令转化更丝滑 [52][53][54] - VMM相当于车辆的“小脑”,确保了刹车、转向、动力的精准响应 [53] - 系统进行了多重冗余设计,极端情况下备份系统可立即接管,保障安全 [54] - 能源层通过严格管控单元能耗并扩大车载小电瓶容量(强制保电50%以上),为感知传感器提供充足电力 [55] - 车辆支持OTA升级,可实现常用常新 [55] 行业影响与未来趋势 - 该产品为燃油车行业提供了可实现“原生智能”的技术范本,其核心是对电子电气架构的彻底革新 [59] - 证明了燃油车智能化不仅适用于高速路段,在复杂城区路段同样可用且好用 [60] - 预计2026年类似的“智能油车”将越来越多,AI将加速上车普及 [60] - 产品表明“油电”并非智能的分界线,智能不再是电车独享的标签 [60] - 行业竞争焦点可能从“油电路线之争”转向“油电同智,体验为王” [61] - AI为传统燃油车打开了新的想象空间,挖掘出新的市场潜力 [56][60]
量子位编辑作者招聘
量子位· 2025-12-20 12:20
公司概况与市场地位 - 公司是一家以追踪AI新进展为核心的内容平台,拥有8年行业积累[1] - 公司在微信公众号平台拥有超过240万订阅用户,全网用户超过700万,日均阅读量超过200万[12] - 公司在第三方数据平台(如新榜、清博)被认为是AI及前沿科技行业的TOP1新媒体[12] 招聘岗位与方向 - 公司开放三大方向的岗位招聘:AI产业方向、AI财经商业方向、AI产品方向[2][6] - 招聘岗位面向社招和校招,社招覆盖编辑、主笔、主编各个层级,校招接受应届毕业生及实习生[4][6] - 所有岗位工作地点均位于北京中关村[2] 岗位职责详情 - **AI产业方向**:关注基建层创新,包括芯片、AI Infra、云计算;跟进核心玩家动态;解读前沿论文、开源社区及技术大会报告;参与产业专家访谈并撰写云落地案例[5][6][7] - **AI财经商业方向**:聚焦创投、AI创业公司、上市公司、商业模式及产业链资本动向;产出创投融资、财报解析、公司战略分析稿件;访谈投资人、创业者及产业分析人士[6][9][11] - **AI产品方向**:关注AI在软件应用和硬件终端的落地;撰写AI应用深度评测,跟踪手机、PC、XR、车机等终端新品发布;对话AI应用创业者、产品及终端技术专家[6][10][11] 任职能力要求 - **AI产业方向**:需对芯片、GPU、NPU、服务器、模型训练架构、云计算有基本理解;熟悉AI行业供应链与生态;具备将复杂技术内容结构化表达的能力;技术背景或理工科/CS/EE方向优先[8][11] - **AI财经商业方向**:需对数据敏感,对财报、股权结构、战略规划感兴趣;逻辑结构强,对商业叙事敏感;热爱对话采访,具备社交型人格[9][11] - **AI产品方向**:需对智能硬件和AI终端趋势敏锐,是重度AI产品体验人士;熟悉各大终端厂商业态及体验方法论;具备强逻辑、体验表达和结构化能力[10][11] - **通用要求**:主编需具备选题和带队能力;主笔需具备原创深度稿件能力;编辑需热爱表达,擅长信息挖掘,能用通俗语言解读AI进展[6] 加入公司的价值主张 - 员工可第一时间接触AI领域最新技术和产品,构建完整的AI认知体系[6] - 员工可将各种AI新工具应用于工作,提升效率和创造力[6] - 员工可通过撰写独家原创内容建立个人知名度,成为AI领域意见领袖[6] - 员工可与AI领域专家零距离接触,参与重要科技活动,拓展行业人脉和视野[6] - 应届新人可获得主编级编辑的一对一指导[6] - 公司提供扁平、简单、开放、多劳多得、能者上位的团队氛围[6] - 公司提供行业TOP薪资待遇,以及五险一金、餐补、项目绩效、商务绩效、加班补助等福利[6] 应聘方式 - 应聘者需将个人简历发送至指定邮箱,邮件主题需注明应聘方向及姓名[11] - 需随简历附上科技行业代表作品或能展现个人写作水平和风格的作品[11]
火线解析智谱AI招股书:年营收3亿增速130%,“中国版OpenAI”率先冲刺全球大模型第一股
量子位· 2025-12-19 22:08
公司概况与上市进展 - 智谱AI被视为“中国版OpenAI”,由清华顶尖团队孵化,已向港交所秘密递表并通过聆讯,即将上市[1][2] - 公司成立6年间累计完成8轮融资,筹资总额超过83亿元人民币,IPO前最新投后估值已达243.8亿元人民币[3][59] 技术实力与产品矩阵 - 公司技术核心围绕自主开发的“GLM”系列大模型展开,已构建从基础模型到应用产品的完整体系[5] - 2024年中,公司发布了AGI的L1-L5路径图,目前已开发出包括中国首个千亿规模大模型GLM-130B、首个开源大型聊天模型ChatGLM在内的三个阶段大模型及智能体[6] - 基座模型采用自回归填空架构,支持多模态输入输出,2024年下半年推出的新一代旗舰模型GLM-4.5/4.6首次在一个模型中原生融合推理、编码和智能体能力[9][10] - GLM-4.5发布后48小时内跃居抱抱脸热门榜全球榜首,在7月的12项业界标准基准测试中,全球排名第三、中国排名第一,在全球开源模型中居首位[11] - GLM-4.6强化了编码能力,在大模型竞技场Code Arena上与Anthropic、OpenAI的模型并列Coding全球第一[14][15] - 公司研发了专用推理模型以优化推理速度和降低成本,例如GLM-4-9B模型开源后累计获得超15万GitHub星标,全球下载超过3000万次[16][17] - 公司拥有多模态模型(如CogVLM、CogView、CogVideoX)和智能体(Agent)产品,其中AutoGLM是全球首个可自主操作手机的智能体,2024年8月更新的AutoGLM 2.0支持接入AI眼镜、手表等硬件[18][19][20] 商业模式与市场表现 - 公司从2021年开始布局MaaS(模型即服务)商业模式,是目前唯一一家实现MaaS有规模收入的创业公司[23] - MaaS开放平台上有超过270万企业及应用开发者,是中国前10大互联网公司中9家的模型供应商[24] - 在全球大模型超市OpenRouter中,GLM-4.5/4.6调用量排在全球前10,付费流量收入超过所有国产模型之和[25] - 面向全球开发者的模型业务(GLM coding plan)已获得超过1亿元人民币的收入,3个月吸纳了超15万付费开发者用户[25] - 截至2024年9月30日,公司模型已辐射全球12000家企业客户、超8000万台终端用户设备以及超4500万名开发者[26] - 2024年11月,公司日均云端token调用量超过4.2万亿次,成为中国赋能终端设备最多的独立通用大模型厂商[27] 财务表现 - 营业收入高速增长:2022年、2023年、2024年收入分别为5740万元、1.245亿元、3.124亿元人民币,复合年增长率达到130%[29] - 2025年上半年收入为1.9亿元人民币,已超越2023年全年水平[29] - 以2024年收入计,公司是中国最大的独立大模型厂商[33] - 毛利率保持高位:2022年、2023年、2024年毛利率分别为54.6%、64.6%、56.3%,2025年上半年为50%[34][35] - 研发投入巨大:2022年、2023年、2024年及2025年上半年研发费用分别为8440万元、5.289亿元、21.954亿元和15.947亿元人民币[38] - 截至2025年6月30日,公司研发团队有657人,占总人数的74%[41] - 核心科研团队已发表500篇顶尖高影响力论文,累计引用次数超过58000次[42] - 现金储备充足:截至2025年6月末,现金及现金等价物为25.2亿元人民币[43] 团队与股东背景 - 公司由清华大学技术成果转化而来,创始班底源自清华大学计算机系知识工程实验室(KEG)[44] - 核心团队成员包括CEO张鹏、首席科学家唐杰、董事长刘德兵、总裁王绍兰等,均具备深厚的清华及科研背景[45][49][51][53] - 融资历程中吸引了众多明星资本,包括美团、蚂蚁、阿里、腾讯、小米等产业资本,以及君联、红杉、高瓴、启明创投、顺为等一线机构,并有地方政府国资支持[58] 行业前景 - 2024年中国大语言模型市场规模已达到53亿元人民币,其中机构客户贡献47亿元,个人客户贡献6亿元[61] - 预计到2030年,中国LLM市场规模将增至1011亿元人民币,2024年至2030年的复合年增长率为63.5%[61]
1年融资17亿的具身智能明星,首秀绣了个logo
量子位· 2025-12-19 22:08
公司概况与融资 - 公司名称为它石智航,于2025年2月正式成立 [53] - 成立不到一年内完成两轮高额融资,总额约17亿元人民币 [2][53] - 天使轮融资1.2亿美元,由蓝驰创投和启明创投共同领投,多家知名机构跟投,刷新中国具身智能行业最大天使轮纪录 [53] - 天使+轮融资1.22亿美元,由美团领投,多家投资机构共同跟投 [53] 技术发布会与产品展示 - 公司在2025年年末举行了首次技术发布会,进行了“首秀” [1] - 发布会展示了两款机器人产品:工业机器人A系列和通用机器人T系列 [13] - 通过机器人完成刺绣LOGO的演示,展示了其在复杂空间下的精细操作能力 [5][18] - 刺绣演示旨在“秀技术”和“救手艺”,技术能力可迁移至高精技术领域,同时有助于以数字形态延续非遗文化 [18][21][22] - 同时展示了复杂的线束操作能力,公司视此为机器人学的关键挑战 [23][25] 核心技术路径与解决方案 - 核心路径是数据、模型和本体三位一体 [50] - 软件方面,推出了数据采集套件SenseHub,以“人类为中心”采集真实世界数据,构建多模态数据集WIYH [29][32][34] - 模型方面,针对当前SOTA模型的三大瓶颈(空间认知、流畅度与精准度、泛化能力),提出了下一代具身智能Scaling Law的解决方案AWE 2.0 [36][38][40] - AWE 2.0利用真实世界海量数据,通过一段式全身端到端学习进行跨本体迁移 [41] - 硬件方面,主张“算法才是机器人系统能力的天花板”,硬件本体围绕AI设计 [43] - 实现核心传感器、计算单元、模型算法和整机系统的全栈自研,并将过去十年在自动驾驶领域的车规级工程经验沉淀至具身智能领域 [45] - 自研关节以平衡位控、力控和传动的“不可能三角” [47] - 传感器组合理念是让机器人与人类共享同一套感知体系 [48] - 灵巧手终端包括用于数据采集的Glove系列和用于执行任务的Dex系列 [49] 团队背景 - 创始人兼CEO陈亦伦,曾任大疆机器视觉总工程师、华为自动驾驶系统CTO、清华大学AIR研究院智能机器人方向首席科学家,是华为L2自动驾驶技术的发端者 [54] - 联合创始人兼首席科学家丁文超,90后,是华为“天才少年”计划首批入选者,从0到1主导了华为ADS智驾端到端决策网络 [56] - 董事长李震宇,曾任百度集团资深副总裁,一手组建并长期领导百度自动驾驶事业部 [56] 商业化潜力与行业定位 - 技术演示覆盖家庭和车间场景,展现了商业化潜力 [10] - 公司商业化构想不局限于ToB或ToC,计划依靠具身智能的Scaling Law全面覆盖 [58] - 公司认为其展示的是一种“确定性”,即机器人将成为能够长期稳定工作的可靠智能体,融入生产与生活 [52]
4.98万就能买机器人通用基座?!一机三态,多场景验证,标配VLA大脑
量子位· 2025-12-19 20:16
文章核心观点 - 逐际动力推出的多形态具身机器人TRON 2,通过“一机三态”的通用基座设计,集成了高性能、快速部署和成本可控等特性,旨在解决行业在VLA操作科研、多场景验证及快速部署方面的关键痛点,代表了具身机器人向通用化、实用化发展的重要一步 [10][31][33][44] TRON 2产品核心特性与性能 - **多形态自由切换**:TRON 2采用一个通用基座,可在双臂、双足、双轮足三种核心构型之间自由切换,并支持人形、四足等多种形态的实验性重构,实现“一机多能” [10][11] - **上肢高性能设计**:采用7-DoF类人构型单臂关节,模仿人类手臂灵活度,使动作更自然可控 [18];末端采用仿人球形手腕结构,具备高自由度旋转能力,以提升在狭小空间内的精准对位能力 [20];臂展达到70cm,具备大范围包络,可胜任远距、高位、宽场景操作任务 [23] - **强大的移动与负载能力**:同时支持双轮和双足两种移动模式,具备全地形移动、避障、环境感知及上下楼梯行走能力 [26][27];拥有30kg有效负载和长达4小时的续航能力 [29] - **集成主流AI模型**:系统层面适配了主流大模型Pi 0.5及ACT,并围绕家庭场景进行了任务细化,可完成超过10类家庭高频任务 [25] 产品定位:科研验证与快速部署平台 - **解决科研部署痛点**:产品设计旨在简化部署流程,提供二次开发资料与标准化接口,用户30分钟可完成基础启动,2小时内能走完从开发环境配置到首次任务执行的全流程 [36] - **提供完整开发工具链**:配备VLA开发工具包,内置完整示例教程及可一键启动的预设功能模块,可直接对接Pi 0.5、ACT等主流大模型 [36];将数据采集、训练验证与部署测试打通成一套闭环系统,内置原生平台,提高科研效率与稳定性 [38] - **充当多场景验证基座**:TRON 2定位为具身机器人进入场景落地的验证平台,其“一机多态”的通用基座允许不同构型和算法在同一套硬件上反复进行低成本、高可靠性的真实验证,以明确具体场景的落地路径 [40][41][42][43] 公司技术路线与行业意义 - **长期主义的技术路线**:逐际动力自2022年成立起,便聚焦于机器人底层的运动控制与通用本体平台,而非整机形态 [45];其方法论是以“强小脑”确保动作稳定,用“补大脑”对接演进算法,并通过开放生态将身体能力交给开发者 [45] - **清晰的迭代节奏与资本认可**:产品线从TRON 1的“三合一”足端多模态构型,到全尺寸人形机器人LimX Oli,再到TRON 2,始终围绕用户真实使用中的关键卡点进行原始创新 [45];公司获得了阿里巴巴、蔚来资本、联想创投等产业资本投资,并于今年7月获得京东的战略领投 [45] - **推动行业通用化发展**:TRON 2的设计体现了对通用能力和高性价比长期演进的追求,其下层提供稳定通用的身体能力,上层可持续接入以VLA为代表的大脑能力,使硬件能随任务和模型演进不断扩展,具备跨技术栈、跨场景使用的条件 [47][48];公司在具身智能时代正展现出全球第一梯队的水平 [49]