基座模型
搜索文档
新设人形机器人团队,李想「梭哈」具身智能,能救得了理想吗?
36氪· 2026-02-09 08:07
公司战略转型 - 理想汽车正在进行一次以“具身智能”为核心的战略转型,将汽车重新定义为“具身智能”的一种形态,旨在跳出汽车行业的同质化竞争,在更高维度的AI赛道上重新定义自己[5][7] - 公司CEO李想判断,未来全球能同时布局基座模型、芯片、操作系统和具身智能的公司不会超过3家,理想的目标是挤进这个“三人俱乐部”[3][7] - 此次转型伴随着伤筋动骨的研发体系重组,新设了人形机器人团队、软件本体团队、基座模型团队,并将原自动驾驶部门拆解后重新分配[3] 组织架构调整 - 基座模型团队由詹锟负责,承接了原自动驾驶部门大部分员工,聚焦VLA与自研芯片的协同开发,定位是为汽车和机器人提供统一的AI底层能力[4] - 软件本体团队由智能空间副总裁勾晓菲掌舵,统筹智能座舱与智能驾驶研发,旨在让软件能力在车和机器人之间复用[4] - 人形机器人团队由自动驾驶研发高级副总裁郎咸朋直接负责,并将原自动驾驶部门的AI评测、数据标注等核心班底“成建制”迁移,宣告公司将自动驾驶积累的核心能力全面迁移至具身智能领域[4] 财务与竞争压力 - 2025年第三季度,理想汽车营收同比下滑36.2%,净亏损6.25亿元,结束了连续11个季度的盈利纪录,正经历成立以来最艰难的时刻[3][15] - 公司面临严峻竞争格局:问界凭借华为智驾蚕食其核心市场;小鹏、蔚来加快智驾技术迭代;零跑、深蓝等在20万以下市场发动性价比攻势[15] - 公司产品差异化优势正在迅速稀释,增程技术被同行跟进,“冰箱彩电大沙发”成为行业标配,电动车参数竞争已陷入内卷死胡同[7][15] 人形机器人业务布局 - 理想汽车将人形机器人视为“第二增长曲线”,其在该领域的布局早有伏笔,包括2024年1月引入机器人研发专家廖平平研发工业机器人,以及2025年6月内部成立“空间机器人”和“穿戴机器人”部门[9] - 公司押注人形机器人的底气来自于与自动驾驶技术的高复用性,包括视觉感知、决策算法等能力,以及激光雷达、摄像头等硬件供应链超过50%的重合度[10] - 公司正在自研的M100芯片,未来可能成为汽车与机器人的通用计算平台,通过“一芯多用”策略降低边际成本[11] 转型面临的挑战与风险 - 公司主业承压,却同时开辟基座模型、芯片、OS、人形机器人四条高投入战线,对现金流管理是极大考验,“梭哈”式投入可能导致主业失血[8][16] - 人形机器人赛道技术难度高,面临非结构化环境、高柔性操作等挑战,其复杂度远超汽车底盘控制[13] - 公司入局时间已显落后,相比特斯拉从2015年开始布局,理想直到2026年才正式组建团队,已落后至少5年,且该赛道尚无产品实现大规模量产和盈利,具有高投入、长周期、高不确定性的特点[14] - 此次战略转型更像是在主业增长焦虑下的“不得已”突围,是一场风险极高的“跨界远征”,公司需要同时应对汽车主业守成、智驾技术追赶、机器人业务从零建立的三线挑战[16][19]
近期小破圈高情绪价值的艺术相框来自李想首先提出并经过集体共创
理想TOP2· 2026-02-02 15:22
公司产品功能开发背景 - 艺术相框应用最初由公司创始人李想本人在理想L6上市共创会上提出[1] - 公司深度思考了用户在车内能与何种内容产生共鸣 并精调提示词制作了现有模板[1] - 开发过程中存在许多因生成不稳定而被放弃的创意 但公司将持续推进 未来会有更多有趣模板上线[1] 公司产品执行标准与理念 - 公司要求自身率先将该功能搭载上车 且执行标准必须是行业最好 审美不能差 否则无法向用户推广[1] - 公司认为执行难度与用户无关 核心是将产品做出来以创造价值[1] 产品功能应用场景 - 产品功能的应用场景之一是“复活”去世的宠物[4] - 有观点认为 若公司创始人李想投入足够精力 该功能在提升用户情绪价值方面潜力巨大[4] 行业技术挑战 - 打造一个足够强大且能跨端使用的基座模型被视作一个非常难以攻克的技术难题[4]
为什么不让李想谈AI?
36氪· 2026-01-28 19:56
公司战略转向 - 公司CEO李想在全员会上宣布将全面投入人工智能领域,断言2026年是成为AI头部公司的最后“上车”机会,并承诺最晚2028年实现L4级自动驾驶落地 [1] - 公司研发组织架构将进行剧变,重组为“基座模型团队”、“软件本体团队”和“硬件本体团队”三大支柱,汽车与人形机器人均被归入“硬件本体”范畴 [1] - 公司计划在2024年的研发总投入超过120亿人民币,其中很多将用于人工智能相关技术的研发,涵盖基础模型、推理芯片到云端算力 [2] 技术路径与投入 - 公司正倾力打造VLA模型,旨在实现从感知到决策的“端到端”自动驾驶,统一空间、语言和行为智能 [3] - 公司正试图构建一个封闭、全栈自研的技术体系,包括自研基座大模型MindGPT、规划中的自研芯片M100、操作系统及核心算法 [8] - 公司在AI领域的投入与特斯拉等巨头相比仍有差距,特斯拉2024年研发投入高达45.4亿美元,并计划为AI算力再投入100亿美元 [9] 公司经营与市场现状 - 公司2025年第三季度实现营收274亿元,同比下滑36.2%;新车交付量为93,211辆,同比下降39.0% [6] - 公司当季由盈转亏,净亏损6.24亿元,终结了自2022年第四季度起连续11个季度的盈利纪录 [6] - 公司面临来自华为、小米、小鹏等对手的激烈竞争,且过去被视为“护城河”的精准产品定义和市场节奏在MEGA车型失利后受到质疑 [6] 行业竞争背景 - 根据IDC数据,预计今年全球智能驾驶汽车销量将达到8930万辆,AI已成为定义产品、驱动增长的核心引擎 [3] - 特斯拉、华为、比亚迪等国内外竞争对手均在智能驾驶和智能座舱领域进行激烈竞争,没有强大的AI能力意味着没有未来入场券 [3] 内部管理与员工反应 - 员工对全员会的反应以吐槽和困惑为主,他们更关心眼前的销量、KPI、年终奖以及公司对现实问题的回应,而非遥远的AI愿景 [1][4] - 员工中存在对年终奖打折、承诺的14-16薪未能完全兑现以及高强度工作压力的抱怨 [6] - 组织架构重组为三大团队后,可能增加跨团队沟通成本和技术磨合障碍,并导致从事传统汽车业务的工程师感到战略重心转移 [12] 领导风格与挑战 - CEO李想的风格被认为越来越像马斯克,体现在对AI的狂热、对人形机器人的执着以及个人IP风格上 [2][8] - 公司面临着将宏大AI战略“翻译”为员工可理解、可执行的共同语言和行动纲领的挑战,员工更关心AI技术如何转化为当前产品的具体竞争力 [14] - 与马斯克通过将梦想分解为可执行挑战来激励团队相比,公司在展示远景时缺乏清晰的实现路径和角色定义 [15]
苹果回应iPhone Air降价,阶跃星辰完成超50亿元融资 | 蓝媒GPT
搜狐财经· 2026-01-27 05:14
腾讯AI社交与投资布局 - 腾讯董事会主席马化腾宣布AI应用“元宝”将推出名为“元宝派”的AI社交新玩法,旨在探索AI在多人社交场景的深度融合,并计划展开春节分10亿元现金活动,以期重现微信红包盛况 [1] - 大模型创业公司阶跃星辰完成超50亿元人民币B+轮融资,刷新过去12个月中国大模型赛道单笔最高融资纪录,腾讯作为老股东持续跟投 [1] - 阶跃星辰本轮融资资金将主要用于基础大模型研发,打造全球顶尖基座模型,并加速“AI+终端”战略的商业化落地,公司同日任命印奇为董事长,核心战略聚焦“基础大模型”与“AI+终端” [1] 车企与科技公司的AI战略动向 - 理想汽车CEO李想召开全员会分享AI趋势判断,强调2026年是成为AI头部公司的最后上车时间,最晚2028年L4级自动驾驶一定能落地,并认为同时布局基座模型、芯片、具身智能、操作系统等业务的公司全球最终不会超过3家,理想汽车将努力成为其中一家 [2] - 李想明确表示理想汽车在汽车业务之外一定会做人形机器人,并会尽快落地亮相,同时计划招聘顶尖人才,包括从机器人创业公司召回人员 [2] - 京东科技购物智能体JoyGlance正式登录智能眼镜品牌乐奇Rokid,标志着全球首款智能眼镜购物应用进入实际可用阶段,该应用由京东旗下大模型JoyAI支持 [2] 海外科技巨头的企业市场与产品策略 - OpenAI首席执行官萨姆・奥特曼向企业高管传递信号,表明公司正郑重布局企业客户市场,旨在成为满足企业所有AI需求的一站式服务商,其产品矩阵覆盖ChatGPT、Codex及工作流自动化模型 [3] - OpenAI首席执行官宣布接下来一个月将推出许多与Codex相关的产品,发布从下周开始,Codex被描述为一套高度成熟的智能编程辅助生态系统 [3] - Meta宣布在开发新版人工智能角色期间,将暂停全球青少年用户访问现有人工智能角色的权限,此限制未来数周生效,在此期间青少年仍可通过Meta AI助手获取信息,系统将启用年龄保护措施 [4] 消费电子与产品发布动态 - 小米集团董事长雷军表示新一代SU7卡布里蓝实车非常漂亮,公司争取在春节前让部分样车进店,以供消费者到店体验,目前该车型已开始接受小订 [3]
李想:理想一定会做人形机器人,会尽快落地亮相
新浪财经· 2026-01-26 19:08
公司战略与AI趋势判断 - 理想汽车CEO李想判断,2026年是所有想要成为AI头部公司上车的最后一年[1][2] - 公司判断最晚2028年,L4级别自动驾驶一定能落地[1][2] - 公司认为,同时布局基座模型、芯片、操作系统、具身智能等业务的公司,最终全球不会超过3家,理想汽车会努力成为其中一家[1][2] 公司品牌定位与业务布局 - 未来,理想汽车会进一步强化具身智能的品牌定位,而不仅仅是创造移动的家[1][2] - 公司明确,在汽车之外,一定会做人形机器人,并会尽快落地亮相[1][2] - 公司CEO李想曾在2024年底表态,理想做人形机器人的概率是100%[1][2] - 近日,理想汽车在官网社招页面释放若干人形机器人研发岗位,释放出布局具身机器人研发的明确信号[1][2] 公司组织架构调整 - 为迎接新一轮的AI竞争,公司将对研发进行新一轮的组织变革[1][2] - 研发团队将按照基座模型团队、软件本体团队、硬件本体团队等进行划分[1][2] - 其中汽车、机器人等都归为硬件本体团队[1][2]
本田讴歌预告新一代RDX:首款双电机混合动力系统讴歌车型;理想调整基座模型业务:詹锟接手,VLA 研发整合丨汽车交通日报
创业邦· 2026-01-15 18:15
汽车行业召回与供应链动态 - 因零部件缺陷 现代汽车 保时捷韩国分公司及其他两家汽车制造商将在韩国自愿召回总计344,073辆汽车 涉及74款车型 [2] 自动驾驶与人工智能技术整合 - 理想汽车调整自动驾驶业务架构 自动驾驶高级算法专家詹锟接手基座模型业务 整体负责VLA基座模型研发 相关团队将整合以支持自动驾驶 智能座舱及未来机器人业务 [2] - 詹锟的汇报关系由向自动驾驶研发高级副总裁郎咸朋汇报 改为向理想CTO 系统与计算群组负责人谢炎汇报 但其仍继续负责智能驾驶VLA模型研发及工程化平台化工作 [2] - 现任基座模型负责人陈伟或将离职加入创业行列 [2] 产业链战略合作 - 宁德时代与中国长安汽车签署为期五年的全面深化战略伙伴关系备忘录 双方将在技术应用 市场拓展 模式创新 海外布局及品牌传播等方向开展合作 [2] 新产品与技术路线 - 本田讴歌宣布新一代讴歌RDX紧凑型SUV 这将是首款配备双电机混合动力系统的讴歌车型 目前处于开发中 计划未来数年内正式上市 [2] - 为配合新版RDX上市 2026款RDX计划在2024年晚些时候停产 [2]
理想调整基座模型业务:詹锟接手,VLA 研发整合
新浪财经· 2026-01-15 10:34
公司人事与组织架构调整 - 理想汽车自动驾驶高级算法专家詹锟将接手基座模型业务,整体负责公司的VLA(视觉-语言-行动)基座模型研发 [1] - 詹锟的汇报关系发生变更,改为向理想CTO、系统与计算群组负责人谢炎汇报,不再向自动驾驶研发高级副总裁郎咸朋汇报 [1] - 现任基座模型负责人陈伟或将离职加入创业行列 [1] 公司技术研发战略整合 - 公司将相关技术研发团队充分整合,以VLA基座模型为技术支撑,服务于自动驾驶、智能座舱以及将来可能的机器人等业务 [1] - 詹锟在负责基座模型业务的同时,仍然负责智能驾驶VLA模型研发,并继续将模型能力工程化和平台化 [1]
清华唐杰:领域大模型,伪命题
量子位· 2025-12-26 16:52
文章核心观点 - 文章系统阐述了人工智能大模型发展的八个关键方向与趋势 核心观点认为 通过持续扩大数据、参数和计算来扩展基座模型仍是最高效的路径 而模型能力的真正提升和价值的实现 依赖于对齐、推理增强、Agent化、记忆、在线学习等关键技术的发展 最终目标是让AI替代人类工作、创造增量价值 而非仅仅创造新的应用 [4][5][6][10][17][32] 关于基座模型扩展 - 预训练使大模型掌握了世界常识并具备简单推理能力 [4] - 获取更多数据、使用更大参数和更饱和的计算 仍然是扩展基座模型最高效的办法 [5] - 基座模型继续扩展规模仍然高效 [6] 关于激活对齐与增强推理能力 - 真实使用体验的进一步提升 绕不过对长尾能力的对齐和推理能力的增强 [6] - 激活对齐和增强推理能力 尤其是激活更全面的长尾能力 是保证模型效果的另一关键 [7] - 通用基准测试的出现评测了模型通用效果 但也可能导致模型过拟合 [7] - 真实场景下的关键是如何让模型更快、更好地对齐长尾场景 增强实际体验 [8] - 训练中期和后期的技术使得更多场景的快速对齐和强推理能力成为可能 [9] 关于智能体 - 智能体是模型能力扩展的里程碑 体现了AI模型进入人类真实世界的关键 [10] - 没有智能体能力 大模型将停留在理论学习阶段 无法转化为生产力 [11] - 原先智能体通过模型应用实现 现在模型已可直接将智能体数据集成到训练过程 增强了通用性 [11] - 不同智能体环境的泛化和迁移是难题 最简单的办法是增加不同环境的数据并进行针对性的强化学习 [11] - 智能体代表模型开始进入环境、开始形成生产力 [6] 关于模型记忆 - 实现模型记忆是模型应用到真实环境必须具备的能力 [12] - 大模型实现类似人类短期、中期、长期和历史记忆的不同阶段是关键 [13] - 上下文、检索增强生成和模型参数可能分别对应人类的不同记忆阶段 [13] - 一种方法是压缩记忆并存储在上下文中 如果大模型支持足够长的上下文 则有可能实现短中长期记忆 [13] - 如何迭代模型知识、更改模型参数仍是个难题 [14] 关于在线学习与自我评估 - 有了记忆机制 在线学习成为重点 目前大模型定时重新训练的方式存在浪费和丢失交互数据的问题 [14][20] - 实现在线学习是关键 自我评估是在线学习的关键点 模型需要知道对错才能自我改进 [14] - 构建模型的自我评价机制是个难题 [15] - 这可能成为下一个扩展范式 [15] - 模型的自学习自迭代将是下一阶段的必然能力 [20] 关于模型研发与应用结合 - 大模型发展越来越端到端 需将模型研发与模型应用结合 [16] - AI模型应用的第一性原理不应该是创造新的应用 其本质是通用人工智能替代人类工作 [17] - 研发替代不同工种的AI是应用的关键 [17] - 聊天部分替代了搜索 并融合了情感交互 [18] - 明年将是AI替代不同工种的爆发年 [19] - 大模型应用需要帮助人、创造新的价值 [34] - 如果AI软件没人用、不能产生价值 则没有生命力 [35] 关于多模态与具身智能 - 多模态是未来且有前景 但当下多模态不大能帮助提升通用人工智能的智能上界 [21][22] - 最有效的方式可能是文本、多模态、多模态生成分开发展 适度探索三者结合需要勇气和雄厚资本 [23] - 具身智能的痛点在于太难通用 少样本激活通用具身能力基本不可能 [23] - 解决方案是采集或合成数据 但这都不容易且昂贵 [23] - 一旦数据规模上去 通用能力出来自然会形成门槛 [24] - 机器人本身的不稳定和故障频繁也限制了具身智能的发展 [25] - 预计2026年这些领域将取得长足进步 [26] 关于领域大模型与大模型应用 - 领域大模型是个伪命题 通用人工智能实现后不应有领域特定的通用人工智能 [27][28] - 但在通用人工智能实现前 领域模型会长时间存在 [28] - 领域模型的存在本质上是应用企业希望构建领域知识的护城河 不希望AI入侵 希望把AI驯化为工具 [29] - AI的本质是海啸 将卷走一切 一定有一些领域公司会走出护城河 卷进通用人工智能的世界 [30] - 领域的数据、流程、智能体数据会慢慢进入主模型 [31] - AI的应用有两种路径:一种是将原有需要人参与的软件AI化 另一种是创造能替代人类某个工种的全新AI软件 [33]
6666!NuerIPS满分论文来了
量子位· 2025-11-11 19:11
文章核心观点 - 一篇来自清华大学和上海交通大学的研究论文在NeurIPS 2025上获得四位审稿人一致给出的满分6分,成为该会议唯一的满分论文[1] - 论文的核心结论挑战了行业普遍认知,指出真正决定大语言模型推理能力上限的是基座模型本身,而非强化学习训练方法[1] - 研究结果表明,知识蒸馏方法比强化学习更有潜力实现大模型能力的自我进化,这对当前主流的RLVR技术路线提出了重要质疑[1][12] 研究方法与实验设计 - 研究团队采用pass@k作为关键评估指标,该指标通过多轮采样揭示模型的真实推理边界,能更精准判断模型是否"有能力"解决问题[14][15] - 实验覆盖大语言模型推理能力的三大典型应用领域:数学推理、代码生成和视觉推理,并搭配GSM8K、MATH500、LiveCodeBench、MathVista等权威基准数据集[17] - 模型选择以主流大语言模型家族为基础,包括Qwen2.5系列和LLaMA-3.1等,构建了"基础模型vs RLVR训练模型"的多组平行对照[18] - 针对每个测试样本,让基础模型和RLVR模型进行不同次数的采样,k值从1逐步提升至1024,记录每次采样中"至少出现一个正确结果"的概率[20] 关键研究发现 - RLVR主要是在"强化"底模已有的推理路径,而不是"发现"底模没有的新路径[10] - RL训练后的模型在低采样次数下表现更好,但随着采样次数增加,底模反而能超过RL模型,说明底模隐藏的推理能力被低估了[10] - 多种RL算法在提升采样效率方面差异不大,且与"理论上底模最大能力"相比仍有明显差距[10] - 蒸馏方法更有可能"扩展"模型的推理能力范围,因为其接收来自教师模型的新推理模式,而RLVR更受限于底模[10] 研究团队背景 - 研究团队由8位研究人员组成,其中7位来自清华大学LeapLab,1位来自上海交通大学[24] - 项目负责人Yang Yue是清华大学自动化系四年级博士生,研究方向为强化学习、世界模型和多模态大模型[25] - 通讯作者Gao Huang是清华大学自动化系副教授、博士生导师,LeapLab负责人,以提出经典卷积架构模型DenseNet而闻名[31][32]
周鸿祎回应360没有做基座模型言 称360不是在做套壳
格隆汇APP· 2025-09-24 14:15
360大模型战略定位 - 公司未开发大参数通用大模型 因需至少100亿美元投入且国外巨头已累计投资4000亿美元 [1] - 公司否认采用套壳模式 强调智能体需多专业模型支撑包括推理模型、编程模型及意图猜测路由模型 [1] - 公司保持千亿参数规模基座模型训练能力 并通过智能体工程化反哺基座模型优化 [1] 行业投资与技术路径 - 通用大模型领域存在极高资金壁垒 单企业基础投入门槛达百亿美元级别 [1] - 智能体开发需独立构建完整智力底座 涉及蒸馏板以外的多类型专业化模型协同 [1] - 巨头企业已形成规模化投资优势 行业资源集中度显著 [1]