Workflow
理想同学
icon
搜索文档
新L9能否撑起李想的AI梦?
雷峰网· 2026-02-06 20:36
文章核心观点 - 全新一代理想L9是行业首款具身智能汽车,其通过全栈自研构建了从AI大模型、操作系统、芯片到全主动悬架和全线控底盘的完整技术栈,旨在让车辆从被动工具进化为可理解环境并执行复杂任务的智能生活伙伴[2][3][11][24] 产品定位与理念演进 - 2022款理想L9以“冰箱彩电大沙发”为主要卖点,虽受行业质疑,但其在2022年9月实现月销破万,2023年3月理想单月销量达2万台,并以40万元平均成交价领跑高端SUV,市场接受度验证了其作为生活伙伴的初步理念[6] - 公司产品理念从“车和家”场景出发一以贯之,即让车辆从被动工具变成主动的生活伙伴,这正契合具身智能的核心——物理生活空间[8] - 2023年初,公司愿景从“成为全球第一的智能电动车企业”变更为“成为全球领先的人工智能企业”,技术投入服务于构建通用人工智能能力,并在全新L9上释放阶段性成果[10] 核心技术配置与升级 - **自研芯片**:全新L9首发自研车规级5nm“马赫100”芯片,单颗算力接近1280TOPS,整车算力达到2560TOPS,其输出能力接近英伟达Thor的三倍,是目前量产车型中最大的算力配置[3][13] - **底盘与悬架系统**:全新L9搭载自研800V全主动悬架系统和“完全体”全线控底盘(含线控转向、四轮转向及EMB系统),实现四个车轮毫秒级独立响应,首次让智能体的“决策大脑”与“物理身体”形成闭环[3][13][14] - **系统融合**:以统一大模型为核心,打通辅助驾驶、座舱交互、车辆控制等割裂系统,配合中央域控制器XCU实现计算资源统一调度,使算法能理解真实物理世界并直接作用于整车行为[2][3][13] 组织架构与战略调整 - 公司创始人李想从2021年起坚定推动AI转型,在2023年自研大模型过程中为团队批了三四千张卡(芯片)的资源,团队累计拥有近八千张卡[18] - 自研技术路径要求团队对赌,明确用户体验提升点和交付节点,自2021年起已陆续交付自研感知系统、中央域控制器XCU、大模型MindGPT、操作系统星环OS、端到端AD大模型及VLA司机大模型等一系列成果[19][20][21] - 2025年下半年,华为系高管先后离开,公司宣布重回创业公司管理模式,优先级从“销量第一、口碑第二”调整为“用户口碑第一”,并聚焦用户价值全面转型为AI公司[21][22] - 为应对AI竞争,公司重组组织架构,以AI技术为核心建立跨职能体系,并将智驾部门重要负责人转去负责具身智能,体现了对具身智能机器人的阶段性重押[22] 市场竞争与行业对比 - 800V全主动悬架过去多见于法拉利Purosangue、保时捷Panamera E-Hybrid及蔚来ET9等顶级豪华车型[15] - 2025年12月,在大型SUV市场中,蔚来ES8、问界M8和极氪9X位列前三,问界M9第四,理想L9排名第12[15] - 行业观点认为,800V全主动悬架和“完全体”全线控底盘的组合是竞品暂未补上的配置,全新L9有望凭此重新拿回市场优势[15] 价格与上市信息 - 全新一代理想L9的价格区间将落在60万以内,其中特别版售价在55万以上,与其它9系旗舰车型看齐[4] - 该车型近期将进入工信部产品公示阶段,计划于今年第二季度上市[2][21]
理想AI,步入深水区
36氪· 2026-01-31 11:06
公司战略转向 - 公司创始人李想召开线上全员会,强调2026年是所有想要成为AI头部公司上车的最后一年,最晚2028年L4一定能落地,同时再次明确公司一定会做人形机器人,且会尽快落地亮相 [1] - 公司决定全面步入AI深水区的动作,呈现出从容布局和“箭在弦上”的双重特征,一方面是软硬件技术积淀成熟,另一方面则是内外部挑战之下的压力倒逼 [1] - 公司打破按车型划分团队的组织架构,组建基座模型、软件本体、硬件本体三大团队,标志着在通用底座之上,公司希望让汽车与机器人“两条腿”同时开启加速 [4] 技术储备与项目进展 - 公司自研的智驾芯片M100即将上车新一代L9,该芯片本身就是为具身智能架构所设计,在成本和效率方面将有效助力人形机器人 [4] - 公司VLA司机大模型经过了几亿公里的行驶数据验证,已具备空间智能、语言理解与行为决策能力,能直接迁移至机器人的感知-决策-执行闭环,大幅提升基础模型开发工作量 [5] - 在硬件复用方面,电池、电机、传感器、域控制器等汽车核心部件与人形机器人的重合度或将超过50% [6] - 公司官网开始密集释放岗位招聘,覆盖人形机器人全流程岗位,包括核心部件、算法、软硬件与平台集成等多个方向,这被外界广泛视作公司大规模重启人形机器人项目的前奏 [4] 市场与产品信心来源 - 公司穿戴部门量产的第一代产品Livis AI眼镜,凭借不错的综合性能表现和极致的性价比,在上线几天内就售罄了未来两个月的产能,且非理想车主的用户比例不低,展现出一定的破圈吸引力 [2][4] - AI眼镜的这场“小胜”,是公司上马人形机器人的信心来源之一 [4] - 公司早早实现盈利,是新势力中资金储备最充裕的玩家,对于机器人这个需要长期持续投入的赛道,这是一个无法忽视的优势 [15] 行业竞争与外部压力 - 跨界具身智能已成为车企当下的大趋势,特斯拉的Optimus和小鹏的IRON都已计划在2026年实现量产,奇瑞、广汽、长安的机器人也已不同程度亮相或应用 [9] - 有行业人士认为,如果公司从零起步,可能需要两年时间才可能达到小鹏IRON去年公开展示时的水平 [9] - 高端人才离职创业具身智能是行业共同难题,例如前公司自动驾驶技术研发负责人贾鹏与前公司CTO王凯创立了具身智能公司至简动力,该公司成立短短几个月估值已逼近“独角兽”阵营 [11] - 公司必须尽早敲定具身智能计划,以稳住内部人才并吸纳外界顶级人才 [11] 汽车业务现状与挑战 - 据乘联会最新数据,2025年国内汽车行业销售利润率降至4.1%,创下历史新低,其中12月这一数据仅有1.8% [12] - 公司为2026年制定了约40%的增长计划,对应约55万辆的销量目标,首要目标是“找回失地”,进一步加固增程和高端市场的基本盘 [13] - 公司表示后续将陆续关闭部分在扩张期铺开的低能效门店,包括不赚钱的商超门店,并且对一线管理者提出更高要求,进行全面收敛与提效 [15] - 新L9将采用新设计,在尺寸和底盘上进一步升级,增程电池将扩大到70度,对应纯电续航超400公里,同时座舱芯片也将升级 [15]
李想的理想是AI?
36氪· 2026-01-29 20:44
公司战略转向 - 理想汽车CEO李想于1月26日临时召开无预告、无议题的线上全员会,全程只讲AI,不谈汽车,引发内部员工困惑[2][3] - 此次会议传递出公司“All in AI”的强烈信号,战略转向节奏极快,不同于通常需要半年磨合期的常规做法[5] - 公司官网在会议前几天已挂出人形机器人社招岗位,消息传出后,其美股开盘即上涨约7%,市场对其“具身智能”新故事给予积极反应[4] 管理层AI趋势判断 - 李想做出AI最新趋势判断:2026年是所有想成为AI头部公司“上车”的最后一年[9] - 公司明确将在汽车业务之外布局人形机器人,并会尽快落地亮相[10] - 公司认为未来能同时布局基座模型、芯片、操作系统、具身智能等业务的公司全球不会超过3家,理想汽车将努力成为其中之一[11] - 管理层判断最晚到2028年,L4级别自动驾驶一定能实现落地[12] 组织架构调整计划 - 为迎战AI浪潮,公司即将启动新一轮研发组织变革,核心是智驾团队将成为调整焦点并面临拆分[13] - 研发团队计划拆分为基座模型、软件本体、硬件本体三大板块,汽车与机器人等业务将并入硬件本体板块[14] 公司财务表现 - 2025年前三季度,理想汽车净亏损6.24亿元人民币,出现扭盈转亏[7] - 2025年第三季度,公司营业收入为273.65亿元人民币,同比下降36.17%[8] - 2025年第三季度,公司净利润为-6.24亿元人民币,净利润同比大幅下降122.14%[8] 行业背景与竞争 - 不止理想汽车,腾讯近期也宣布加注AI(元宝),马化腾表示“腾讯做AI晚了”,马云也频繁就AI时代发声,形成“三马话AI”的行业关注现象[17][18][19] - 特斯拉的马斯克已布局AI与机器人,且特斯拉在稳定盈利后有余力拓展,而理想汽车在业绩未稳健时转向,节奏更为激进[16] - 行业认为AI关乎第四次工业革命,未来有10万亿美元市场的潜力,任何有余力的公司都会想方设法向此方向发力[21][23] 转型挑战与基础 - 汽车的核心已从发动机变为智能驾驶,而智驾依赖的芯片、算法、算力等技术底层逻辑与具身智能机器人相通,此为理想汽车转型的技术基础[25][26] - 公司转型AI存在短板:一是物理入口(汽车)属于高质量但低频场景,需通过眼镜、音箱等设备扩大用户接触面[28];二是基座模型仍需打磨,在投入量级上无法与Gemini、豆包、千问等竞争[28] - 同时布局模型、具身智能、芯片和操作系统是一项大工程,对公司构成不小挑战[28]
预期理想的纯软的大语言模型在较长一段时间都无法国内前三
理想TOP2· 2026-01-17 20:08
公司大语言模型目标与现状 - 公司创始人李想在2024年12月的AI Talk中提出,要求团队在未来几年必须保证大语言模型的基座模型能力在中国范围内达到行业前三,并承诺投入所需训练算力 [2] - 该目标被具体分解为从10名开外先进入前五,再从第五进入第三的跟随策略,但此后创始人未在公开场合重复提及此目标 [1][2] - 以2024年12月27日发布的手机版“理想同学”应用框架为判断依据,公司当时不具备实现该目标的能力 [1][2][3] 大语言模型领域竞争格局 - 公司在大语言模型基座能力方面的主要潜在竞争对手包括豆包、DeepSeek、Qwen、Kimi,2025年需直接超越其中两家,挑战巨大 [1][3] - 至2026年1月17日,竞争对手名单中还需加入MiniMax,公司在纯软件大语言模型领域超越这五家公司中的三家难度非常大 [1][3] - 其中超越DeepSeek被认为是最困难的,其优势源于创始团队在高原创度、有业界影响力的论文及可验证的科学工程化成果方面的深厚认知 [3] 公司在具身智能领域的机遇 - 在具身智能(AI控制现实物理硬件)领域,公司拥有冲击国内前三乃至榜首的潜力 [1][4] - 公司被归类为“全栈闭环AI软硬结合派”,与特斯拉、苹果模式类似,主张算法定义硬件,追求系统极致效率 [4][6] - 该潜力能否实现并非必然,高度依赖于行业自身发展以及创始人李想的学习进化速度与决策执行质量 [1][4][6] 创始人认知与公司战略演进 - 创始人李想对AI的认知在近几年内飞速成长,被业界人士评价为“学习进化的机器” [7][8] - 公司的发展节奏借鉴了创始人早年经营汽车之家的经验,即通过明确目标、快速迭代实现排名跃升(如从100名外进入前五,再至第一) [6] - 然而,在大语言模型进入前三的目标上,公司未能复刻汽车之家的成功节奏,表明最前沿的大语言模型竞争对创始人认知要求极高 [6] - 外部观察显示,创始人从2024年初对AI“理解不足够深刻”,到2024年底被认为是“国内车企一把手里最懂AI的”,认知迭代迅速 [8] 公司技术进展与战略决心 - 2025年6月,公司的VLA(视觉语言动作)模型创新度被评价为DeepSeek MoE水平,低于DeepSeek MLA的创新水平 [8] - 2025年10月,有证据表明公司智驾技术是参考而非简单跟随特斯拉 [8] - 2026年1月的人事调整被视作公司在具身智能战略上动真格的标志 [8] - 创始人描绘的远期愿景是实现类似《钢铁侠》中Jarvis的能力,若实现则意味着其大语言模型能力将非常强大,但这将是远期目标 [1]
晚点独家丨理想调整基座模型业务:詹锟接手,VLA 研发整合
晚点LatePost· 2026-01-15 10:17
公司战略与组织架构调整 - 理想汽车将自动驾驶高级算法专家詹锟的汇报关系进行调整,其改向公司CTO、系统与计算群组负责人谢炎汇报,不再向自动驾驶研发高级副总裁郎咸朋汇报,并整体负责VLA基座模型研发,将相关技术团队充分整合[4] - 此次调整将VLA从单个项目升级为公司层级的基座模型,从组织层面明确了以VLA为核心的AI战略方向,资源需进一步向具身智能集中[6] - 支撑公司发展的底层大模型能力,核心是以VLA为基础构建的完整Agent系统,旨在将旗下所有产品都视为机器人,包括车和未来的AI终端[6][7] VLA模型定义与业务整合 - VLA模型此前由两个部门分治:“L”(语言)部分由基座模型负责人陈伟主导,对标ChatGPT、DeepSeek等大模型;“V”(视觉)和“A”(行动)部分由自动驾驶团队主导,聚焦工程化和平台化[6] - 整合后,詹锟将整体负责VLA基座模型研发,为自动驾驶、智能座舱以及将来可能的机器人等业务提供技术支撑,其仍继续负责智能驾驶VLA模型研发,将模型能力工程化和平台化[4] - VLA中的V代表感知物理世界,L代表规划和决策,A代表行动,在物理世界中,轨迹移动和手臂操作属于行动范畴;在数字世界中,行动包括理解用户语言、调用外部工具及多智能体协作[6] 关键人事变动与影响 - 原基座模型负责人陈伟或将加入创业行列,其于2021年加入理想任AI首席科学家,曾负责智能助手“理想同学”和大模型Mind GPT的开发[4][7] - 詹锟于2016年从北航毕业,曾在百度Apollo负责自动驾驶预测算法,2021年加入理想后聚焦自动驾驶架构与三代技术栈部署,于2025年9月出任智能驾驶部门下设的“VLA模型”部门负责人[7] - 在AI大模型爆发后,理想内部已有多位技术人才离职创业,但部分已离职人士如维他动力的赵哲伦、至简动力的贾鹏、王佳佳等,仍与公司创始人李想保持密切交流,并会在公司AI周会上做行业分享[7] 技术进展与未来规划 - 公司于2025年9月向AD Max车型全量推送VLA司机大模型后,车辆纵向控制更丝滑,复杂路口准确性显著提升[8] - 按照计划,公司还将强化语言和行为信息交互,并在2026年适配自研芯片M100[8]
独家丨理想调整基座模型业务:詹锟接手,VLA 研发整合
晚点Auto· 2026-01-14 21:59
公司AI战略与组织架构调整 - 公司自动驾驶高级算法专家詹锟将接手基座模型业务,整体负责VLA基座模型研发,并将相关技术团队整合,为自动驾驶、智能座舱及未来可能的机器人业务提供技术支撑[3] - 詹锟的汇报关系由向自动驾驶研发高级副总裁郎咸朋汇报,改为向CTO、系统与计算群组负责人谢炎汇报,但他仍继续负责智能驾驶VLA模型的工程化与平台化[3] - 原基座模型负责人陈伟或将离职加入创业行列[3] - 此次调整将VLA从单个项目升级为公司层级的基座模型,从组织层面明确了以VLA为核心的AI战略方向,资源将进一步向具身智能集中[5] VLA模型的技术内涵与研发历史 - VLA模型此前由两个部门分头研发:“L”(语言)部分由基座模型负责人陈伟主导,对标ChatGPT、DeepSeek等大模型;“V”(视觉)和“A”(行动)部分则由自动驾驶团队主导,聚焦工程化与平台化[5] - VLA中的“V”代表感知物理世界,“L”代表规划和决策,“A”代表行动,其行动范畴在物理世界包括轨迹移动和手臂操作,在数字世界则包括理解语言、调用工具和多智能体协作[5] - 公司的AI战略是以VLA为核心构建一整套Agent系统,将旗下所有产品(包括车和未来的AI终端)都视为机器人[6] - 詹锟于2021年加入公司,此前在百度Apollo负责自动驾驶预测算法,加入后聚焦自动驾驶架构与三代技术栈部署,并于2025年9月出任智能驾驶部门下设的“VLA模型”部门负责人[6] - 陈伟于2021年加入公司任AI首席科学家,曾负责智能助手“理想同学”和大模型Mind GPT的开发[6] 技术进展与未来规划 - 公司于2025年9月向AD Max车型全量推送VLA司机大模型后,车辆纵向控制更丝滑,复杂路口准确性显著提升[7] - 按照计划,公司还将强化语言和行为信息交互,并在2026年适配自研芯片M100[7] 行业人才流动 - AI大模型爆发后,公司内部已有多位技术人才离开创业,例如维他动力的赵哲伦,至简动力的贾鹏、王佳佳等[6] - 据信,这些已离职创业的人士仍与公司创始人李想保持密切交流,并会在公司的AI周会上做行业分享[6]
从联网设备到智能体终端,阿里云开启AI硬件的普惠元年
36氪· 2026-01-09 21:09
核心观点 - 2026年AI硬件行业进入“物种大爆发”纪元,其核心是从“功能智能”向“系统级智能”的本质跃迁,硬件演变为具备独立思考能力的“端侧智能体” [3][6][10] - 中国硬件产业已跨越“代工厂”阶段,开始向全球输出创新方案,从“中国制造”迈向“中国创造”,在全球科技竞争中从“追随者”转变为“定义者” [4][6][36][40] - 阿里云通过提供全尺寸模型、端云协同解决方案及开放的生态支持,扮演“创新底座”与“破壁人”角色,降低硬件创新门槛,推动AI技术普惠,助力中国硬件厂商在全球市场建立科技话语权 [6][7][11][19][38][39] 行业趋势:AI硬件进入“物种大爆发”新纪元 - 2026年标志着AI硬件行业正式进入物种大爆发阶段,告别了“伪智能”时代,其背后是底层技术红利释放与商业逻辑向新范式迁徙的必然结果 [8][9] - AI硬件正经历从“功能智能”向“系统级智能”的本质跃迁,核心在于硬件具备了理解复杂世界的“大脑”,这得益于从底层指令到多模态感官的全链路基础设施就位 [10] - 端云协同已成为行业演进的默认标准,是解决硬件对轻薄、续航的极致追求与大模型高算力、高功耗之间矛盾的唯一解 [10][11] - 交互逻辑发生根本变化:硬件能够识别环境要素并纳入决策,自然语音能力降低表达门槛,系统开始围绕人的习惯调整,用户只需给出抽象需求,底层AI Agent即可完成任务拆解与协同 [12] - 商业逻辑深刻位移:市场已进入成熟阶段,用户更关心AI在真实场景中的稳定运行与实际价值(如节省时间、降低决策成本),而非单纯的概念营销 [13] - 用户付费心智建立:主流人群年均消费锚定在3000-5000元区间,健康类AI功能付费意愿是其他功能的两倍,用户开始接受为“可感知的价值”支付每月10到30元的订阅费用,商业模式从一次性买断转向持续性服务 [14][16] 技术路径:端云协同与普惠化解决方案 - 面临硬件物理限制(轻薄、续航)与大模型算力需求的天然张力,行业通过构建“智力阶梯”实现性能与功耗的精妙平衡 [10][11] - 阿里云通过提供从0.5B到480B的全尺寸模型覆盖,为从智能戒指到智能座舱的不同硬件提供量体裁衣的“智力方案”,小模型负责端侧意图捕捉,大模型负责云端复杂推理 [11] - 端侧负责低时延、隐私和意图捕捉,云端负责复杂推理的“云端+端侧”架构是解决功耗矛盾的唯一解,AI硬件正处于从“智能设备”向“智能体终端”进化的L3阶段(端云协同) [11] - 底层工程实现系统级优化:通义实验室与达摩院玄铁架构协同,从芯片指令集到模型推理路径进行优化,使大模型能在端侧高效运行,目前搭载玄铁处理器并运行通义大模型的智能终端已达亿级规模 [11] - 芯片适配方案已兼容30余款基于RISC-V与MIPS架构的主流终端芯片平台,未来将与玄铁RISC-V架构推进全链路协同优化,提升部署与推理效率 [12] - 根据国际研究机构报告,阿里云在云基础设施、工程体系、模型能力及知识管理应用四个关键维度均被评为“新兴领导者”,是亚太地区唯一在四项能力中同时获认可的厂商 [13] 生态赋能:阿里云的“底座”角色与产业影响 - 阿里云定位为行业的底座与土壤,公开承诺不做终端硬件,以开放姿态为硬件企业提供技术及生态支持,消解厂商戒心,促进行业信任与联合创新 [7][19] - 通过通义多模态大模型支撑15万家硬件厂商的创新实验,将万亿级参数的重资产能力转变为普惠的“数字化水电”,实现了“智力平权” [19][38] - 其角色让硬件创新门槛被彻底抹平,厂商无需从零搭建基座,可直接利用通义Agent框架快速装配全球领先的智力方案,让有创意但缺资源的厂商获得与巨头同台竞技的可能 [38] - 这种模式推动中国硬件制造告别低毛利贴牌时代,以更具溢价能力和技术尊严的姿态参与全球竞争,重塑了其在全球价值链中的坐标 [34][39] 应用场景:AI灵魂与中国制造的碰撞案例 - **AI新物种探索**:中国厂商推出多款定义新品,如基于通义千问的儿童AI Pin“Mooni M1”,引入大模型后用户AI使用时长提升40分钟;雷鸟智能眼镜的AI模型提升意图识别能力,出货量位居AR行业前列;TemPolor Melo-D智能吉他通过音乐大模型重塑人乐交互 [22][24][26][28] - **手机系统级升级**:服务全球TOP 10手机厂商,深度参与交互重构,例如OPPO“小布助手”和“一键问屏”在引入通义多模态能力后,增强了对屏幕内容的理解与问答能力;荣耀通过合作在视觉问答(VQA)能力上完成端到端方案落地,并与垂直服务智能体联动,使手机承担信息整合与服务调度角色 [29] - **智能座舱演进**:座舱正从工具向伙伴转变,阿里云实现覆盖多模态、多尺寸的模型体系,并与高德、飞猪、支付宝等生态整合,以理想汽车为例,其“理想同学”基于阿里云平台实现大模型快速迭代,构建长期记忆机制,在导航、支付等场景实现连贯智能体验 [30][32] - **出海硬件全球化**:依托阿里云全球AI基础设施,中国硬件厂商“生而全球”布局业务,例如TCL联合打造半导体显示专家大模型支撑全球研发;影石推出AI智能剪辑服务服务全球百万创作者;安克创新通过“全球一张网”统一调度资源,广泛应用通义模型,AI成为全球化运营的基础设施 [32]
理想汽车|写入《2025 汽车行业影响力年鉴》
经济观察报· 2025-12-30 19:23
行业智能化发展趋势 - 全球汽车产业中,人工智能正从“功能加持”转变为决定智能化上限的核心能力 [1] - 但真正具备系统性AI能力、能将模型能力持续落地到量产产品中的汽车企业仍然屈指可数 [1] - 多数企业仍停留在局部应用或功能叠加层面,AI尚未成为其产品体系的底层逻辑 [1] 理想汽车的AI技术路径 - 公司围绕VLA(视觉—语言—动作)模型,将智能辅助驾驶的感知、理解与执行能力统一到同一AI架构中 [1] - 这使得辅助驾驶不再依赖规则堆叠或单点优化,而是通过模型能力的持续进化推动整体体验提升 [1] - 这一做法沿着通向AGI的技术路径演进,使过去依赖经验与规则的复杂场景开始具备被机器理解和持续优化的可能性 [1] 理想汽车的端侧AI产品化 - 公司在端侧AI的产品化探索上走在行业前列 [2] - 无论是“理想同学”在车内的多模态交互与智能体角色,还是围绕AI眼镜Livis等新终端展开的能力延展,公司都在尝试把AI从“车内系统”推向“端侧产品” [2] - 从发布节奏和覆盖范围看,公司是当前汽车企业中,对端侧AI产品理解最为系统、相关产品发布最为密集的厂商之一 [2] 理想汽车的行业价值与认可 - 公司今年的价值体现在以AI为核心,将辅助驾驶、座舱交互与端侧产品纳入同一演进逻辑中 [2] - 这为整车企业如何在全球AI驱动的智能化竞争中构建长期能力,提供了一个可被对照的现实样本 [2] - 基于其在AI架构整合与端侧产品落地上的阶段性成果,公司被写入《2025汽车行业影响力年鉴》,作为年度智能化进程中具有代表意义的整车企业之一 [2]
陈伟GTC2024讲MindGPT压缩版/视频版/图文版
理想TOP2· 2025-12-15 20:02
文章核心观点 文章系统阐述了理想汽车如何以其自研的多模态认知大模型MindGPT为核心,构建领先的三维空间人机交互体验,推动车载交互从“人适应机器”向“机器适应人”转变,并详细介绍了支撑该体验的多模态感知技术、大模型能力及背后的AI工程架构 [10][20][21] 智能座舱交互理念与技术架构 - 公司致力于将人机交互从二维平面扩展到物理世界下的三维空间,目标是让交互方式从人适应机器转变为机器主动适应人,以提供更自然的体验 [10] - 公司融合语音、视觉、触控等多模态感知信息,旨在提供可媲美人与人交互的自然体验 [11] - 公司的AI助手“理想同学”被定位为车主的数字家庭成员,其技术覆盖感知、理解、表达三大能力,借助全车传感器具备听、看和触摸的多模态感知能力 [13] - 公司认为,以感知和表达为代表的感知智能已成熟,而以理解为代表的认知智能在2022年底大模型出现后迎来变革 [14] 多模态感知技术 (MindGPT-MP) - 公司的多模态感知大模型MindGPT-MP通过海量视听数据进行自监督学习与多任务精调,利用全车麦克风与摄像头实现同步感知 [2][29] - 该技术经过信号分离与融合,实现精准的用户定位与人声分离,具备多语种、多方言及情绪感知的边听边看能力 [2][29] - 该技术支持“指令自由说”,允许用户下达不限数量的连续指令控制 [2][30] - 该技术支持“方言自由说”,支持多种方言的自由唤醒与识别 [2][30] - 该技术引入“多模态指代”功能,如“手指指代”(指车窗即开窗),结合“可见即可说”,大幅降低用户交互门槛 [2][32] 多模态认知大模型 MindGPT 的核心能力 - 公司于2023年6月发布MindGPT,以其为核心构建了感知-规划-记忆-工具-行动的完整Agent能力 [2][35] - MindGPT基座模型采用自研的TaskFormer结构,并在2023年12月通过OTA 5.0正式推送,曾获C-Eval和CMMLU双榜第一 [2][39] - 模型训练在通识知识基础上,重点加强了车载场景(用车、出行、娱乐)的15个重点领域知识,通过SFT和RLHF覆盖了110多个领域和1000多种专属能力 [3][35] - MindGPT作为中控大脑,可连接外部Model Zoo和API Zoo,通过RAG技术连接搜索能力,自主规划任务并调度工具 [4][36] - 模型具备记忆网络,能理解家庭成员偏好与历史对话,实现个性化服务 [4][36] - 模型具备在线强化学习能力,能基于用户反馈持续迭代,实现越用越好用 [4][36] AI工程架构:训练平台 (Li-PTM) - 为支撑千亿级大模型高效迭代,公司自研了训练平台Li-PTM及TB级吞吐的大数据处理系统Li-ARK [4][44] - 训练采用4D并行策略,结合数据并行、Tensor并行、流水线并行和序列并行,以极致利用GPU算力 [4][44] - 性能表现方面,在相同模型和训练集下,Li-PTM在SFT阶段的训练速度是当时行业最好开源能力的3倍以上,RLHF速度约为DeepSpeed的3.1倍 [4][47] - 在基座训练阶段,Li-PTM的训练速度是Hugging Face Transformer的5.12倍,高于DeepSpeed(1.6倍)和Colossal-AI(3.5倍) [46][47] AI工程架构:推理引擎 (LisaRT-LLM) - 针对落地应用,公司设计了端云融合的推理体系,核心是自研推理引擎LisaRT-LLM [4][41] - 架构自底向上包含LisaRT-LLM引擎、支持Continuous Batching的调度平台、TaskFormer中控服务以及端云一体的SAI SDK [4][42] - 性能优化方面,公司与NVIDIA深度合作,引入Fused MHA、Flash Attention等技术,并利用TensorRT-LLM优化核心算子 [5][49][50] - 推理服务的性能指标要求为:预填充延迟控制在500毫秒以内,解码速度大于20 Token/秒 [5][50] - 压测结果显示,在A800显卡上,LisaRT-LLM的吞吐率相比vLLM提升1.3倍以上,在高并发下仍能保持低延迟响应 [5][53]
李想造AI眼镜:未被暂停过的项目、从未公开的野心
21世纪经济报道· 2025-12-05 18:49
产品发布与核心定位 - 理想汽车于12月3日正式发布其首款AI独立硬件产品——Livis AI眼镜,官方售价1999元,补贴后起售价1699元 [1] - 该产品与镜片公司蔡司进行战略合作,号称是当前市面上最轻的AI眼镜,仅重36克,比普通眼镜重10克 [1] - 公司高级副总裁范皓宇将Livis定义为“从0到0.1的产品”,并透露未来将推出无需连接手机的独立终端,即真正的穿戴机器人 [1] - 首款产品的目标用户是150万名存量理想汽车用户以及少部分科技爱好者 [1] 内部目标与市场预期 - 公司内部对首款AI眼镜的销量预期并不高,但目标坚定:希望获得至少上万名种子用户,且退货率要低于行业平均水平 [1] - 公司要求单个用户每日佩戴时长至少超过4小时 [1] - 作为对比,小米AI眼镜售价同为1999元,今年6月发布后首周销量达7万副,截至目前累计订单达20万副 [8] - 行业数据显示,AI眼镜品类在京东、天猫等平台的退货率约为30%,在抖音平台高达40%-50% [8] 战略背景与决策过程 - 公司认为围绕AI会产生一套新的生态,在5年前分析技术路线时,就决定在自研芯片的同时,投入基座模型及相关产品 [2][14] - 去年年初,Meta发布新款Ray Ban Meta眼镜让公司看到了时机成熟,从而决定入局AI眼镜 [3] - 去年6、7月,产品团队完成第一个原型机,并将公司自研的模型能力(基于Mind GPT的“理想同学”)灌入,体验令人兴奋,随后推动产品开发 [3][15] - 2024年10月,公司CEO李想在秋季战略会上提出立项做AI眼镜,但遭到重要股东反对,股东认为应聚焦于汽车业务 [5] - 李想随后仍秘密推动项目立项,并于今年1月在产品部下正式成立穿戴机器人二级部门,由高级副总裁范皓宇统管 [6] - AI眼镜是公司内部少有的从立项到量产落地未被中途暂停的新项目 [7] 产品逻辑与竞争优势 - 公司认为真正的智能应从用户使用频率最高的产品中产生,而非新增一个产品,AI眼镜是找到的切入口 [7][11] - 产品逻辑是解决AI眼镜最基本的第一性问题:续航、佩戴舒适性和响应速度,公司认为Meta的AI眼镜使用率不到2%即因这些问题未解决 [16] - 公司强调其产品开发逻辑是“先定义模型场景,再去想用什么样的硬件去做适配”,而非“先有硬件,希望让AI变成卖点” [18] - 公司表示其AI眼镜的ISP调校、质量管控按汽车标准执行,对每个下线的眼镜进行100%全检,耗时约2小时跑完所有功能 [24] - 生产供应商为歌尔,公司认为眼镜工艺要求高,自建产线不现实 [27] 发展路线与未来规划 - 公司规划了AI眼镜的产品路线:第一代是不带显示的产品,专注于轻量化(36克)和集成化 [25] - 下一代产品将是与蔡司联合开发的带显示的产品,能提供最好的光学配镜效果 [25] - 更远的未来是推出独立终端(无需连接手机),公司认为那将是产品真正的爆发时刻 [1][25] - 公司短期内聚焦于AI眼镜这一个人终端,不会向外拓展其他终端产品 [10][12] 市场环境与行业挑战 - 国内AI眼镜赛道竞争激烈,据不完全统计,中国已有至少50家公司正在推进智能眼镜项目,包括百度、华为、小米、腾讯等科技公司 [6] - 公司当前面临汽车业务挑战:2025年增程车型市场份额被对手蚕食,纯电市场处于从0到1阶段,月销量从巅峰期的5万台下滑至3万台 [2] - 外界质疑公司在销量低谷期推出AI眼镜是不务正业,认为扩充品类应在销量巅峰期进行,且车企做AI眼镜不具备天然优势 [10] - 公司回应称,其目标不是参与“百镜大战”,而是专注于把重量、续航、响应速度、智能化能力等最基本的东西做好 [17]