理想同学
搜索文档
L4大方向有了:理想自动驾驶团队,在全球AI顶会上揭幕新范式
机器之心· 2025-10-31 12:11
AI 正在进入下半场,最先进化的会是辅助驾驶? 最近,有关 AI 大模型进入瓶颈的讨论越来越多。强化学习之父 Rich Sutton 发表的前瞻论文《体验时代》指出,人工智能正在从依赖人类生成数据向体验 式学习的范式转变。 OpenAI 前研究员姚顺雨则直言不讳地表示 AI 正在进入「下半场」。他认为,需要为现实世界的任务开发新的 AI 评估或配置。更重要的是,要实现超越人 类的智能,AI 就必须超越模仿人类,依赖一种可随智能体改进而扩展的新数据源。 机器之心报道 作者:泽南 在自动驾驶领域,AI 范式转变的趋势同样也已显现。 上周刚刚结束的全球计算机视觉学术顶会 ICCV 2025 上,理想汽车自动驾驶高级算法专家詹锟在研讨会上发表了以《世界模型:让我们从数据闭环走向训 练闭环》(World Model: Evolving from Data Closed-loop to Training Closed-loop)为主题的演讲。 詹琨在 ICCV 2025 具身智能研讨会(Learning to See: Advancing Spatial Understanding for Embodied Intell ...
李想:特斯拉V14也用了VLA相同的技术
自动驾驶之心· 2025-10-20 07:32
OpenAI人工智能五阶段定义 - 聊天机器人阶段的核心是基座模型,功能为压缩人类已知数字知识,类比人类从小学到大学的知识积累过程[19] - 推理者阶段具备思维链和连续性任务能力,依赖SFT和RLHF训练,类比人类读研或师傅带徒弟的经验传授[20][21] - 智能体阶段AI开始实际工作,能使用工具完成长任务,对专业性和可靠性要求极高,需达到80-90分合格标准,类比人类胜任专业岗位[22][23] - 创新者阶段通过出题解题进行强化训练,需要世界模型和RLAIF模拟真实环境,类比职业选手通过上万小时实战成为专家[25][26] - 组织者阶段负责管理大量智能体和创新,防止失控,类比企业管理者的角色[27] 算力需求与技术布局 - 未来5年推理算力需求可能扩大100倍,训练算力需求扩大10倍[29] - 不同阶段需要不同类型算力:智能体阶段主要需要推理算力,机器人设备需要端侧推理,世界模型阶段需要海量云端推理[28][29] - 公司自研技术包括推理模型(MindVLA/MindGPT)、智能体(司机Agent/理想同学Agent)和世界模型[31] - 2026年将为自动驾驶配备自研端侧芯片,实现车与AI深度融合[33] 机器人发展路径与训练方法论 - 机器人发展有两条路径:将现有工具改造为机器人(如自动驾驶车辆),或开发人形机器人操作万物[34][35] - 训练的核心目标是提高成功率,参考人类"一万小时"专业训练理念[36][38] - 专业训练聚焦三大能力:信息处理能力(筛选有效信息)、出题解题能力(定义和解决问题)、资源分配能力(优化有限资源使用)[39][40][41] 行业技术观察与应用实践 - 特斯拉FSD V14证明其采用与VLA相同技术,具备空间完整理解能力和长任务多任务处理能力[44] - 公司内部已实现全面AI化,特别是在VLA技术应用后[45] - 行业领先的AI工具应具备简洁干脆的对话风格,避免过多铺垫性内容[46] - AI资讯获取渠道包括关键账号订阅、B站UP主内容跟踪以及内部多领域研究团队每周同步会议[48]
「理想同学」的进化史:从AI助手到智能体的自研之路
雷峰网· 2025-09-28 18:34
" 从传统的AI助手到大模型时代下的智能体,「理想同学」如何让 座舱实现自我革命? " 作者丨 梁辰 编辑丨 李雨晨 如果要选出最早凭借座舱功能占领用户心智的一家造车新势力,答案或许是理想。 "冰箱彩电大沙发"是理想最被人所知的卖点。但抛开这些精准的硬件定义,作为未来用户智驾空间与娱乐 的第三空间,座舱里只有这些是远远不够的。智能化尤其是座舱空间的智能化,已经成为车企的核心卖 点。 2023年5月,理想汽车智能空间副总裁勾晓菲曾在美国硅谷的一次半公开宣讲会上说,"触控不是座舱最 主要的交互方式,把触控做得再好,生态做得再好,它不适合在这个终端里。 基于触控生态的车机系统, 就是在用正确的方式回答了一个错误的问题 。" 勾晓菲这句话说完后的一个月,理想汽车推出了自研认知大模型"Mind GPT",并将其以"理想同学"App 的形式嵌入车机系统中,成为座舱里众多用户与数字内容交互的"新按钮"。 大模型加速上车后,智能座舱的竞争更显白热化。作为全公司最大的产品经理,李想对于AI的投入非常坚 决,每个月都会参加数场AI的主题会。 他经常说的一句话是:"我们是一个AI公司,我们必须把大模型做出来,没有大模型就不配称为A ...
高通组局,宇树王兴兴说了一堆大实话
量子位· 2025-09-26 17:12
文章核心观点 - 在2025骁龙峰会·中国上,行业核心玩家共同探讨了AI与Agent技术为终端设备(特别是具身智能机器人)带来的新想象,并剖析了当前行业面临的技术路线分歧、部署挑战及开放协作的必要性 [1][2][3] 具身智能机器人的发展路径与挑战 - 宇树科技CEO王兴兴提出了通用AI机器人发展的四阶段路线图:固定动作演示(已实现)、实时生成任意动作(预计最快2025年底/2026年初实现)、在陌生场景执行任务(预计2026年底左右实现)、高成功率与精细操作(目标成功率接近99.9%,需再数年) [11][12] - 机器人面临部署大规模算力的难题,包括空间限制导致高算力芯片难以安装、电池容量及散热问题难以解决 [20][21] - 机器人峰值功耗理想目标需控制在100W以内,平均正常功耗为20-30W,相当于几个手机的功耗,手机芯片应用于机器人领域具有想象空间 [23][24] - 工业机器人最常见的故障是线缆问题,可能占到故障总数的60%-70%,减少线缆数量对提升可靠性至关重要,目标是将每个手臂的线缆减少至仅一根 [16][17][19] 端侧AI与Agent系统的关键作用 - 端云协同已成为行业共识,端侧模型具备"永远在线"的优势,可持续感知世界、保障用户隐私,并作为核心编排者协同云端Agent完成复杂任务 [35][38] - 端侧模型需不断提升知识密度,面壁智能提出知识密度每三个月提升一倍的观点,以更好地适应各种硬件设备和用户场景 [39] - 在汽车座舱等具体终端场景,端侧模型能基于本地感知(如感知到后座小朋友哭闹)快速响应并协同云端模型提供服务,避免隐私暴露 [36] 行业协作与开放生态建设 - 当前行业处于黎明前夜,各家技术路线差异大导致整体进展缓慢,建议在模型尚无法直接部署的阶段保持开放态度,通过开源促进共同进步 [25][28][29] - 宇树科技已开源其基于视频生成的世界模型,包括模型、数据集、训练及部署源代码,旨在推动领域共同发展,类似OpenAI早期开源GPT-1/2的策略 [26][28] - 行业需共建基础设施以应对碎片化挑战,例如中科创达与高通、火山引擎等合作共建创新中心与联合实验室,推动混合AI方案优化 [48][51] Agent的服务本质与未来操作系统 - Agent的核心竞争力在于其能提供的服务能力,用户选择Agent的逻辑将类似于选择操作系统,关键在于其接入服务的广度与深度 [44][47] - 理想汽车的"理想同学"Agent已从车内服务扩展至生活场景,如点咖啡、交水电费、叫代驾等 [47] - 未来有望形成跨终端的操作系统,由Cloud OS与各终端Agent协同工作,AI将作为一种全新的UI催生新的AI OS [50]
多家车企引入AI智能体,行车中能点餐
21世纪经济报道· 2025-09-25 16:03
AI作为下一代操作系统 - AI被视为下一代操作系统 AGI将向ASI超人工智能发展 [1] - 阿里巴巴CEO吴泳铭认为AI需从物理世界获取更全面原始数据以实现超越人类突破 [8] 车企AI智能体应用现状 - 理想汽车展示AI智能体"理想同学"可在一分多钟内完成星巴克点餐支付全流程 [1] - 比亚迪 智己 蔚来等车企过去半年均已宣布将AI智能体引入智能座舱 [1] - 车机智能体第一步应用场景聚焦导航 点餐 叫代驾等日常消费辅助功能 [3] 技术实现框架 - CUA框架通过多模态大模型理解任务并借助小程序/APP执行 理想 比亚迪 蔚来均采用此路径 [3] - MCP/A2A框架将任务分发给第三方智能体完成 如肯德基自有智能体处理优惠券和套餐逻辑 [5] - GUI Agent在复杂任务中存在准确率瓶颈 15步任务准确率仅30%左右 [4] - 理想采用"多步轨迹"拆解方案 通过有限集合预测将准确率显著提高 [4] 支付安全机制 - 大部分车企在智能体支付环节设置刷脸或语音确认等额外干预确保交易安全 [5] - 理想汽车支持屏幕密码输入或刷脸验证 小额支付可启用语音确认免密功能 [5][6] 未来发展方向 - 理想同学Agent 2.0重点开发全信息记忆能力 涵盖程序记忆 情景记忆和语义记忆 [7] - 环境感知能力通过摄像头识别真实二维码等物理信息并自动调取完成任务 [7] - 智能体将从被动辅助转向主动代劳 如自动输入曾登记过的车牌信息 [7] - 车机智能体最终目标是实现"人—车—生活"完整闭环 [2] 市场反应 - 阿里巴巴港股在云栖大会期间盘中涨幅超6% 创2021年10月以来新高 [1]
多家车企引入AI智能体,行车中能点餐
21世纪经济报道· 2025-09-25 15:58
9月24日,阿里巴巴集团CEO吴泳铭在云栖大会上抛出几个坚定的判断:AI会是下一代操作系 统。AGI迟早到来,接下来要剑指ASI(Artificial Superintelligent,超人工智能)。当天,阿 里巴巴港股盘中拉升,涨幅一度超过6%,创下2021年10月以来新高。 市场的即时反应,印证了当下对一个更强大AI的关注和想象。今年云栖大会的主题是"云智一 体 碳硅共生",21记者现场观察到,智能体(Agent)和具身智能,成为多个展台和分论坛的 焦点。而在众多行业参与者中,车企的身影难以忽视。 记者丨 肖潇 编辑丨王俊 视频 丨 杨浩凯 在云栖大会的一项分论坛上,理想汽车空间AI负责人江会星展示了一段演示视频:车主说了一 句"点一杯星巴克",车机屏幕里的智能体"理想同学"便开始调用星巴克小程序,选择门店,确 认口味,最后刷脸支付。整个视频大约持续了一分多钟。 除了理想,过去半年里,比亚迪、智己、蔚来等车企都已宣布将AI智能体引入智能座舱。 车内智能体在加速落地, 不少车主已经可以在行车过程中语音点餐,到达后无缝拿到餐 食。 而车企的野心不仅仅是"一句话点咖啡"。江会星在前述论坛提到,理想同学agent ...
车机AI智能体加速落地,不止“一句话点咖啡”
21世纪经济报道· 2025-09-25 14:20
AI作为下一代操作系统 - AI被视为下一代操作系统 AGI将向ASI超人工智能发展 [1] - 阿里巴巴CEO吴泳铭认为AI需直接从物理世界获取原始数据实现突破 例如新一代自动驾驶通过原始车载摄像头数据学习实现更高驾驶能力 [6] 车企AI智能体应用加速落地 - 理想 比亚迪 智己 蔚来等车企过去半年已宣布将AI智能体引入智能座舱 [2] - 车内智能体可实现语音点餐功能 车主行车中语音点餐到达后无缝取餐 [2] - 理想汽车展示智能体"理想同学"调用星巴克小程序完成点单支付全流程 演示视频持续一分多钟 [1] 智能体技术框架与生态连接 - 车机智能体主要通过CUA和MCP/A2A两种框架运作 [2] - CUA框架通过多模态大模型理解任务生成动作 最终通过小程序或APP执行任务 例如理想OTA7.5系统接入支付宝生态 [2] - MCP/A2A框架将任务分发给第三方智能体完成 例如肯德基点单由肯德基自有智能体实现业务逻辑 [4] - 支付环节设置安全验证 需刷脸或语音确认 小额支付可启用免密支付 [4][5] 技术瓶颈与解决方案 - GUI Agent图形界面智能体准确率较低 15步任务准确率约30% 影响停车登记等复杂任务稳定性 [3] - 理想采用"多步轨迹"拆解方案 基于用户想法页面截图和对话状态预测页面动作 通过有限集合预测提高准确率 [3] 未来发展方向 - 理想发布Agent 2.0框架 重点发展全信息记忆和环境感知能力 [5] - 全信息记忆涵盖程序记忆情景记忆语义记忆 包括用户屏幕操作环境互动和人物关系认知 [5] - 环境感知能力通过摄像头识别真实二维码等信息 结合全信息记忆由大模型规划推理完成任务 [5] - 智能体从被动辅助转向主动代劳 例如自动完成车牌号输入等重复操作 [5]
2025国际汽车智能座舱大会苏州召开
中国汽车报网· 2025-09-17 13:56
大会概况 - 2025国际汽车智能座舱大会于9月16日在苏州召开,主题为“AI赋能智舱革新,重构人·车·未来生态” [1] - 大会设置1场全体大会、1场高端闭门会、3场关键技术会议及3场专题会议,并设有实车体验活动 [1] - 来自国内外智能座舱领域的800名专家学者和企业代表参会 [1] 行业发展趋势 - 人工智能大模型、多模态交互等技术正推动智能座舱从“功能集成”向“场景驱动”、“单机智能”向“群体智能”加速演进 [3] - 中国相关产业凭借技术与市场优势持续领跑全球 [3] - 参评车型智能座舱平均得分达6.78分,绝大多数车型稳居6分以上良好区间,头部车型突破8分,显示产业整体向上发展 [5] 技术发展路径与挑战 - 行业专家指出,“单车智能+网联赋能”的车路云一体化方案是中国智能网联汽车的终极发展方向 [6] - 当前“车路云一体化”方案在产业化、市场应用的生态和商业模式上尚不够清晰,相关领域投资回报不理想 [6] - 建议行业关注端到端大模型技术发展,推进车路协同标准化建设,并加强大模型上车安全监管 [6] 网络安全创新方案 - 当前以IP网络为架构的智能网联汽车体系存在安全缺陷,传统防护手段难以应对AI时代攻击风险 [7] - 多标识网络融合区块链技术,通过“数字护照+数字签证+数字海关”管理模式,可实现网络安全指数级提升 [7] - 该技术方案已在多次国际安全对抗赛中验证其高可靠性 [7] 企业战略与产品创新 - 理想汽车将智能座舱定义为“幸福空间”,认为座舱将成为车企差异化竞争核心,并围绕三维空间交互等三大方向构建交互体系 [8] - 斑马智行认为AI是构建专属用户关系的核心手段,其全模态端模型解决方案将通过端侧大模型部署推动座舱从“被动响应”转向“主动陪伴” [8] - Unity中国的3D实时渲染技术已服务全球54家主机厂,赋能120余款量产车型HMI开发,未来将探索车载游戏等新应用 [9] 标准体系建设目标 - 汽车智能座舱团体标准体系建设目标为:到2026年搭建好体系框架并与国家标准对接;到2030年完善体系并填补关键技术标准空白;到2035年使中国标准成为国际标杆 [5] 区域产业生态与支持 - 江苏省作为全国最大汽车产业集群地之一,已在车载芯片、车联网、智能座舱解决方案等领域形成完整的智能网联汽车产业链与创新体系 [3] - 苏州正成为长三角汽车产业集聚区的重要力量与全国智能网联汽车发展的“先行者”,并出台涵盖核心技术攻关、高端人才引进等领域的支持政策 [3] - 中国汽车工程学会长三角科技交流中心在苏州揭牌,将依托学会资源为长三角区域汽车产业高质量发展提供助力 [4]
大模型方向的座舱产品经理认为理想座舱是行业绝对的标杆
理想TOP2· 2025-09-16 23:04
理想汽车座舱智能化优势 - 理想汽车在座舱智能化方面树立了行业绝对标杆 包括MindGPT-40语音大模型 Duplex全双工技术 理想同学整体交互体验 小同桌功能 任务大师 桌面大师 agent助手和思维链可视化表达等创新功能 [1][2] - 小同桌功能并非简单闲聊对话 而是具备专业产品和技术深度的交互系统 [2] - 任务大师能精细化打通整车各类软硬件信号 支持用户口语化创建和执行任务 体验细节优于竞品 [3] 产品功能与技术实现 - 理想座舱交互实现效率显著高于友商 相同功能理想仅需极短时间实现 而竞品往往需要10-20秒才能完成 [1][7] - 理想同学记忆能力在OTA8 0中得到优化 支持单指令设置工作地点等场景 相比传统多轮交互方式节省近10-20秒操作时间 [6][7] - OTA更新说明文档详细程度超越多数新势力车企 体现产品精细化程度 [6] 行业竞争格局 - 行业从业者在座舱交互领域主要对标理想和小米 语音交互方面曾重点关注小鹏和蔚来 [4] - 小米在AI领域投入达到T0级别 小鹏和蔚来正在进行深度自我革命以维持市场地位 [5] - 多数车企存在决策链路长 资源投入不足等问题 功能落地比理想慢1-2年 且后续更新能力较弱 [5] 技术投入与商业化挑战 - AI研发投入短期内财务收益较小 用户更易为冰箱 彩电 大沙发等可见配置付费 而非隐形AI功能 [5] - NOMI等AI功能单独售价达数千元 但在当前价格战环境下商业化面临挑战 [5] - 理想需要同时维持增程路线 拓展纯电市场并保持利润 面临多重战略压力 [6] 组织能力与执行效率 - 理想产品优势源于团队能力 扁平化组织架构 资源倾斜以及决策者的前沿思路 [3] - 行业普遍存在决策拍脑袋 资源不足 执行效率低下等问题 导致持续落后于技术迭代速度 [5] - 简单接入大模型(如DeepSeek)而不优化底层交互 对用户体验提升毫无意义 [3]
李想回答校招生提问
理想TOP2· 2025-08-31 17:43
公司战略与定位 - 公司定位为智能终端企业 强调硬件 软件 模型和服务的一体化整合 反对交付芯片时不配套功能的行为[1] - 自动驾驶技术已进入行业第一梯队 预计明年将进一步提升领先地位[3] - 采用校招体系培养自研人才 通过"相信所以看见"的理念推动技术研发 从落后实现技术突破[3] 技术研发与创新 - 正在匹配自研芯片 强调芯片交付需同步配套更大规模模型和更长思维链功能[1] - 技术研发遵循"预研-技术研究-技术研发-产品化"的完整流程 类比苹果M1芯片的推广策略[2] - 新产品发布时重点宣传智驾功能和"理想同学"系统 虽然部分传统用户难以理解但坚持技术引领[2] 产品设计与市场策略 - 车辆颜值是用户购车的否决性因素 直接影响是否进入候选清单[2] - 产品设计追求"移动的家"理念 注重内外部的"高级松弛感"表现[2] - 宣传策略保持克制 不过度宣传芯片等用户感知度低的技术 专注超越用户需求的核心功能[1]