Workflow
理想TOP2
icon
搜索文档
一份信噪比与画面均优质的理想i6生产视频
理想TOP2· 2025-12-17 14:36
视频版: 图文版: 冲压车间 i6冲压生产线,5台压机,最多6600吨压力,百吨级模具。 冲压好的零部件非常锋利,以往要用人工搬运,现在用机器人,每台机器人配备两台立体相机,通过高精度的识别技术自动抓取零部件,定位精度在±1 毫米之间。抓取之后2D就不够了,得上3D的。通过融合的AI技术,机械手可以对料框进行精确定位,并且自动调整,精度同样在±1毫米之间。通过灰 度识别算法,机械手就知道自己抓了什么料,应该放在哪,准确度同样是百分之百。 焊接车间 大家还记得这个帅气的溜背吗?还有原生的滴水线设计。 把处理好的零部件变成超高强度的车身,需要先进技术。 比如说侧围总成的合拼工位,滚床将预先准备好的白车身总成运输到主拼工位 视频的运镜很不错,推荐优先看视频版,若愚拍得很用心。 下车身夹具对地板总成进行夹紧固定, 三大优势:精度高,双主拼工艺和现场上百组定位夹紧单元,追求的就是高精度;可靠性高,重复精度达到了±0.15毫米,可以说是次次都一样了;集 成性高,我身后这14台机器人可以一起运转,团队作战力量更大。 滑轨车台移动到侧围并通过锁止机构固定,最后机器人一起完成焊接的主拼工艺。 再给大家举个例子,尾门的自动装配。 ...
理想砍掉BEV与token化直接用OCC稀疏注意力进行4D世界模型预测
理想TOP2· 2025-12-16 20:44
理想的解决方案是稀疏占据表征 (Sparse Occupancy Representation)。模型不再生成离散的词,而是直 接在连续的 3D 坐标空间中操作。用稀疏锚点 (Sparse Anchors),配合可学习的特征向量,直接回归预 测几何偏移量 (Geometric Offsets)。将随机初始化的3D点云,通过attention机制去噪 (Denoise)与迭代 精炼(Iteratively Refine),使其精准匹配在物体表面 。避免了对空白区域的无效计算,在提升推理速度 的同时实现了高保真的场景重建。 这是一篇很有水准的工作,真正的think different。 2025年11月27日理想发布SparseWorld-TC: Trajectory-Conditioned Sparse Occupancy World Model Think different的锚点是对三点去结构化,背后的逻辑一致,去掉人为设计的中间拐杖,让数据和算 力直接接管。 1.去量化结构 从离散token到用稀疏锚点回归连续时空表征。 主流的世界模型通常沿用LLM的思路,通过VAE将连续的3D物理世界离散化,压缩成有限 ...
陈伟GTC2024讲MindGPT压缩版/视频版/图文版
理想TOP2· 2025-12-15 20:02
文章核心观点 文章系统阐述了理想汽车如何以其自研的多模态认知大模型MindGPT为核心,构建领先的三维空间人机交互体验,推动车载交互从“人适应机器”向“机器适应人”转变,并详细介绍了支撑该体验的多模态感知技术、大模型能力及背后的AI工程架构 [10][20][21] 智能座舱交互理念与技术架构 - 公司致力于将人机交互从二维平面扩展到物理世界下的三维空间,目标是让交互方式从人适应机器转变为机器主动适应人,以提供更自然的体验 [10] - 公司融合语音、视觉、触控等多模态感知信息,旨在提供可媲美人与人交互的自然体验 [11] - 公司的AI助手“理想同学”被定位为车主的数字家庭成员,其技术覆盖感知、理解、表达三大能力,借助全车传感器具备听、看和触摸的多模态感知能力 [13] - 公司认为,以感知和表达为代表的感知智能已成熟,而以理解为代表的认知智能在2022年底大模型出现后迎来变革 [14] 多模态感知技术 (MindGPT-MP) - 公司的多模态感知大模型MindGPT-MP通过海量视听数据进行自监督学习与多任务精调,利用全车麦克风与摄像头实现同步感知 [2][29] - 该技术经过信号分离与融合,实现精准的用户定位与人声分离,具备多语种、多方言及情绪感知的边听边看能力 [2][29] - 该技术支持“指令自由说”,允许用户下达不限数量的连续指令控制 [2][30] - 该技术支持“方言自由说”,支持多种方言的自由唤醒与识别 [2][30] - 该技术引入“多模态指代”功能,如“手指指代”(指车窗即开窗),结合“可见即可说”,大幅降低用户交互门槛 [2][32] 多模态认知大模型 MindGPT 的核心能力 - 公司于2023年6月发布MindGPT,以其为核心构建了感知-规划-记忆-工具-行动的完整Agent能力 [2][35] - MindGPT基座模型采用自研的TaskFormer结构,并在2023年12月通过OTA 5.0正式推送,曾获C-Eval和CMMLU双榜第一 [2][39] - 模型训练在通识知识基础上,重点加强了车载场景(用车、出行、娱乐)的15个重点领域知识,通过SFT和RLHF覆盖了110多个领域和1000多种专属能力 [3][35] - MindGPT作为中控大脑,可连接外部Model Zoo和API Zoo,通过RAG技术连接搜索能力,自主规划任务并调度工具 [4][36] - 模型具备记忆网络,能理解家庭成员偏好与历史对话,实现个性化服务 [4][36] - 模型具备在线强化学习能力,能基于用户反馈持续迭代,实现越用越好用 [4][36] AI工程架构:训练平台 (Li-PTM) - 为支撑千亿级大模型高效迭代,公司自研了训练平台Li-PTM及TB级吞吐的大数据处理系统Li-ARK [4][44] - 训练采用4D并行策略,结合数据并行、Tensor并行、流水线并行和序列并行,以极致利用GPU算力 [4][44] - 性能表现方面,在相同模型和训练集下,Li-PTM在SFT阶段的训练速度是当时行业最好开源能力的3倍以上,RLHF速度约为DeepSpeed的3.1倍 [4][47] - 在基座训练阶段,Li-PTM的训练速度是Hugging Face Transformer的5.12倍,高于DeepSpeed(1.6倍)和Colossal-AI(3.5倍) [46][47] AI工程架构:推理引擎 (LisaRT-LLM) - 针对落地应用,公司设计了端云融合的推理体系,核心是自研推理引擎LisaRT-LLM [4][41] - 架构自底向上包含LisaRT-LLM引擎、支持Continuous Batching的调度平台、TaskFormer中控服务以及端云一体的SAI SDK [4][42] - 性能优化方面,公司与NVIDIA深度合作,引入Fused MHA、Flash Attention等技术,并利用TensorRT-LLM优化核心算子 [5][49][50] - 推理服务的性能指标要求为:预填充延迟控制在500毫秒以内,解码速度大于20 Token/秒 [5][50] - 压测结果显示,在A800显卡上,LisaRT-LLM的吞吐率相比vLLM提升1.3倍以上,在高并发下仍能保持低延迟响应 [5][53]
理想通过AI产品经理与数据部门来让智驾模型自我迭代闭环
理想TOP2· 2025-12-14 21:04
本文标题没有任何标题党成分,准确基于理想2025年11月17日发布的 CorrectAD: A Self-Correcting Agentic System to Improve End-to-end Planning in Autonomous Driving 西湖大学的Enhui Ma与理想的Lijun Zhou为共同一作,Enhui Ma的工作完成于理想实习期间。 论文明确指出PM-Agent是在模拟产品经理的角色(simulate the role of product manager), 核心职责不是 简单的看见错误,而是深刻理解为什么错了并提出需要什么数据。 将 DriveSora比作数据部门(similar to the role of Data Department), 职能是根据PM-Agent的需求,基于 DiT架构生成高保真的训练数据 。不是普通的视频生成,DriveSora 解决了传统生成模型胡乱发挥的 问题,实现精准可控。 过去面对长尾问题,内核是基于检索,广义的历史数据库里有这个场景就能解决,没有就无法解决, 处理思路一般是要么自己派车去收集,要么尝试从用户的实车数据去收据,即内核 ...
两位机器人创业者对李想评价非常高
理想TOP2· 2025-12-13 19:44
2025年12月7日主持人问 桥介数物创始人尚阳 星最喜欢的创业者是谁?尚阳星的回答是"最早是乔 布斯,后来是马斯克,现在我也挺喜欢李想的。"详见《 Z Waves|半年融资三轮,99后工程艺术 家在最烧钱的具身智能赛道,先把公司做成了「赚钱机器」 》 2025年8月5日视频26min01S处周鸿祎问松延动力创始人姜哲源我们国内的创业者你最佩服谁?姜 泽源的回复是国内创业者我比较佩服李想。 视频31min47秒处Emma说刚才周总有说,国外你比较欣赏的企业家是马斯克和乔布斯。你也说了, 为什么你刚才说是李想?李想什么会让你觉得特别值得学习呢? 姜哲源 我觉得他是一个很牛的产品经理。我其实很早应该20年在B站就看过李想的一个应该算是产品课,也 不算产品课。他那会儿是有一个他穿这个绿衣服,然后前面放了几个理想小玩偶的一个视频。那个视 频只有几百度放量的时候就看到了。我推荐给了周围我基本上所有的朋友来看那个视频。我觉得那一 个视频,他把他创业的一些理念什么讲清楚了。看着特别有收获,超级有收获。 Emma 很逗,我之前就是还没有跟你见面之前,我刷了一些你的视频。然后我有跟我合伙人说,感觉你跟李 想的感觉非常像。 姜哲 ...
李铁马东辉减持是股权激励归属时卖掉一部分交税
理想TOP2· 2025-12-12 00:55
这个是RSU通用的做法,因为需要交所得税。通常都是归属时卖掉一部分交税,而不是额外自己再掏现金交税。 2025年12月11日,李铁(CFO )持有A类普通约2437万股 售出40万股售出比例1.6%。马东辉(总裁)持有A类普通约900万股,售出20万股,售出比例 2.2%。 马东辉公告里提到 | 144: Remarks and Signature | | --- | | Remarks The securities set toth herein are being sold mainly pursuant to a sel-to-cover arrangement for the purpose of satisfing moome tax liabilities incurred upon vesting of resiri | | Date of Notice 12/11/2025 | | ATTENTION: | | The person a versen a whose accurations contribution in which the restor and the rest from t ...
i6i8MEGA分别交付6798/6719/680|理想25年11月记录
理想TOP2· 2025-12-11 14:09
2025年11月核心运营数据 - 2025年11月总交付量达33,181辆,其中增程式车型交付18,984辆,纯电车型交付14,197辆 [1] - L系列车型(L6、L7、L8、L9)合计交付18,984辆,具体为L6交付9,434辆,L7交付5,212辆,L8交付2,130辆,L9交付2,208辆 [1] - i系列及MEGA车型合计交付14,197辆,具体为i6交付6,798辆,i8交付6,719辆,MEGA交付680辆 [1] - 纯电车型交付量从2025年4月的103辆,显著增长至11月的14,197辆,显示纯电产品线快速上量 [2] - 增程式SUV累计交付量在2025年11月10日突破140万辆 [3] 产品与市场表现 - i6车型在首销期毛利率约为10% [3] - 有观点认为,2022年款L9在当前市场环境下产品力依然强劲 [3] - 公司为搭载欣旺达电池的i6车型额外提供2年或4万公里质保 [4] - 公司计划缩短平台大迭代周期,从四年缩短至两年,并计划拉大未来车型间的区分度 [3] - 公司选择易烊千玺作为品牌代言人,并利用官方资源为其新电影组织宣传和车主观影活动 [5] 技术与研发进展 - 公司自动驾驶负责人郎咸朋提出,短期目标是2025年底至2026年初实现强化学习训练闭环 [2] - 公司发布AD-R1论文,核心是通过闭环强化学习提升端到端自动驾驶的安全性与鲁棒性,解决世界模型预测缺陷 [4] - 公司基座模型团队发布LexInstructEval,旨在提升语言模型遵循用户精细化指令的能力 [3] - 公司提出首个包含自车和他车轨迹的世界模型,以在仿真环境中进行VLA强化学习训练 [6] - 公司整车电动产品负责人表示,已有国际碳化硅芯片供应商联系公司寻求技术IP与合作 [4] - 公司电池性能高级工程师的海报显示“理想自研电池” [5] - 2025年11月,公司自动驾驶相关进展被“中文AI三大顶会”中的两家报道 [3] 充电网络与基础设施 - 公司充电站数量从3,509座增加至3,597座 [4] - 正在筹划忙闲预测功能,加密5C充电站,并开发智驾到站、双枪禁充、夸车位禁充及黑名单等功能 [4] - 计划铺设滑轨机械臂,实现城市VLA辅助驾驶与超充站无缝衔接,包括自动匹配空闲站点、进闸道、开地锁及监控车流量 [4] - 二代充电站具备新的功率分配能力,当有理想车主充电时,其他品牌车型充电功率会自动降至30kW或更低 [4] 公司运营与战略动态 - 公司在2025年第三季度财报电话会议中,管理层对投资人的措辞方式发生重大变化 [4] - 公司于2025年11月25日在报纸版《人民日报》上刊登广告 [4] - 公司对两起质量事故进行了内部问责,处理了14名相关人员 [3] - 公司发布2025年10月辅助驾驶出行报告 [3] - 公司宣布将于2025年12月3日举办理想AI眼镜Livis发布会 [4] - 有分析指出公司存在“缺二把手”的讨论,但亦有观点认为这是次要矛盾 [5] - 公司销售端开始评选“价值传递之心” [5] - 两位来自“中国最好操作系统实验室”的博士于当年2月入职公司 [5] - 此前负责博主投放策划和用户运营的两位员工已回归公司 [5] 法律、合作与出海 - 编造理想汽车充“劣质电”致车辆自燃谣言的陈某,被北京顺义警方采取刑事强制措施 [3] - 2025年11月6日,2025年度北京市自然科学基金-顺义(理想)联合基金项目启动 [3] - 2023年公司出口销量超过2.3万辆,但2025年前八个月出口销量为7,000余辆,公司已暂缓欧洲计划,出海首站选择中亚国家 [6]
理想郎咸朋长文分享为什么关于VLA与宇树王兴兴观点不一致
理想TOP2· 2025-12-10 14:50
文章核心观点 - 理想的VLA是自动驾驶的最佳模型方案 其本质是生成式模型 通过生成轨迹和控制信号来实现自动驾驶 在某些场景下已表现出对物理世界的认知涌现和拟人行为 [1][2] - 具身智能最终比拼的是整体系统能力 自动驾驶应被视为一个完整的具身智能系统 需要感知、模型、操作系统、芯片、本体等各部分全栈自研与协同 才能发挥最大价值 [1][3] - 在模型与系统适配的基础上 数据是起决定意义的 理想汽车凭借数百万辆车构建的数据闭环 能够获取海量、高质量的真实驾驶数据 这是其技术路线的核心优势 [1][2][4] VLA模型方案 - VLA本质是生成式模型 采用类似GPT的方式生成轨迹和控制信号 而非文本 已观察到模型在某些场景下出现认知涌现 表现为端到端模型之前没有的拟人驾驶行为 [2] - 世界模型更适合作为“考场”而非“考生” 其高算力需求使其更适合在云端进行数据生成、仿真测试和强化训练 理想正利用数E FLOPS的推理算力进行仿真 [2] - 模型架构之争需结合实际效果 在自动驾驶领域 脱离海量真实数据空谈模型架构是空中楼阁 理想坚持VLA路线是因为其拥有数百万辆车构建的数据闭环 能在当前算力下将驾驶水平做到接近人类 [2] 具身智能系统能力 - 自动驾驶应被视为完整的具身智能系统 需要像人类一样 实现感知(眼睛)、模型(大脑)、操作系统(神经)、芯片(心脏)、本体(身体)等各部分的相互协调 [3] - 实现系统价值需要全栈自研 不仅仅是软件栈 而是整体软硬件全栈 理想的自动驾驶团队与基座模型、芯片、底盘团队协同打造了整个系统 [3] - 底盘协同是系统能力的体现 例如车辆运动管理模块会对自动驾驶控制信号做精细化调校 区分卡钳制动和液压制动策略 以兼顾安全性与舒适体验 实现“身体”与“大脑”的协同 [3] 数据的关键作用与优势 - 数据获取在自动驾驶领域具备优势 对于已建立数据闭环能力的车企而言 获取数据并非难题 这与使用数据采集车获取的数据在质量和分布上有很大差距 [4] - 公司拥有海量、高质量的真实驾驶数据 不仅可以从过去几年积累的超过10亿公里的存量数据中挖掘筛选 更能通过超过150万车主的日常使用源源不断获取新数据 [4] - 数据筛选反映真实人类行为 在筛选数据过程中发现接近40%的人类驾驶数据存在偏一侧开车或不严格卡限速的行为 这些数据被保留 使得模型能学习到更符合人类习惯的驾驶行为 [4] 技术应用的未来展望 - VLA模型服务范围将扩展 该模型不仅服务于公司当前的各类汽车产品形态 也将服务于未来公司规划的汽车类具身机器人 [4]
分享一下认为理想流媒体后视镜改装方案大概率物有所值的视角
理想TOP2· 2025-12-09 20:07
这次理想上架的L系列流媒体后视镜的主要特点为: 1.不涉及车辆外部设备改装合规上路,同样的车规级可靠性。 2.60度广角视野比普通内后视镜优秀。 这位群友明确认为很多改装用户实际体验下来会满意的,可以 解决用户开后排屏幕后无法观察车位的痛点,并且夜晚视野更清晰。 有预算额外买摄像头 模组,上嘉立创打板自己做。 中国国家法规中对于内部后视镜的要求驾驶员可以看到80米后20米宽的范 围假设后部有一个流媒体摄像头安装这个等效的摄像头的视角是30度。 3.对标24款MEGA,估计没有多少⼈体验过高亮清洗防眩、 夜间夜视也超清晰 50Hz的刷新率对于高速的画面清晰流畅。 25款纯电和24款MEGA的最大区别就是60度广角升级为120度视野更宽。 关于200万像素 本身60度的流媒体后视镜已经比传统后视镜相比有碾压的⽤户体验了。 200万像素的摄像头传感器对应后视镜的显示器的像素是73万1920*384像素,考虑画面是长条状,截取画面的尺寸和显示的像素基本上可以映射。 简单说这个200万像素的摄像头像素是完全足够的,还多出很多像素得到的数据可以做环境光的感光计算以及画面质量的算法优化。 关于电子后视镜的清晰度 人眼到后视 ...
一位对理想很有感情的人认为理想流媒体改装方案辜负了大家的信任
理想TOP2· 2025-12-09 18:20
这是一位对理想非常有感情,品鉴能力学习能力都很强的读者。是那种对话两三句就可以知道很聪明的那种人。 以下为这位读者的视角: 这是一次理想的内部组织问题(部门墙隔阂、为各自绩效不合作)外溢到了车主身上的表现,是非常需要警醒的。兄弟阋于墙,外御其侮。(TOP2备注:兄 弟之间内部争吵分歧,但能团结起来对付外来的侵略) 作为官方出品并且做过问卷、预热的官方产品,大家对于理想品牌的精品路线的信任度被辜负了。 这个后视镜改装方式与第三方后装市场的产品没有任何区别,对线束的改装会导致保险的拒保风险也没有区别,甚至一些性能体验差于第三方顶级方 案。大家期待的是做到与后市场不同的方案,毕竟理想擅长整车智能空间融合起来一起设计产品。 拿一个第三方的东西,直接就换个名字卖,真的会被怀疑这三个月的预热和研发,重点解决了没有理想Logo包装盒的问题吗? 用户对这个产品的期待是: 如果在后窗玻璃内: 整合进后窗饰板内,不要外露摄像头,没有拒保风险。 如果在车外尾部: 变更后高位刹车灯的零件,整合成与MEGA或i系列一致的体验。 曾经官方在推销MEGA和i系列的流媒体后视镜时,从摄像头分辨率、视场角、车机可控、放大缩小平移角度可调、抗眩 ...