Workflow
理想同学
icon
搜索文档
陈伟GTC2024讲MindGPT压缩版/视频版/图文版
理想TOP2· 2025-12-15 20:02
文章核心观点 文章系统阐述了理想汽车如何以其自研的多模态认知大模型MindGPT为核心,构建领先的三维空间人机交互体验,推动车载交互从“人适应机器”向“机器适应人”转变,并详细介绍了支撑该体验的多模态感知技术、大模型能力及背后的AI工程架构 [10][20][21] 智能座舱交互理念与技术架构 - 公司致力于将人机交互从二维平面扩展到物理世界下的三维空间,目标是让交互方式从人适应机器转变为机器主动适应人,以提供更自然的体验 [10] - 公司融合语音、视觉、触控等多模态感知信息,旨在提供可媲美人与人交互的自然体验 [11] - 公司的AI助手“理想同学”被定位为车主的数字家庭成员,其技术覆盖感知、理解、表达三大能力,借助全车传感器具备听、看和触摸的多模态感知能力 [13] - 公司认为,以感知和表达为代表的感知智能已成熟,而以理解为代表的认知智能在2022年底大模型出现后迎来变革 [14] 多模态感知技术 (MindGPT-MP) - 公司的多模态感知大模型MindGPT-MP通过海量视听数据进行自监督学习与多任务精调,利用全车麦克风与摄像头实现同步感知 [2][29] - 该技术经过信号分离与融合,实现精准的用户定位与人声分离,具备多语种、多方言及情绪感知的边听边看能力 [2][29] - 该技术支持“指令自由说”,允许用户下达不限数量的连续指令控制 [2][30] - 该技术支持“方言自由说”,支持多种方言的自由唤醒与识别 [2][30] - 该技术引入“多模态指代”功能,如“手指指代”(指车窗即开窗),结合“可见即可说”,大幅降低用户交互门槛 [2][32] 多模态认知大模型 MindGPT 的核心能力 - 公司于2023年6月发布MindGPT,以其为核心构建了感知-规划-记忆-工具-行动的完整Agent能力 [2][35] - MindGPT基座模型采用自研的TaskFormer结构,并在2023年12月通过OTA 5.0正式推送,曾获C-Eval和CMMLU双榜第一 [2][39] - 模型训练在通识知识基础上,重点加强了车载场景(用车、出行、娱乐)的15个重点领域知识,通过SFT和RLHF覆盖了110多个领域和1000多种专属能力 [3][35] - MindGPT作为中控大脑,可连接外部Model Zoo和API Zoo,通过RAG技术连接搜索能力,自主规划任务并调度工具 [4][36] - 模型具备记忆网络,能理解家庭成员偏好与历史对话,实现个性化服务 [4][36] - 模型具备在线强化学习能力,能基于用户反馈持续迭代,实现越用越好用 [4][36] AI工程架构:训练平台 (Li-PTM) - 为支撑千亿级大模型高效迭代,公司自研了训练平台Li-PTM及TB级吞吐的大数据处理系统Li-ARK [4][44] - 训练采用4D并行策略,结合数据并行、Tensor并行、流水线并行和序列并行,以极致利用GPU算力 [4][44] - 性能表现方面,在相同模型和训练集下,Li-PTM在SFT阶段的训练速度是当时行业最好开源能力的3倍以上,RLHF速度约为DeepSpeed的3.1倍 [4][47] - 在基座训练阶段,Li-PTM的训练速度是Hugging Face Transformer的5.12倍,高于DeepSpeed(1.6倍)和Colossal-AI(3.5倍) [46][47] AI工程架构:推理引擎 (LisaRT-LLM) - 针对落地应用,公司设计了端云融合的推理体系,核心是自研推理引擎LisaRT-LLM [4][41] - 架构自底向上包含LisaRT-LLM引擎、支持Continuous Batching的调度平台、TaskFormer中控服务以及端云一体的SAI SDK [4][42] - 性能优化方面,公司与NVIDIA深度合作,引入Fused MHA、Flash Attention等技术,并利用TensorRT-LLM优化核心算子 [5][49][50] - 推理服务的性能指标要求为:预填充延迟控制在500毫秒以内,解码速度大于20 Token/秒 [5][50] - 压测结果显示,在A800显卡上,LisaRT-LLM的吞吐率相比vLLM提升1.3倍以上,在高并发下仍能保持低延迟响应 [5][53]
李想造AI眼镜:未被暂停过的项目、从未公开的野心
21世纪经济报道· 2025-12-05 18:49
产品发布与核心定位 - 理想汽车于12月3日正式发布其首款AI独立硬件产品——Livis AI眼镜,官方售价1999元,补贴后起售价1699元 [1] - 该产品与镜片公司蔡司进行战略合作,号称是当前市面上最轻的AI眼镜,仅重36克,比普通眼镜重10克 [1] - 公司高级副总裁范皓宇将Livis定义为“从0到0.1的产品”,并透露未来将推出无需连接手机的独立终端,即真正的穿戴机器人 [1] - 首款产品的目标用户是150万名存量理想汽车用户以及少部分科技爱好者 [1] 内部目标与市场预期 - 公司内部对首款AI眼镜的销量预期并不高,但目标坚定:希望获得至少上万名种子用户,且退货率要低于行业平均水平 [1] - 公司要求单个用户每日佩戴时长至少超过4小时 [1] - 作为对比,小米AI眼镜售价同为1999元,今年6月发布后首周销量达7万副,截至目前累计订单达20万副 [8] - 行业数据显示,AI眼镜品类在京东、天猫等平台的退货率约为30%,在抖音平台高达40%-50% [8] 战略背景与决策过程 - 公司认为围绕AI会产生一套新的生态,在5年前分析技术路线时,就决定在自研芯片的同时,投入基座模型及相关产品 [2][14] - 去年年初,Meta发布新款Ray Ban Meta眼镜让公司看到了时机成熟,从而决定入局AI眼镜 [3] - 去年6、7月,产品团队完成第一个原型机,并将公司自研的模型能力(基于Mind GPT的“理想同学”)灌入,体验令人兴奋,随后推动产品开发 [3][15] - 2024年10月,公司CEO李想在秋季战略会上提出立项做AI眼镜,但遭到重要股东反对,股东认为应聚焦于汽车业务 [5] - 李想随后仍秘密推动项目立项,并于今年1月在产品部下正式成立穿戴机器人二级部门,由高级副总裁范皓宇统管 [6] - AI眼镜是公司内部少有的从立项到量产落地未被中途暂停的新项目 [7] 产品逻辑与竞争优势 - 公司认为真正的智能应从用户使用频率最高的产品中产生,而非新增一个产品,AI眼镜是找到的切入口 [7][11] - 产品逻辑是解决AI眼镜最基本的第一性问题:续航、佩戴舒适性和响应速度,公司认为Meta的AI眼镜使用率不到2%即因这些问题未解决 [16] - 公司强调其产品开发逻辑是“先定义模型场景,再去想用什么样的硬件去做适配”,而非“先有硬件,希望让AI变成卖点” [18] - 公司表示其AI眼镜的ISP调校、质量管控按汽车标准执行,对每个下线的眼镜进行100%全检,耗时约2小时跑完所有功能 [24] - 生产供应商为歌尔,公司认为眼镜工艺要求高,自建产线不现实 [27] 发展路线与未来规划 - 公司规划了AI眼镜的产品路线:第一代是不带显示的产品,专注于轻量化(36克)和集成化 [25] - 下一代产品将是与蔡司联合开发的带显示的产品,能提供最好的光学配镜效果 [25] - 更远的未来是推出独立终端(无需连接手机),公司认为那将是产品真正的爆发时刻 [1][25] - 公司短期内聚焦于AI眼镜这一个人终端,不会向外拓展其他终端产品 [10][12] 市场环境与行业挑战 - 国内AI眼镜赛道竞争激烈,据不完全统计,中国已有至少50家公司正在推进智能眼镜项目,包括百度、华为、小米、腾讯等科技公司 [6] - 公司当前面临汽车业务挑战:2025年增程车型市场份额被对手蚕食,纯电市场处于从0到1阶段,月销量从巅峰期的5万台下滑至3万台 [2] - 外界质疑公司在销量低谷期推出AI眼镜是不务正业,认为扩充品类应在销量巅峰期进行,且车企做AI眼镜不具备天然优势 [10] - 公司回应称,其目标不是参与“百镜大战”,而是专注于把重量、续航、响应速度、智能化能力等最基本的东西做好 [17]
理想发布AI眼镜Livis:在跨界背后,是AI进入日常的野心
观察者网· 2025-12-03 22:51
公司战略与产品定位 - 理想汽车发布首款AI智能眼镜Livis,售价1999元,标志着公司将智能化从汽车延伸至个人终端[1] - 公司创始人兼CEO李想以产品经理思维打造产品,Livis延续“理想式产品”风格,核心是关注用户体验[3] - 理想汽车宣布从智能汽车公司转型为人工智能科技公司,AI被视为未来核心,并设立穿戴机器人与空间机器人两个部门[18] 产品核心功能与技术特点 - Livis镜架重量仅36克,为行业最轻,配备240mAh石墨负极电池,免费赠送1700mAh充电盒,支持车载无线充电[7] - 典型续航达18.8小时,配合充电盒可使用4天,采用不关机策略,实现300ms唤醒速度和800ms执行响应[7][9] - 搭载自研操作系统Livis OS和自研多模态大模型Mind-GPT,支持语音助手转写文字、自动总结、连贯记忆等AI功能[9] 生态融合与场景应用 - Livis与理想汽车生态深度融合,可远程控制空调、座椅加热/通风、充电口/后备箱等车控功能[11] - 眼镜与车机联动,可将驾驶相关语音播报通过眼镜发声,为主驾形成独立声场[11] - 结合辅助驾驶,用户可通过语音控制车辆移动、远程召唤,并利用眼镜第一人称视角让车辆精准接驾[13][15] 研发能力与差异化优势 - Livis研发团队来自公司原有智能汽车工程师,包括语音、算法、图像、嵌入式等领域,共享车端技术能力[16] - 产品竞争力体现在三方面:重量/续航/反应速度等体验提升、Mind-GPT个性化服务能力、汽车与眼镜生态融合[15] - 公司自研Deep Research能力在评测中表现优异,MindDR在报告生成、信息获取、权威引用率等指标接近行业领先水平[12]
理想在报纸版的人民日报上刊登广告
理想TOP2· 2025-11-25 10:16
文章核心观点 - 理想汽车作为中国新能源汽车产业的标杆企业,其发展历程和战略布局体现了行业高质量增长的核心驱动力,包括技术自研、产业链协同和智能制造 [13] - 公司通过构建“理链”生态,实现了从核心技术突破到供应链韧性提升的全面进阶,并与区域经济深度融合,成为发展新质生产力的典型代表 [16][17] - 在人工智能驱动的产业变革中,公司定位为“全球领先的人工智能终端企业”,以持续大规模投入推动产品智能化和产业数字化转型 [15][19] 公司发展里程碑 - 公司成立于2015年,已成长为中高端新能源汽车品牌在中国市场率先实现年销量50万辆、连续两年营收超千亿元并实现盈利的标杆企业 [13] - 2024年,公司迎来第100万辆整车下线,从首辆车到百万辆仅用时58个月,成为中国首家达成此目标的“新势力”车企 [14] - 公司深度参与常州建设“中国新能源之都”,助力2024年常州新能源汽车产业规模突破8500亿元,向万亿级目标迈进 [14] 技术与研发投入 - 2025年,公司在人工智能领域的投入预计将超过60亿元,并正式推出VLA司机大模型和“理想同学”智能体,标志进入AI驱动发展新阶段 [15] - 公司通过自研实现核心技术突破,例如在常州布局新一代电驱动和增程器,在苏州布局碳化硅功率模组,实现产业链自主可控 [18] - 公司自研的“理想星环OS”实现整车操作系统全面开源,并与16家产业链生态伙伴签署合作备忘录,推动开源生态协同发展 [18] 产品与市场布局 - 公司成功推动增程电动技术规模化应用,并于今年第三季度量产搭载全自研碳化硅电驱的纯电车型理想i8、理想i6,形成覆盖增程、纯电的完整产品矩阵 [15] - 公司深耕家庭智能SUV市场,已建成“九纵九横”高速超充网络,平均每152公里有1座理想超充站,实现“充电10分钟,续航500公里” [15] - 公司产品上市即上量,背后是敏捷高效、韧性十足的供应链体系支撑 [17] 供应链与产业链生态 - 公司构建了以“卓越成长、智能创新、绿色健康”为特征的“理链”供应链体系,年采购额从百亿元到千亿元仅用3年 [16] - “理链”已形成高度近地化的“853”空间布局:80%分布于长三角地区,50%集聚于江苏,30%扎根在常州 [17] - 公司通过“理链”串联近千家合作伙伴,推动供应商从“按图生产”转向“前端共创”,实现集群化发展和价值重构 [16][17] 智能制造与数字化转型 - 公司通过自研Li-MOS智能制造操作系统,以AI算法驱动需求预测与智能排产,实现百万个零件订单自动生成 [19] - “连山数据科学协作平台”打通制造、供应、售后全链路数据,融合工业AI关键技术,催生智能分析与决策能力 [19] - 公司通过供应商深度集成平台实现供应端关键数据互联互通与系统深度耦合,提升产业链智改数转网联水平 [19] 人才发展与产业融合 - 公司通过“理想+”专项人才计划和共建产业学院,与全国上百所高校合作,联合培养高端产业人才超5000名 [17] - 以“产城人”深度融合为引擎,公司与常州携手打造“理想之城”,构筑以主机厂为中心、辐射广泛的“理链”人文生态圈 [17] - 2025年,公司成为江苏省城市足球联赛官方战略合作伙伴,通过“理链杯”运动会深化产业链伙伴联结 [17]
理想汽车:共建一流创新生态 让“移动的家”陪伴美好生活
人民日报· 2025-11-25 06:03
公司发展历程与成就 - 公司于2015年创立,在江苏常州和北京建设智能制造基地,已成为中国市场中高端新能源汽车品牌中率先实现年销量50万辆、连续两年营收超千亿元并实现盈利的标杆企业[1] - 2019年首台理想ONE驶下常州生产线,2024年迎来第100万辆整车下线,从首辆车到百万辆下线仅用时58个月,成为中国首家达成此目标的“新势力”车企[2] - 2024年公司深度参与常州建设“中国新能源之都”,助力当地新能源汽车产业规模突破8500亿元,向“万亿级产业”目标迈进[2] 产品与技术战略 - 公司成功推动增程电动技术规模化应用,2024年第三季度搭载全自研碳化硅电驱的纯电车型理想i8、理想i6相继量产,形成覆盖增程和纯电的完整产品矩阵[2][3] - 公司立志成为“全球领先的人工智能终端企业”,2024年在人工智能领域投入预计将超过60亿元,并正式推出VLA司机大模型和“理想同学”智能体[3] - 公司自研“理想星环OS”实现整车操作系统全面开源,并于2024年9月与16家产业链伙伴签署合作备忘录,推动开源生态协同发展[7] 供应链与产业生态 - 公司构建了以“卓越成长、智能创新、绿色健康”为特征的“理链”供应链体系,年采购额从百亿元到千亿元仅用3年,串联近千家合作伙伴[4] - “理链”形成高度近地化的“853”空间布局:80%采购分布于长三角,50%集聚于江苏,30%扎根在常州,推动供应商从“按图生产”转向“前端共创”[5] - 公司通过核心技术自研实现产业链自主可控,如在常州布局新一代电驱动和增程器,在苏州布局碳化硅功率模组[7] 生产制造与智能化 - 公司深耕“AI+制造”生态,自研Li-MOS智能制造操作系统以AI算法驱动需求预测与智能排产,实现百万个零件订单自动生成[8] - 通过“连山数据科学协作平台”打通制造、供应、售后全链路数据,融合工业AI关键技术,催生智能分析与决策能力[8] - 公司产品具备“发布即上市、上市即上量、上量高质量”的特点,背后依托一套敏捷高效、韧性十足的供应链体系[5] 基础设施与用户服务 - 公司已建成“九纵九横”高速超充网络,平均每152公里有1座理想超充站,并创新建成全国首座穿梭式超级充电站,实现“充电10分钟,续航500公里”[3] - 公司践行“创造移动的家,创造幸福的家”品牌使命,深耕家庭智能SUV市场,以绿色低碳夯实融合发展新基底[3] 人才发展与产业融合 - 公司通过“理想+”专项人才计划、共建产业学院等模式,与全国上百所高校合作,联合培养高端产业人才超5000名[6] - 以“产城人”深度融合为引擎,公司与常州携手打造“理想之城”,构筑以主机厂为中心、辐射广泛的“理链”人文生态圈[6] - 2025年公司成为江苏省城市足球联赛官方战略合作伙伴,通过“理链杯”运动会等活动深化产业链伙伴联结[6]
理想汽车荣获2025年世界互联网大会杰出贡献奖
新京报· 2025-11-11 14:55
获奖与行业认可 - 公司在2025年世界互联网大会乌镇峰会上荣获“世界互联网大会杰出贡献奖”,其自研辅助驾驶技术从全球400余项科技成果中脱颖而出,入选领先科技奖成果集《科技之魅》[1] - 公司作为“成长潜力类”获奖企业,从全球近200家申报企业中胜出,标志着其在人工智能技术与智能汽车融合领域的实践获得全球互联网领域高度认可[3] 技术战略与行业愿景 - 公司未来战略重点是将人工智能更深地扎根于企业经营全链路,并主动推动行业协同发展,探索技术标准与构建产业生态[3] - 公司秉持开放协同理念,致力于将“开放合作、安全普惠”的价值导向转化为汽车产业实践路径,推动产业高质量发展[6] 核心技术研发与投入 - 公司坚持核心技术自研,构建了从学术研究到技术落地应用的体系化能力,并在自动驾驶、基座模型等前沿技术领域于顶级学术会议和期刊发表多篇论文,部分代码和数据库已开源[4] - 在完善研发体系和高额研发投入支撑下,公司在辅助驾驶和智能座舱两大人工智能产品上实现重大突破[4] 辅助驾驶技术进展 - 2024年以来,公司辅助驾驶技术历经两次技术架构变革,从依赖规则算法迈入以模仿学习和强化学习为核心的人工智能时代[4] - 公司于今年8月正式推送全球首个VLA司机大模型,该模型具备空间理解、思维、沟通与记忆、行为与迭代五大核心能力[4] 智能座舱技术进展 - 公司自研的MindGPT多模态认知大模型是首个通过国家《生成式人工智能服务管理暂行办法》备案的汽车企业自研大模型[6] - 基于MindGPT打造的“理想同学”从智能语音助手进化为智能体,具备自主使用工具、完成复杂任务、记忆理解三大核心能力[6] - 为精准匹配用户体验,公司针对多模态交互、车载语义理解等独特需求,坚持自主研发基座模型[6]
L4大方向有了:理想自动驾驶团队,在全球AI顶会上揭幕新范式
机器之心· 2025-10-31 12:11
AI范式转变与行业趋势 - AI发展进入下半场,从依赖人类生成数据转向体验式学习的范式转变[1] - 要实现超越人类智能,AI必须超越模仿人类,依赖可随智能体改进而扩展的新数据源[1] - 在自动驾驶领域,AI范式转变趋势已显现,理想汽车在ICCV 2025提出全球首个将世界模型与强化学习闭环落地于量产自动驾驶系统的完整架构[2][5] 理想汽车辅助驾驶技术演进 - 辅助驾驶技术从规则算法发展到以VLA为核心的可交互自动驾驶方案[7] - 去年率先提出双系统方案,使用E2E和VLM结合构建辅助驾驶系统,成为AI时代主流路线[7] - 端到端辅助驾驶上线后,MPI水平在近12个月内提升明显[9] - 当训练数据扩展到1000万Clips后,基本端到端方式面临边际效应,技术提升出现瓶颈[11] 世界模型与训练闭环架构 - 构建从数据闭环到训练闭环的系统化思路,核心在于训练目标的达成而非单纯收集数据[5][12] - 系统包含具备先验知识的VLA车端模型和云端世界模型训练环境,通过强化学习体系实现迭代训练[14] - 世界模型系统需要场景重建、多传感器渲染、多模态生成、交通智能体、3D资产库等关键技术支撑[15] - 理想探索重建+生成路线,新一代AI系统具备重建稳定性和生成泛化能力[15] 合成数据与仿真技术突破 - 可通过提示词直接生成全部视频和点云,应用于新法规准入条件和新地区环境等少见场景[22] - 合成数据能力使训练数据配比更合理,辅助驾驶系统在实际道路的稳定性和泛化能力大幅改善[24] - 提出层次结构统一高斯图元,增强模型容量,能够建模大规模场景并重建任意动态元素[17][21] - 开发可编辑视频模拟框架RoboPearls,能够从演示视频构建照片般逼真、视图一致的模拟[32] 研究成果与学术贡献 - 自2021年起,自动驾驶团队有32篇论文中稿学术会议,研究方向从感知BEV E2E扩展到VLM/VLA/世界模型等前沿领域[28] - ICCV 2025大会上有五篇论文入选,覆盖3D数据集、端到端自动驾驶框架、3D重建、视频模拟等方面[28] - 提出业界首个大规模3D真实汽车数据集3DRealCar,通过对2500辆汽车精细3D扫描获得高保真图像和点云[28] - 开发端到端自动驾驶框架World4Drive,利用视觉基础模型构建潜在世界模型生成和评估多模态规划轨迹[30] 技术挑战与未来方向 - 强化学习引擎是辅助驾驶领域最具挑战的应用场景,要求泛化性、时效性和大规模并发[35] - 强化学习引擎五大关键因素:世界模型、3D资产、仿真智能体、奖励模型和性能优化[35][38] - 交互式智能体是比单车L4更困难的挑战,可通过调整强化学习reward约束多智能体行为[38] - 理想正在开展的交互智能体工作MAD即将发表[39] 公司AI战略与行业影响 - 研发资金近一半投入人工智能领域,已建立四支AI团队分别负责辅助驾驶、理想同学、智能工业和智能商业[43] - 两大战略级AI产品辅助驾驶和理想同学自2024年以来快速迭代,取得重大技术突破[43] - 成为行业首个推送VLA司机大模型的汽车企业,基于MindGPT的理想同学已上线手机App[43] - 开源部分辅助驾驶代码和数据库,被超过3200名开发者收藏或调用,VLA范式逐渐成为行业共识[43]
李想:特斯拉V14也用了VLA相同的技术
自动驾驶之心· 2025-10-20 07:32
OpenAI人工智能五阶段定义 - 聊天机器人阶段的核心是基座模型,功能为压缩人类已知数字知识,类比人类从小学到大学的知识积累过程[19] - 推理者阶段具备思维链和连续性任务能力,依赖SFT和RLHF训练,类比人类读研或师傅带徒弟的经验传授[20][21] - 智能体阶段AI开始实际工作,能使用工具完成长任务,对专业性和可靠性要求极高,需达到80-90分合格标准,类比人类胜任专业岗位[22][23] - 创新者阶段通过出题解题进行强化训练,需要世界模型和RLAIF模拟真实环境,类比职业选手通过上万小时实战成为专家[25][26] - 组织者阶段负责管理大量智能体和创新,防止失控,类比企业管理者的角色[27] 算力需求与技术布局 - 未来5年推理算力需求可能扩大100倍,训练算力需求扩大10倍[29] - 不同阶段需要不同类型算力:智能体阶段主要需要推理算力,机器人设备需要端侧推理,世界模型阶段需要海量云端推理[28][29] - 公司自研技术包括推理模型(MindVLA/MindGPT)、智能体(司机Agent/理想同学Agent)和世界模型[31] - 2026年将为自动驾驶配备自研端侧芯片,实现车与AI深度融合[33] 机器人发展路径与训练方法论 - 机器人发展有两条路径:将现有工具改造为机器人(如自动驾驶车辆),或开发人形机器人操作万物[34][35] - 训练的核心目标是提高成功率,参考人类"一万小时"专业训练理念[36][38] - 专业训练聚焦三大能力:信息处理能力(筛选有效信息)、出题解题能力(定义和解决问题)、资源分配能力(优化有限资源使用)[39][40][41] 行业技术观察与应用实践 - 特斯拉FSD V14证明其采用与VLA相同技术,具备空间完整理解能力和长任务多任务处理能力[44] - 公司内部已实现全面AI化,特别是在VLA技术应用后[45] - 行业领先的AI工具应具备简洁干脆的对话风格,避免过多铺垫性内容[46] - AI资讯获取渠道包括关键账号订阅、B站UP主内容跟踪以及内部多领域研究团队每周同步会议[48]
「理想同学」的进化史:从AI助手到智能体的自研之路
雷峰网· 2025-09-28 18:34
文章核心观点 - 公司通过自研实现从传统AI助手到大模型时代智能体的座舱智能化革命,将汽车定位为AI时代的空间机器人 [4][6][32][33] 座舱智能化战略转型 - 公司认为触控不是座舱主要交互方式,基于触控生态的车机系统是"用正确方式回答错误问题" [4] - 2023年5月推出自研认知大模型Mind GPT并以"理想同学"形式嵌入车机系统 [4] - 公司定位从车企转变为AI公司,目标是2030年成为全球领先人工智能企业 [19] 自研能力建设历程 - 2021年2月全面启动自研前,座舱技术依赖思必驰、地平线等供应商,用户数据由供应商掌握 [6][8] - 2021年底明确全部AI相关算法必须自研,打破供应商依赖局面 [9] - 通过SS1-SS4平台化策略实现车型结构可控,标准化配置避免定制化资源消耗 [9] - 自研切换周期从原计划两年压缩至一年,2022年11月首次在理想ONE完成自研语音落地 [10][13][16] - 2023年上半年基本完成座舱自研技术切换,彻底摆脱外部供应商依赖 [16] 大模型技术突破 - 2022年底ChatGPT出现后,公司意识到AI助手核心问题是"笨",必须通过大模型解决 [18][19] - 2023年4月确定Mind GPT名称,6月推出首个版本,使用1.3万亿token进行基座训练 [20][23] - 团队每周进行版本迭代,累计获得近8000张芯片资源支持 [25] - 2023年底Mind GPT通过OTA 5.0版本上车,成为较早实际应用车端的大语言模型 [25] - 2024年3月在英伟达GTC大会宣布车端部署22亿参数MindVLA大模型 [30] 产品功能演进 - 聚焦"三助一师"场景:用车助手、出行助手、娱乐助手及百科老师 [23] - 2023年9月推出"方言自由说"功能,实现多模态互动和手势控制 [25] - 大模型使理想同学能理解复杂功能组合,用户交互更自然 [25] 组织架构调整 - 2024年1月成立AI委员会,由谢炎负责技术路线评审和投资决策 [27] - 2024年10月理想同学业务优先级降低两级,陈伟调任基座模型部门负责人 [30] - CTO谢炎70%时间投入操作系统和自研芯片研发 [30] - 2025年4月开源理想星环OS,成为全球首家开源整车操作系统车企 [31] 未来技术方向 - 公司认为AGI进入"iPhone 4时刻",汽车将作为载体实现AGI的Agent阶段 [28][32] - 基座模型最终会融合成VLA模型,重点打造理想同学和自动驾驶两款AI产品 [31] - 不追求超大规模基座,注重投入产出比和场景结合度 [30]
高通组局,宇树王兴兴说了一堆大实话
量子位· 2025-09-26 17:12
文章核心观点 - 在2025骁龙峰会·中国上,行业核心玩家共同探讨了AI与Agent技术为终端设备(特别是具身智能机器人)带来的新想象,并剖析了当前行业面临的技术路线分歧、部署挑战及开放协作的必要性 [1][2][3] 具身智能机器人的发展路径与挑战 - 宇树科技CEO王兴兴提出了通用AI机器人发展的四阶段路线图:固定动作演示(已实现)、实时生成任意动作(预计最快2025年底/2026年初实现)、在陌生场景执行任务(预计2026年底左右实现)、高成功率与精细操作(目标成功率接近99.9%,需再数年) [11][12] - 机器人面临部署大规模算力的难题,包括空间限制导致高算力芯片难以安装、电池容量及散热问题难以解决 [20][21] - 机器人峰值功耗理想目标需控制在100W以内,平均正常功耗为20-30W,相当于几个手机的功耗,手机芯片应用于机器人领域具有想象空间 [23][24] - 工业机器人最常见的故障是线缆问题,可能占到故障总数的60%-70%,减少线缆数量对提升可靠性至关重要,目标是将每个手臂的线缆减少至仅一根 [16][17][19] 端侧AI与Agent系统的关键作用 - 端云协同已成为行业共识,端侧模型具备"永远在线"的优势,可持续感知世界、保障用户隐私,并作为核心编排者协同云端Agent完成复杂任务 [35][38] - 端侧模型需不断提升知识密度,面壁智能提出知识密度每三个月提升一倍的观点,以更好地适应各种硬件设备和用户场景 [39] - 在汽车座舱等具体终端场景,端侧模型能基于本地感知(如感知到后座小朋友哭闹)快速响应并协同云端模型提供服务,避免隐私暴露 [36] 行业协作与开放生态建设 - 当前行业处于黎明前夜,各家技术路线差异大导致整体进展缓慢,建议在模型尚无法直接部署的阶段保持开放态度,通过开源促进共同进步 [25][28][29] - 宇树科技已开源其基于视频生成的世界模型,包括模型、数据集、训练及部署源代码,旨在推动领域共同发展,类似OpenAI早期开源GPT-1/2的策略 [26][28] - 行业需共建基础设施以应对碎片化挑战,例如中科创达与高通、火山引擎等合作共建创新中心与联合实验室,推动混合AI方案优化 [48][51] Agent的服务本质与未来操作系统 - Agent的核心竞争力在于其能提供的服务能力,用户选择Agent的逻辑将类似于选择操作系统,关键在于其接入服务的广度与深度 [44][47] - 理想汽车的"理想同学"Agent已从车内服务扩展至生活场景,如点咖啡、交水电费、叫代驾等 [47] - 未来有望形成跨终端的操作系统,由Cloud OS与各终端Agent协同工作,AI将作为一种全新的UI催生新的AI OS [50]