VLM模型
搜索文档
何小鹏:大模型道路,大家都在摸着石头过河|36氪专访
36氪· 2025-06-12 19:29
小鹏G7与图灵AI芯片 - 小鹏G7搭载3颗自研图灵AI芯片,有效算力超2200Tops,超越行业主流方案(508Tops)3-28倍[1][3] - 公司定位G7为"首款具备L3级算力的AI汽车",预售价23.58万元起,打破此前蔚来ET9(2000Tops/78.8万元)的算力记录[1] - 图灵芯片团队需提前考虑未来8年技术路线变化以支撑5年安全期,面临内存带宽等挑战[6] 技术架构与模型部署 - G7 Ultra版本采用2颗图灵芯片运行VLA-OL模型(辅助驾驶)+1颗运行VLM模型(智能座舱),通过PCIe实现芯片间协同[3][10] - VLA模型新增"运动型大脑",配合强化学习训练使智驾能力上限比行业Max方案提升10+倍[4] - 本地化部署VLM(视觉-语言)与VLA(视觉-语言-动作)双模型,VLA模型帧率可达20-30帧/秒,显著提升安全时延[3][12] 行业对比与竞争格局 - 特斯拉FSD坚持端到端方案,规划下一代AI5芯片算力3000-7200Tops;国内理想等厂商已开始探索VLA方案[5][14] - 20-25万元纯电SUV市场将面临小米YU7、理想i6等竞品,G7通过SKU极简化+华为AR HUD+超长续航702km差异化竞争[6][16] - 行业L2高阶算力集中在500-700Tops(英伟达OrinX/ThorU),公司认为2000Tops是L3自动驾驶基础起点[11] 产品战略与迭代计划 - 芯片编译优化目标为1年半后实现"一颗顶四颗"效能,通过OTA每月新增功能,2024年内计划重大功能上线[7][8][9] - 产品线定位:G6(小康家庭)、G7(中产/年轻家庭)、G9(高端空悬车型),形成价格与技术梯度[16] - 当前未全系标配图灵芯片,G7 Max仍采用英伟达Orin X方案,未来将根据配置需求混合使用两种芯片[13]
130多天后再谈AI!李想透露实现VLA的三个阶段,回应“智驾”是否该叫停
每日经济新闻· 2025-05-08 10:01
每经记者|孙磊 每经实习编辑|余婷婷 "AI(人工智能)工具可划分为信息工具、辅助工具和生产工具三个层级。我觉得人工智能变成生产工具,才是真正人工智能爆发的时刻。"理想汽车董事 长、CEO李想在5月7日晚的《理想AI Talk第二季》中,分享了他对于人工智能的最新思考,VLA司机大模型的作用、训练方法和挑战,这距离他上一季谈 及人工智能已经过去了130多天。 李想表示:"判断Agent(智能体)是否真正智能,关键在于它是否成为生产工具。只有当人工智能变成生产工具,才是其真正爆发的时刻。就像人类会雇用 司机,人工智能技术最终也会承担类似职责,成为真正的生产工具。" 就理想汽车而言,其研发的VLA司机大模型则是以"司机Agent"的产品形态呈现。"用户可通过自然语言与司机Agent沟通,跟人类司机怎么说,就跟司机 Agent怎么说。简单通用的短指令由端侧的VLA直接处理,复杂指令则先由云端的VL基座模型解析,再交由VLA处理。"理想汽车方面表示。 此外,李想还回应了"有人觉得辅助驾驶应该被叫停"的问题。"经过多年,从规则算法到端到端+VLM(视觉语言),再到现在真正迈入VLA阶段,现在比 较像'黎明前的黑暗'。我 ...