公司管理层表态与赌约 - 公司CEO何小鹏在硅谷试驾后认为,特斯拉FSD V14.2已进入准L4阶段,大幅超过去年水准,但公司第二代VLA的首个版本尚无法实现其全部能力[2] - 何小鹏与自动驾驶团队立下赌约:若到2026年8月30日,公司VLA在国内达到特斯拉FSD V14.2在硅谷的效果,他将在硅谷建一家中国风味食堂;若未达成,自动驾驶中心负责人刘先明承诺将在金门大桥裸跑[2] - 公司已宣布第二代VLA将在2026年第一季度正式发布,并计划向Ultra车型全量推送,赌约时间点设定在发布后约5个月,是关键优化期[4] 公司技术路线与能力展望 - 何小鹏表示,在最近几个月的测试中,首次感受到第二代VLA的上限能够达到L4的可能性,如果多给3-5年,也许能够达到L5[6] - 第二代VLA方案砍掉了语言转译环节,首次实现从视觉信号到动作指令的端到端直接生成[9] - 为研发该模型,公司采用了阿里云3万卡云端算力集群,部署720亿参数的基座大模型,每5天完成一次全链路迭代,何小鹏称明年云端算力将达5万卡甚至更多[9] - 公司自研的图灵AI芯片单颗算力为750TOPS,整车配备3颗芯片集群,总算力达2250TOPS,是行业主流双Orin-X方案(508TOPS)的4.4倍[12] 行业技术对比与公司挑战 - VLA(视觉-语言-动作)概念由谷歌DeepMind于2023年提出,旨在整合视觉、语言和动作能力,目前除该公司外,理想汽车、长城汽车等车企也在布局[8] - 特斯拉FSD通过全球超600万测试车辆,每天产生16亿帧图像数据,累计行驶里程已突破96亿公里,其“影子模式”能在全球多样化交通环境中收集数据[13] - 在实测中,20公里复杂小路上,特斯拉FSD V13.2.9版本接管5次,公司第二代VLA仅需接管1次,公司车辆能识别交警手势、理解红绿灯并提前反应,甚至在暴雨夜安全行驶[13] - 特斯拉最新FSD V14.2版本大幅提升性能,解决了V13.2.9版本中95%以上的犹豫变道和异常刹车问题[13] - 公司正在探索泛化问题,例如不同国家对黄灯交通规则的差异,这是追赶特斯拉FSD需要解决的能力之一[13] 公司研发投入与合作伙伴 - 用于训练第二代VLA模型的视频片段接近1亿个,无需人工标注,相当于人类司机驾驶65000年才能遇到的极限场景总和[9] - 阿里巴巴CEO吴泳铭曾亲自到访公司广州总部,与何小鹏会面[10]
输了裸奔,何小鹏打赌,明年8月要追上特斯拉FSD