Workflow
端到端架构
icon
搜索文档
特斯拉已不是智驾行业“标准答案”
36氪· 2025-10-31 08:25
时隔两年多,特斯拉再次"开麦"。 与此前不同,这次特斯拉对于自家智能辅助驾驶算法进展的分享,并不是在AI Day的舞台上,而是在近 日举办的计算机视觉顶会ICCV(International Conference on Computer Vision)期间。 特斯拉自动驾驶副总裁阿肖克·埃鲁斯瓦米(Ashok Elluswamy)作为嘉宾,在大会上发表了主题演讲。 有可能为了接上2023年6月他们提出端到端架构之后的"闭麦",阿肖克从"特斯拉为何会选择端到 端?"开始分享,但经过多年实践,他们也发现仅通过端到端想要做好智能辅助驾驶,存在一些挑战。 图源Tesla AI 首先就是端到端系统需要解决从极高维到极低维的映射问题,这种映射往往是多对一,因此要保证输出 的正确性,训练难度可想而知。阿肖克的言外之意,或许是在强调端到端模型的"黑箱"问题。 基于特斯拉庞大的用户规模,每日可为他们产生相当于500年驾驶时长的数据,但其中多数是没有太多 价值的常规场景数据,对于算法的长远泛化没有太大帮助。 为了解决这两个问题,特斯拉在架构和算法层面做了一些优化和调整,比如在输出决策控制指令前,还 会输出OCC占用网络和3D高斯 ...
地平线吕鹏:穿越智驾淘汰赛,“反内卷”要靠真外卷
中国汽车报网· 2025-10-26 22:44
公司战略定位 - 公司定位为行业先锋,使命是赋能智能汽车和机器人,让人类生活更安全、更美好 [3] - 公司不仅是单一定位,而是国内少数实现规模化量产的智驾科技企业 [3] - 公司坚持“外卷”战略,聚焦于提升用户体验、品质和开拓边界,而非参与低价竞争 [7] 技术路径与路线图 - 公司采用与特斯拉相似的“渐进式”技术路线,从L2逐步迈向L4、L5级自动驾驶 [5] - “端到端”架构被视为实现类人驾驶体验的关键,公司通过软硬协同设计实现全链路AI安全与效能闭环 [5] - 公司提出“反共识”观点,认为真正的L3应建立在L4能力基础之上,预测到2028年系统性能将以每年10倍的速度提升,有望在特定场景实现接近“十万公里无接管”的L3体验 [5] 产品安全与认证 - 公司已构建覆盖硬件与软件的“全域安全开发体系”,并通过ISO 26262、ISO 21448、ISO 8800等多项国际权威认证 [3] - 公司成为国内安全体系最为完整的智驾科技公司之一 [3] 市场拓展与商业化 - 公司通过软硬结合技术路径实现更高性能、更优成本与更快迭代,目前已赋能超过25款车型出海,覆盖欧洲、中东、南美、澳洲等市场 [7] - 公司与多家国际Tier-1及外资车企达成合作 [7] - 公司出货的千万级芯片被视为“实打实的市场需求”,智能驾驶已是一个“不需要再证明”的确定性市场 [9] 行业竞争格局展望 - 行业已进入“淘汰赛”尾声,未来三到五年将收敛至两到三家头部企业 [9] - 行业决胜关键在于是否具备持续走向L4、L5的技术储备、数据闭环与商业生态,而非“价格战” [9] - 智能驾驶的终极目标是成为汽车中的“自动挡”,真正回归产品力 [7] 新兴领域布局 - 公司将车视为机器人场景,目前将90%以上精力聚焦于汽车这一“第一个要打穿的机器人场景” [9] - 公司基于智驾领域积累的芯片与系统能力,为机器人产业提供轻量而高效的计算平台 [9]
在具身智能的岔路口,这场论坛把数据、模型、Infra聊透了
机器之心· 2025-09-29 10:52
行业核心观点 - 具身智能行业正处于技术路线分歧与探索阶段,面临数据稀缺、技术架构选择等关键议题 [1] - 行业已初步观察到具身智能的Scaling Law,预示扩大模型和数据规模可能有效 [24] - 阿里云作为云计算巨头,提前布局行业未来3到5年的基础设施需求,旨在为行业爆发做准备 [3] 数据路线之争:真机派 vs. 合成派 - 真机派主张通过遥操或互联网获取真实数据,基于VLA做模仿学习,认为真实数据是训练世界领先模型的根本 [5][14] - 合成派认为实现通用泛化能力需上万亿条数据,真机采集不可持续,主张通过仿真合成数据进行预训练,再用少量真实数据后训练 [5][8][9] - 真机派挑战“真机数据昂贵”共识,指出在国内供应链支持下,单个机器人成本可降至10万以下,规模化部署机器人采集数据成本可控 [12] - 合成派面临挑战:某些仿真数据获取依赖专业人力(如图形学博士),成本可能更高;仿真数据效率可能比真实数据差5-6个数量级 [11] 技术架构与模型形态 - 具身智能大模型被视为独立于语言模型的基础模型,因其需处理物理动作和接触的复杂性 [18] - 技术架构存在端到端与分层路线之争:分层架构考虑现实部署约束,符合生物进化规律;端到端架构旨在避免分层错误放大和层间理解鸿沟 [19] - 视觉语言动作模型(VLA)被视为当下更有潜力的路线,仅需100条数据即可见效,而世界模型需万级至亿级数据量,是更终局的路线 [21] - 世界模型被赋予重要作用,如辅助VLA进行自主学习探索、生成动作序列补充数据,与VLA是互补而非冲突关系 [20] 行业发展趋势与阿里云的角色 - 行业落地速度加快,多家公司分享了在工业制造、康复陪伴、教育竞赛等场景的实践 [24] - 阿里云基于智能驾驶行业经验,提前为具身智能行业的数据指数级增长和算力需求布局,提供全链路基础设施支持 [3][31][32] - 阿里云具备模型原厂优势,其开源模型Qwen-VL被大量具身智能公司用于后训练,最新Qwen3-VL模型针对具身智能需求优化 [37][38] - 阿里云将智能驾驶领域的工程经验复用至具身智能,提供从数据处理、模型服务到工具链集成的全套云上能力 [35][41][42] - 公司建议具身智能企业从第一天起规划云架构和AI基础设施,以应对量产阶段的数据激增和工程化挑战 [29][42]
投注“端到端”:AI驶向物理世界,阿里云加速“闭环”
第一财经资讯· 2025-09-27 20:43
行业技术范式变革 - 智能辅助驾驶技术架构正从“多模块多阶段串联”向“端到端一体化”变革,带来范式革命 [1][2] - “端到端”架构推动视觉、语言和行动能力深度融合的VLA架构模型发展,实现通过数据训练自主应对复杂场景 [2] - 产业界认为“端到端”范式革命的拐点已到来,但同时也面临新的技术难关 [1] 行业面临的核心挑战 - “端到端”技术对数据量与算力需求呈指数级增长,主流智驾企业单次模型训练数据量需达10P-30P,远超传统的TP到几个PB [3] - 具身智能需要机器理解物理世界并执行复杂动作,涉及视觉、语言及摩擦、形变等物理规律,复杂性远超其他领域 [3] - 具身智能落地面临数据分散、算力需求特殊、通信要求苛刻等研发困境,需要算力、大数据、人工智能平台三位一体的云上AI基础设施 [3] 云厂商的战略布局与解决方案 - 阿里云观察到客户算力需求已处于万卡规模以上,对模型规模、多模态数据处理及合规要求提高 [4] - 阿里云大数据AI平台建立模型、AI基础设施、数据基础设施、端到端工具四大要素的技术支撑,投入Agentic AI落地的基础设施搭建 [4] - 阿里云智能辅助驾驶解决方案通过统一元数据管理实现对百PB级数据高效管控,并支持Lance格式训练加速与数据压缩 [4][5] 技术解决方案的成效 - 某车企采用阿里云解决方案后,实现百万级任务管理及开发调度,支持上万任务并发,产能达30w clips/天,效率较升级前提升2-3倍 [5] - 阿里云平台满足机器人数据预处理、分布式训练、数据大规模远程回传等需求,提升研发及模型迭代效率 [5] - 目前80%以上中国车企及多家头部机器人企业的数据处理与模型训推链路运行在阿里云大数据AI平台上 [5] 产业生态合作与竞争格局 - 阿里云与英伟达在Physical AI软件工具栈合作,集成Isaac Sim、Cosmos等工具,形成覆盖数据预处理、仿真测试的全链路平台支撑 [6] - 阿里云Data+AI在全模态兼容、弹性可扩展、安全合规等方面处于市场前列,正从技术供应商转变为产业变革引领者 [6] - 未来全球可能仅存5到6个超级云计算平台,阿里云正以饱和式投入推进AI基础设施建设,参与“超级AI云”竞赛 [8]
汽车行业专题报告:辅助驾驶的AI进化论:站在能力代际跃升的历史转折点
国海证券· 2025-07-22 19:26
报告行业投资评级 - 维持辅助驾驶行业“推荐”评级 [1][8][110] 报告的核心观点 - 辅助驾驶行业现状是平均水平提升、技术路线收敛,车企难差异化,向高级别跃迁时细分安全功能待提升,人机交互边界模糊带来商业化落地焦虑和安全隐患 [5] - 建立辅助驾驶能力研究框架,从企业组织战略、技术能力、消费者感知三个维度梳理全栈自研主机厂辅助驾驶能力及潜力 [6][7][111] - 大算力芯片上车元年,世界模型持续优化,辅助驾驶行业能力迎来迭代拐点,头部厂商解决方案逐步完善,车企展开战略合作推动智能化渗透率普及,供应链格局显现,国内供应商向软硬件一体化发展 [8][110][111] 根据相关目录分别进行总结 前言:辅助驾驶技术进展及研究框架构建 - 全栈自研主机厂发展进程:介绍特斯拉、小鹏、华为、理想、蔚来、小米等车企辅助驾驶研发进展、硬件配置、车型发布等情况 [11][15][28] - 第三方解决方案玩家格局:车企与头部智驾厂商合作可节省成本、抢占市场,Momenta、元戎启行、地平线等厂商端到端方案推进有节奏且合作覆盖广泛 [45][46] - 构建辅助驾驶技术研究框架:从企业经营、技术能力、用户感知三个维度衡量辅助驾驶能力,分析各车企研发投入、战略重心、传感器方案、算力、模型等情况 [48][49][50] 维度一:企业组织和战略 - 辅助驾驶战略布局:研发方向从早期模块化分工向端到端融合、全域架构与跨域协同发展,车企动态调整团队架构与研发重心 [53][54][55] - 辅助驾驶研发投入:2022 - 2024年技术驱动型企业研发费用普遍高于15%,规模效应型企业随销量增长费率降低,小米集团2021 - 2023年研发费用率逐步攀升 [60] 维度二:技术能力三要素 - 传感器、算力、模型 - 传感器:技术降本与规模量产推动多感知方案并行,形成“数据输入 - 算法进化 - 硬件适配”正向循环,国产厂商在传感器供应链格局中份额稳步提升 [64][66][67] - 算力军备赛:云端智算中心肩负模型训练等任务,头部车企建立EFLOPS级超算中心,车端驾驶域控芯片向大算力化跃迁,国产芯片2025年集中量产 [75][78][85] - 车云模型:技术路径收敛,架构由决策规划模型化向模块化端到端发展,引入多模态数据信息,世界模型运用数据驱动提升类人化决策能力 [7][111] 维度三:消费者感知 - 辅助驾驶功能表现能力 - 驾驶辅助功能:“车位到车位”功能融合行车与泊车功能,实现全场景连续驾驶目标,各车企相关功能不断迭代升级 [97][98][105] - 安全辅助功能:AEB性能边界优化,车辆避撞方式与车速有关,蔚来等车企安全辅助功能不断提升 [99][103][105] - 消费者感知力:辅助驾驶产品标签化,成为新车卖点,各车企驾驶及安全辅助功能落地进程有差异 [105] 投资建议 - 建议关注车企研发及功能落地进展,如特斯拉、小鹏、鸿蒙智行合作车企、理想汽车、蔚来汽车、小米集团;以及头部第三方解决方案供应商,如Momenta、元戎启行 [8][111] - 建议关注供应链国内供应商,如速腾聚创、禾赛科技、舜宇光学科技、联创电子、德赛西威、华阳集团、均胜电子、知行科技、地平线机器人、黑芝麻智能等 [8][111]
AI端侧深度之智能驾驶(上):技术范式迭代打开性能上限,竞争、监管、应用加速高阶智驾落地
中银国际· 2025-07-18 14:40
报告行业投资评级 - 行业评级为强于大市 [1] - 水晶光电评级为买入 [1] - 隆利科技评级为买入 [1] - 瑞芯微评级为增持 [1] 报告的核心观点 - 智能驾驶有望成为物理 AI 率先落地的场景,带动产业链企业投资机遇 [1] - 技术范式迭代为高阶智驾奠定基础,变更行业竞争壁垒 [3][5] - 车企竞争、监管政策、商业应用推动高级智驾发展,L3 级乘用车落地在即、L4 级商用车初现曙光 [3][5] - 中国汽车零部件和布局汽车业务的消费电子企业为代表的供应链,将深度受益高阶智驾渗透率提升趋势 [5][168] 根据相关目录分别进行总结 智能驾驶是物理 AI 率先实现的场景,发展节奏迎加速 - 智能驾驶可提供“解放精力、减少事故”价值,城区 NOA 有望加速渗透 [13][20] - 因成熟度、需求量、政策支持力度等因素,智驾有望成为物理 AI 率先落地的场景 [27] - 高阶智驾落地面临挑战,责任认定成为主要难点 [33] 技术篇:技术范式演进为高阶智驾奠定基础,行业壁垒急剧切换 - 架构升级,端到端架构具备数据驱动/全局优化优势,替代模块化架构成为主流 [36][37] - 范式演进,从规则驱动走向数据驱动/知识驱动,数据/算力/模型成为车企竞争壁垒 [60] - 未来展望,世界模型 + 纯强化学习或成 L4 级智驾的方案,竞争壁垒或变成世界模型精度 [82] - 案例,从理想 MINDVLA 模型架构、训推过程看智驾技术落地的最近进展 [97] 商业篇:竞争、监管、应用同时加速,L3 落地在即、L4 初现曙光 - 商业竞争,智驾成为车企品牌的核心差异化,平权和升规同时加速渗透 [126] - 政策监管,全球智驾政策从试点转向推广应用,国内首次放开 L3 级乘用车上路 [137] - 应用落地,L3 级智驾商业模式逐渐成熟,L4 级 ROBOX 落地节奏加快 [154] - 投资建议,建议关注地平线机器人 -W、黑芝麻智能、瑞芯微等企业 [168]
Transformer 在具身智能“水土不服”,大模型强≠机器人强
36氪· 2025-06-18 19:55
具身智能行业发展现状 - 2025年被业界称为"具身智能元年",宇树机器人等产品频繁登上热搜并走向全球[1] - 技术大佬纷纷投身机器人创业,大批创业项目集中涌现,行业进入爆发期[1] - 英伟达CEO黄仁勋宣称"通用机器人时代已经到来",但知名投资人朱啸虎却批量退出人形机器人公司,显示行业存在泡沫争议[1] 技术发展路径与挑战 - 从多模态大模型到具身智能是自然的技术演化,需要海量数据积累和底层基础设施支持[3] - 当前大模型面临高能耗问题,作为机器人"智能大脑"可能导致开机一分钟耗尽电量[4] - 模型在多任务场景下泛化能力弱,遇到新任务时快速适应能力差,导致需要专用机器人完成不同家务[5] - Transformer架构已近十年无革命性变化,依赖庞大参数导致巨大训练成本和能耗[5] - 大模型与机器人多模态感知体系不匹配,结合深度较浅,落地面临技术难题[6] 技术实现路线 - 行业存在模块化分层思维和端到端架构两种技术路线,尚未形成统一标准[7] - 硬件不成熟导致数据采集困难,形成"硬件不稳定-落地困难-数据不足-模型优化受限"的恶性循环[8] - 从Pipeline向端到端演进是AI各领域的共同趋势,包括信息检索、聊天系统、自动驾驶等[14] - 智源研究所发布RoboOS和RoboBrain框架,兼容主流机器人设备,实现一站式服务[11] 行业痛点与未来展望 - 当前具身智能水平仅能完成预设任务,无法真正理解人类意图并自主执行[18] - 人脑、AI大脑与机器人三者之间存在显著Gap,缺乏有效协同机制[16] - 语音交互存在延迟问题,探索人脑意图信号直连AI的可能性[19] - 大模型在空间感知和物理世界理解方面存在重大缺陷[21] - 未来5-10年是软硬件交替迭代关键期,算法升级将推动硬件进步,反之亦然[31] - 多任务混合训练趋势初现,机器人可能从专用型向通用型转变[32]
100万片才能回本!蔚小理为啥还要扎堆造芯片?
电动车公社· 2025-06-18 00:28
车端算力发展历程 - 2021年英伟达Orin-X芯片以254TOPS算力开启车端算力竞争,远超Mobileye Q5H的24TOPS和特斯拉HW3 0 [1] - 蔚来采用4颗Orin-X芯片实现超1000TOPS算力 [3] - 2025年小鹏G7搭载3颗自研图灵AI芯片,有效算力达2200TOPS创量产车新高 [6] - 理想"舒马赫"计划研发的马赫100芯片2026年量产 [8] 车企自研芯片驱动因素 - 特斯拉因Mobileye黑箱模式限制数据调取转向英伟达开放平台 [15][16] - 英伟达方案仍存在成本功耗问题,促使特斯拉自研HW3 0芯片 [19][21] - 2019年特斯拉HW3 0芯片144TOPS算力领先行业,2023年HW4 0提升至720TOPS [22][23][25] - 中国车企2020年后因黑箱模式转向英伟达,近年加速自研芯片突破 [29][30][36] 技术路线与L3自动驾驶 - 小鹏采用"重视觉轻雷达"方案,华为选择多激光雷达融合方案 [48][49] - 自研芯片可实现100%算力利用率,小鹏G7 2200TOPS有效算力为L3级提供可能 [52][53] - L3级自动驾驶要求车企承担事故责任,倒逼技术精进 [56][57][58] 自研芯片挑战与产业意义 - 小鹏曾因架构问题推倒重来,赔偿数亿违约金 [63] - 车规芯片流片失败风险达数千万美元,验证周期长达5年 [64][65][69] - 需百万片量产规模才能回本,小鹏计划拓展飞行汽车等应用场景 [71][72] - 中国车规芯片从功率半导体到大算力AI芯片实现设计突破,但制造环节仍受制约 [78][79][80]
中金《秒懂研报》 | 智能驾驶:引领出行变革的新时代
中金点睛· 2025-05-24 16:32
智能驾驶背后的技术引擎 - 端到端架构降低数据标注难度并优化数据处理流程,减少人工工作量,提升信息传递效率[2] - 视觉语言模型和云端模型的引入增强系统处理复杂场景的能力[3] - 城市导航辅助驾驶(NOA)或成为车企竞争新热点,未来可能向L3/L4高阶自动驾驶发展[3] 智能驾驶的普及步伐 - 高速NOA功能2024年已规模化上车,有望成为20万元以上智能驾驶汽车的标配[5] - 城市NOA渗透率2024年有望达6.5%,成本降低推动搭载车型价格下探至20万元级市场[7] 智能驾驶的商业模式 - L2++智能驾驶软件收费面临挑战,车企多选择标配系统积累用户数据,探索减配方案增厚硬件利润[11] - 头部车企尝试买断或订阅付费模式,如华为ADS 3.0订阅价720元/月或7200元/年,买断价36000元[12] - L3自动驾驶功能落地可能推动后向功能订阅收费,2025年或迎来收获期[12] 城市NOA的益处 - 带动高配置、高毛利车型销售,硬件成本增加但单车毛利增量可观[13][14] - 理想L7 Pro/Max车型差价28000元,单车毛利润增量13700元;小鹏G6 Pro/Max差价20000元,毛利润增量10000元[15] - Robotaxi与城市NOA技术栈需求重叠,2025年头部智驾企业或公布相关路标推动行业转型[15] - 国内Tier1企业凭借技术和量产经验具国际市场代际优势,合资车企合作推动全球化发展[16][17]
元戎启行的量产时刻
经济观察报· 2025-05-16 11:09
行业背景与趋势 - 智能驾驶行业在监管趋严与产业规范重塑的背景下经历技术与资本的双重重估,"可解释性"、"高可用率"、"规模化量产能力"成为供应商核心竞争要素 [2] - 2024年国内L2级及以上辅助驾驶乘用车渗透率达55.7%,预计2025年将提升至65%,行业从"功能叠加"转向"系统能力竞争" [7] - 整车厂采购逻辑从"功能可用"转向"系统稳定性、产品解释力、场景覆盖度"的复合考量 [7] 公司技术路径 - 元戎启行采用端到端架构演进出的VLA模型(视觉-语言-动作),在感知、决策与人机交互完整链条上拓展技术边界 [2] - 通过引入大语言模型构建VLA架构,保留端到端效率优势的同时增加"语义注释"能力,可解释复杂场景如潮汐车道、可变车道的识别 [3][5] - 推行Mapfree"无图"策略,导航地图方案成本仅为高精地图的三分之一,降低对外部资源的依赖并提升部署效率 [6] 商业化进展 - 2023年与长城汽车合作的首款车型魏牌蓝山上市后四个月销量超3万辆,2024年四季度城区NOA市场份额达15% [6] - 截至2025年初实现10款车型量产下线,其中5款以上搭载VLA模型,覆盖SUV、MPV等细分市场 [7] - 累计完成六轮融资,包括阿里巴巴3亿美元和长城汽车1亿美元投资,资金用于VLA研发及海外拓展 [6] 竞争格局 - VLA方案在国内推进至量产阶段的企业较为有限,元戎启行处于工程化能力验证窗口期 [5][7] - 行业估值体系从概念向数据、再向量产验证迁移,先行者的实际表现成为市场判断关键依据 [7]