Workflow
英伟达Thor
icon
搜索文档
公司问答丨天准科技:目前基于英伟达Thor的星智007系列产品正在陆续导入多个头部人形机器人客户 已对部分客户实现小批量销售
格隆汇APP· 2026-01-27 15:56
公司与客户合作进展 - 2025年公司与智元等机器人客户紧密合作,实现了星智系列控制器数千台的批量出货 [1] - 基于英伟达Thor的星智007系列产品正在陆续导入多个头部人形机器人客户 [1] - 星智007系列产品已对部分客户实现小批量销售 [1]
中国智能驾驶产业的算力巨变
36氪· 2025-12-30 18:36
行业核心观点 - 2025年中国智能驾驶行业迎来前所未有的算力变局,算力成为行业发展的核心要素,无论是在车端还是云端,对算力的需求都越来越高[1][2] - 行业在软件算法路线上出现纷争,以理想、小鹏、元戎启行为代表的玩家选择VLA方案,而华为、蔚来等则更加强调世界模型,但尚无一家在用户体验层面形成碾压性优势[1][7] - 高阶智能驾驶的商业落地呈现K字型分化,导致车端算力落地走向碎片化,同时有玩家正从L2向L4体系的Robotaxi布局,云端算力的作用日益凸显[2] - 自动驾驶技术正处在从量变到质变的前夜,向L4迈进需要车端和云端算力的持续大幅加码,云端算力的角色可能更加重要[26] 技术范式演变与算力需求 - 特斯拉在2023年通过FSD Beta V12直播展示了其端到端自动驾驶系统,并在此框架下持续推进软件更新,如FSD V12.5参数数量是V12.4的五倍,V14参数量更是高达10倍[3][4][5][6] - 中国智能驾驶玩家在2024年集体迈出拥抱端到端的步伐,但进入2025年后,在意识到端到端方案的局限后,开始探索VLA、世界模型等新的算法演进路径[7] - 智能驾驶的技术演进,尤其是在进入端到端体系后,对数据处理和模型训练提出更高要求,在云端掀起了一场算力军备竞赛[20] - 自动驾驶的终极形态被设想为将规则输入大型多模态模型并实时处理传感器数据,这依赖于AI技术的持续发展和算力的双重加持[28] 车端算力格局与流派分化 - 2025年,高阶智能驾驶的车端算力选择主要分为三大流派:车企自研、英伟达系、华为系及其他[12] - **车企自研派**:以蔚来、小鹏、理想为代表。蔚来自研的神玑NX9031芯片,一颗算力水平相当于四颗Orin-X[13]。小鹏自研的图灵AI芯片算力为750 TOPS,并以三颗组合或单颗形式上车[13]。理想已宣布自研M100芯片,预计明年上车,其宣称在运行大模型和视觉模型时性能分别为市场最强芯片的2倍和3倍[13] - **英伟达系**:英伟达最新一代Thor芯片提供数倍于Orin-X的算力,是市场热门选择。2025年在理想、领克900、小米YU7、极氪、智己等多款车型上落地,极氪9X车型还提供双Thor芯片方案[13][14]。英伟达Orin-X平台仍在部分车型上使用,如蔚来乐道品牌车型[15] - **华为系及其他**:华为不倾向于公开其智驾平台算力,更注重软件算法迭代和云端训练,但部分车型如尊界S800采用了算力更高的MDC 810计算平台[15]。地平线在2025年推动其J6芯片系列通过HSD方案上车,已在奇瑞、长安部分车型落地[15] 云端算力的关键作用与竞争 - 云端算力是智能驾驶算法进化的关键基石,也是未来算法迭代的核心支撑,其重要性在行业向L4演进过程中愈发凸显[19][20] - 特斯拉在FSD演进中的优势,部分得益于其更充足的云端算力,为数据闭环、训练和仿真验证提供了巨大优势[20] - 行业在2023-2025年持续进行云端算力军备竞赛。即使在2024年财务状况不佳时,也有新势力车企老板拍板增加云端算力,并在2025年实现了算法的跨越式迭代[20] - 2025年,云端算力依旧不够用,且受限于公司每年的算力预算。解决长尾问题的数据训练、仿真模拟等只能在云端完成,行业共识认为首先要解决的算力瓶颈可能在云端[21][23] - 英伟达推出了开源的Cosmos世界基础模型、3DGRUT等工具来助力自动驾驶在云端的开发[23]
国盛证券:智驾核心部件壁垒高筑 国产芯片替代正当时
智通财经网· 2025-08-11 15:25
汽车智驾芯片行业趋势 - SoC是汽车计算芯片主流趋势 智驾SoC专为自动驾驶功能设计 通常集成到摄像头模块或自动驾驶域控制器中 用于决策层 [1] - 衡量车载SoC芯片性能主要从算力、存储带宽、功耗等维度考量 由于设计制造难度大、资金投入高、验证周期长 智驾芯片具有极高壁垒 是智驾系统中价值量最高的核心部件 [1] - 舱驾一体化趋势显著 可降低成本 英伟达Thor、高通8775等单芯舱驾一体方案2025年将规模化量产 [1] - 随着智能驾驶级别提高 大算力与先进制程为后续发展趋势 [1] 智能驾驶市场发展 - 各地区智能驾驶政策持续加码 准L3及以上智驾加速渗透 [2] - 智驾平权趋势显著 NOA配置价格持续下探 高阶智驾下沉至10-20w车型 20万以下车型约占中国乘用车市场60% 此前均不配备NOA功能 渗透率提升空间大 [2] - 2023年全球/中国ADAS(L1~L2+)SoC市场规模分别为275/141亿元 预计2028年分别达925/496亿元 2023-2028年复合增速28%/29% [2] - ADS市场(L3~L5)仍处发展初期 预计2030年全球ADS SoC市场规模将达454亿元 [2] 市场竞争格局 - 2024年英伟达以39%市场份额稳居国内智能驾驶辅助芯片市场首位 搭载于理想L系列Max版、小米Su7 Pro/Max等高端车型 [3] - 地平线2024年市占率11% 出货主力为征程5 出货高度集中于理想Pro版本 [3] - 智驾平权趋势下市场下沉 中低阶方案占比将提升 国产化方案凭借低成本优势和产品能力提升有望在细分市场中突围 [3] - 地平线、黑芝麻智能等国产芯片供应商份额有望进一步提升 [3] - 当前智驾芯片行业整体处于高投入、高增长、低盈利阶段 厂商普遍亏损 但规模效应逐步显现 亏损率逐步缩窄 地平线预计最早2027年可实现盈利 [3] 投资机会 - 智能驾驶渗透率快速提升 催生巨大市场空间 带动智驾芯片需求高增长 [4] - 高性价比国产芯片有望迎来机遇 国产化替代趋势显著 [4] - 建议关注核心受益国产替代的地平线机器人-W(09660)、黑芝麻智能(02533) [4] - 建议关注率先布局舱驾一体的英伟达(NVDAUS)、高通(QCOMUS) [4] - 建议关注自研高算力芯片的车企小鹏汽车-W(09868)、特斯拉(TSLAUS) [4]
自动驾驶为什么需要NPU?GPU不够吗?
自动驾驶之心· 2025-07-26 21:30
自动驾驶芯片技术对比 - 纯GPU方案可实现低级别自动驾驶,但存在延迟高(80毫秒导致车辆行驶1.33米)、功耗大(4颗TITAN X GPU达320W使电动车续航减少30%)和效率低(ResNet-152模型处理4K图像耗时28毫秒)三大短板 [5][6][7] - NPU专用架构在神经网络计算中表现优异:华为昇腾310B含2048个MAC单元,数据流转路径比GPU减少60%;处理相同任务耗时仅8毫秒,比GPU快3.5倍 [12][6] - TPU采用512x512脉动阵列,数据复用率比GPU高3倍,专为TensorFlow优化但灵活性较低 [12][14][27] 芯片架构原理差异 - GPU基于通用流处理器(如GTX1080含2560个),执行AI任务时30%-40%硬件资源闲置 [10] - NPU采用MAC阵列直接映射神经网络结构,华为昇腾310B通过2048个乘加单元实现硬件级矩阵运算加速 [12][15] - TPU的脉动阵列通过数据节拍流动(如TPUv2的512x512阵列)减少访存次数,适合大型矩阵乘法 [14][15] 混合计算方案优势 - 英伟达Thor芯片采用GPU+NPU异构设计:NPU处理YOLOv8目标检测(5毫秒/帧),GPU完成激光雷达坐标转换(3毫秒/百万点云),协同效率提升40% [30] - 混合方案相比纯GPU硬件成本降低25%(单芯片成本500美元 vs 4000美元),电路板空间占用减少50% [31][35][36] - 兼容现有GPU算法可节省18个月适配时间,量产10万台时NPU单位研发成本仅30美元(GPU需80美元) [30][37] 能效与成本数据 - NPU能效比显著领先:特斯拉FSD芯片NPU部分达5.76TOPS/W,是同级GPU方案(1.07TOPS/W)的5.4倍 [34] - L4自动驾驶测试中,纯GPU方案(150W)比混合方案(60W)每百公里多耗电8度,续航减少53公里 [34] - 实现144TOPS算力时,NPU方案硬件总成本1200美元仅为纯GPU方案(5500美元)的21.8% [35][36]
为什么定义2000 TOPS + VLA + VLM为L3 级算力?
自动驾驶之心· 2025-06-20 22:06
规模法则在自动驾驶中的应用 - 小鹏汽车在CVPR 2025论文中验证规模法则(Scaling Laws)在自动驾驶领域持续生效,核心发现是模型性能与参数规模、数据规模、计算量之间存在幂律关系 [4] - 在10亿(1B)、30亿、70亿直至720亿(72B)参数的VLA模型上验证了"参数规模越大模型能力越强"的规律 [6] - 确立了"海量高质量数据+大模型驱动"的自动驾驶能力跃升路径,VLA模型在VLM基础上增加了决策和行动能力 [6] 自动驾驶算力需求分级 - 从L2到L3级别算力需求呈指数级增长,L2级需80-300TOPS,L3级跃升至千TOPS级别 [8] - L3级需处理复杂城市道路场景,包括多样化交通参与者、动态环境条件等,需大规模神经网络实时推理 [8] - 小鹏提出2000TOPS+VLA+VLM作为L3级自动驾驶算力新标准 [6][8] VLA+VLM架构技术细节 - VLA架构以大语言模型为骨干,集成视觉理解、链式推理和动作生成能力 [10] - 视觉处理模块需数百TOPS算力处理多传感器数据融合 [10] - 语言理解模块在复杂交通场景语义理解时消耗大量计算资源 [10] - 动作规划模块涉及路径规划、行为预测等计算密集型任务 [10] 车载算力与数据中心算力对比 - 车载算力注重实时性与功耗平衡,需在有限空间和功耗下实现高效计算 [12] - 数据中心算力用于离线训练,能力是车载系统的数十至数百倍,可处理海量历史数据 [15] - 车载芯片如NVIDIA Orin、华为昇腾追求高能效比(TOPS/Watt) [12] 行业竞争格局与技术趋势 - 华为昇腾芯片系统算力达400TOPS,蔚来ET7搭载英伟达Orin平台(254TOPS) [17] - 英伟达下一代Thor芯片采用4nm工艺,基础版1000TOPS,增强版2000TOPS [20] - 小鹏G7采用三片自研图灵AI芯片,等效9颗英伟达Orin-X芯片 [20] - ADAS芯片市场份额:英伟达36%(年出货150万片)、特斯拉28%、华为11%、Mobileye 9%、地平线8% [20]