Workflow
Orin芯片
icon
搜索文档
一位常年做GPU优化的人对理想能让Orin跑VLA很高评价
理想TOP2· 2025-12-06 23:16
文章核心观点 - 理想汽车在英伟达Orin芯片上成功运行视觉语言模型是一项极具技术水准的工作 其核心在于通过与英伟达深度合作 重写底层PTX指令集 突破了硬件原定的性能限制 [1] 理想汽车的技术突破 - 理想汽车与英伟达进行了深度架构对齐 基于PTX指令集重构了底层算子 并打造了自研推理引擎 成功突破了通用TensorRT算子集的性能天花板 [1] - 此项工作源于英伟达最初认为Orin芯片无法运行大语言模型 在理想汽车的坚持下通过重写PTX得以实现 [1] - 基于PTX的底层开发意味着工程师突破了高级语言抽象层 实现了对指令流水线与数据生命周期的细粒度控制 这不同于常规依赖编译器启发式算法的CUDA C++编程 [1] - 理想汽车可能通过显式插入Ampere架构特有的异步拷贝指令 将计算流水线与显存访问的延迟掩盖做到极致 [2] - 此项工作证明了理想汽车团队具备深入分析SASS并在指令级挖掘硬件潜能的核心能力 是一项高门槛的系统工程 [2] 与英伟达的合作关系 - 理想汽车与英伟达是通力合作关系 英伟达在Orin芯片微架构层面提供了原厂级的技术指引与配合 [1] - “理想是在教英伟达怎么压榨芯片能力”这一说法虽有事实依据但表述偏颇 “教”一词过于居高临下 未能准确反映双方的合作本质 [1]
对话任少卿:2025 NeurIPS 时间检验奖背后,我的学术与产业观
雷峰网· 2025-12-05 18:24
文章核心观点 文章通过报道任少卿及其团队获得NeurIPS时间检验奖,回顾了其奠基性工作Faster R-CNN的深远影响,并深入探讨了任少卿加入蔚来后,在自动驾驶全栈自研、芯片定义、数据闭环体系构建以及技术路线(如世界模型)探索等方面的实践与思考,展现了蔚来在智能驾驶领域从零开始构建核心能力的过程与战略布局 [1][2][11][13][27] 根据相关目录分别进行总结 Faster R-CNN的成就与影响 - 任少卿、何恺明、孙剑与Ross Girshick共同发表的Faster R-CNN荣获2025年NeurIPS时间检验奖,该奖项表彰经过十年检验、对学科发展产生深远影响的奠基性工作 [1] - Faster R-CNN发表于2015年,将物体检测效率提升10倍以上,开创了端到端实时精准目标检测模式,其论文已被引用超9.8万次,是AI检测领域全球最高被引论文 [2] - 该模型的核心思想已深度融入人工智能基础技术,成为驱动自动驾驶、医疗影像、安防监控、工业检测、卫星遥感等关键领域的核心技术 [2] 研究理念与团队合作 - 孙剑坚持“simple but work”的研究理念,认为做核心工作需要远见、品位和坚持 [4][6] - 任少卿与何恺明的合作紧密且高效,日常节奏包括多次集中讨论与实验推进,何恺明几乎投入100%的精力,专注于研究问题、寻找方向与突破 [6][7][8] - 团队选择深度学习方向基于几个关键判断:方法有创新性、已有初步结果和进展、结果具备泛化能力而非技巧性(trick),验证了方向的可扩展性 [10] 加入蔚来与全栈自研启动 - 任少卿于2020年8月加入蔚来,首要任务是搭建团队并启动全栈自研L2产品,支持L3和L4,同时进行芯片选型 [13] - 蔚来第二代车是全球首个量产英伟达Orin芯片(使用4颗芯片)及高线束激光雷达的车型,于2022年3月在中国量产,半年后在欧洲量产 [14] - 团队在极短时间内(从拿到芯片到量产仅6-7个月)克服了Orin芯片作为新硬件在算力(比上一代增大8倍多)、架构、散热、功耗及工具链等方面的挑战,完成了复杂的自动驾驶域控制器(ADC)架构量产 [14][15] 自研芯片的定义与考量 - 作为需求方,团队参与了自研芯片的定义,基于对技术发展的判断,早在2021年就预见到Transformer将更广泛应用,这对芯片内存带宽提出了更高要求 [16] - 蔚来自研芯片具备行业最高的带宽,以支持Transformer等模型,并为支持更高级别自动驾驶(L3/L4)预埋了热备能力,可在百毫秒内实现芯片切换且用户无感 [17] 数据闭环与高效迭代体系 - 蔚来自2020年起重点建设数据能力,认为数据的价值在于针对特定模型筛选出的“corner case”,而非简单的数据拷贝,数据筛选过程消耗大量算力 [19][20] - 公司构建了灵活调度云端和车端算力的系统,并在此基础上建立了类似互联网行业的“AB test”系统,允许在量产车上并行测试下一代算法 [21] - 通过“AB test”系统,蔚来将主动安全功能的迭代效率大幅提升,即使面对高达200万公里一次误报(FP)的严格标准,也能实现三天迭代一次的速度 [22] - 针对超80万辆量产车的智驾接管数据,建立了自动化分析系统,能过滤掉99%以上的无效信息,仅返回0.1%-0.5%的有效数据供进一步分析,极大提升研发效率 [22] 对端到端与世界模型的技术思考 - Faster R-CNN本质是解决了物体检测任务的端到端问题,将检测速度提升至实时(10Hz、20Hz、30Hz),为视频处理和应用落地带来突破 [11] - 任少卿认为,端到端是自动驾驶技术演进的一个阶段,但并未解决所有问题,例如语言模型无法解决真实世界所需的时空认知问题 [24][25][26] - 世界模型旨在建立时空认知能力,学习物理规律和时空理解,以解决长时序决策问题,这是语言模型无法做到的 [26][27] - 蔚来于2023年决定All in世界模型,并于2024年7月首次公开发布,成为行业内率先拥抱此路线的公司之一,世界模型能支持长达10秒、1分钟甚至更长的时序推演,替代传统的规则代码(if else)处理长时序场景 [27][28][29][30]
英伟达能再次撑起美股脊梁骨吗?
虎嗅APP· 2025-11-20 18:18
核心观点 - 英伟达2026财年第三季度业绩全面超预期,总收入达570亿美元,超出市场预期的551亿美元,主要受数据中心业务中Blackwell芯片量产上量的带动 [5] - 公司对下季度给出强劲指引,预期收入650亿美元,超出市场预期的616亿美元,毛利率预期74.8%亦高于市场预期的74.4%,增长动力仍来自Blackwell产品周期 [7] - 尽管短期业绩亮眼,但市场更关心中长期问题,包括ASIC竞争及客户自研芯片的影响、2026年后的毛利率预期以及下游客户AI资本开支的持续性 [10][22] 核心经营指标 - 2026财年第三季度总收入570亿美元,环比增长103亿美元,超出市场预期551亿美元 [5] - 毛利率(GAAP)为73.4%,环比提升1个百分点,符合市场预期,主要得益于Blackwell产能爬坡 [5] - 核心经营利润360亿美元,同比增长65%,核心经营利润率回升至63% [7] 数据中心业务 - 本季度数据中心收入512亿美元,环比增长100亿美元,主要由Blackwell芯片交付上量驱动 [5] - 细分来看,计算收入430亿美元,网络业务收入82亿美元;计算收入环比增长92亿美元,是公司收入增长的最大增量 [6] - Blackwell Ultra架构已成为覆盖所有客户类别的主导架构,H20产品本季度销售额占比极低 [5] 游戏业务 - 本季度游戏业务收入42.6亿美元,同比增长30%,受益于下游对RTX50等产品的需求推动 [6] - 相比于AMD单季约13亿美元的游戏业务收入,英伟达在游戏显卡市场仍具有明显优势 [6] 下季度业绩指引 - 公司预期2026财年第四季度收入650亿美元,环比增长90亿美元,好于市场预期616亿美元 [7] - 下季度毛利率(GAAP)指引为74.8%,环比提升1.4个百分点,好于市场预期74.4% [7] - 业绩继续提升受GB系列量产爬坡推动 [7] 市场竞争与行业动态 - 云服务大厂(谷歌、Meta、微软、亚马逊)是公司AI芯片主要购买方,预计四大核心云厂商2026年资本开支有望提升至5900亿美元,同比增长42% [14] - 英伟达在AI芯片市场占据七成以上份额,但谷歌、Meta、微软、亚马逊及Open AI均已开始自研AI芯片,特别是在推理阶段,定制ASIC芯片与英伟达GPU性价比差距缩小 [17][19] - "谷歌Gemini+博通"构建的阵营可能对英伟达市场份额及毛利率构成威胁,市场担心毛利率在明年下半年及之后出现下滑 [19][41] 产品路线图与技术进展 - 英伟达计划在2026年下半年推出Rubin和CPX产品,采用台积电3nm工艺;2027年将继续推出Rubin Ultra产品 [20] - 公司此前在GTC大会披露,预计Blackwell+Rubin至2026年底累计出货达到2000万颗,对应约5000亿美元收入,超出当时市场预期约30% [9][12] 财务表现与运营效率 - 本季度核心经营利润率63.2%,提升主要受毛利率回升及经营费用率下降影响 [45] - 研发费用率降至8.3%,销售及行政费用占比降至2%,规模效应显著 [45][46] - 公司预期下季度经营费用率将继续下滑至10.3% [46]
不靠中国市场,英伟达也能赚大钱?
36氪· 2025-08-28 20:11
核心观点 - 英伟达二季度业绩表现强劲,总营收467亿美元同比增长56%,净利润264.2亿美元同比增长59%,均超预期[2] - 中国市场在数据中心营收占比降至低个位数,但公司认为其长期潜力巨大,预计年增长50%[2][3][8] - 公司通过H20芯片部分抵消对华销售限制影响,并寻求Blackwell架构芯片对华销售许可[6][7][10] - 汽车与机器人业务同比增长69%,但面临中国车企自研芯片的竞争压力[11][13] - 公司驳斥AI泡沫论,预测全球AI基础设施市场达3-4万亿美元,并强调其基础设施供应商定位[20][21][23] 财务表现 - 总营收467亿美元,同比增长56%,环比增长6%[2][4] - 净利润264.2亿美元,同比增长59%[2] - 三季度营收指引540亿美元(不含H20对华销售)[2] - 数据中心营收411亿美元,同比增长56%,环比增长5%[5] - 游戏与AI PC营收42.87亿美元,同比增长49%,环比增长14%[5] - 专业可视化营收6.01亿美元,同比增长32%,环比增长18%[5] - 汽车与机器人营收5.86亿美元,同比增长69%,环比增长3%[5][11] 中国市场影响 - 本季度未向中国客户销售H20产品[1] - 中国市场在数据中心营收占比环比降至低个位数[2][6] - H20对非中国客户销售6.5亿美元,抵消部分损失(原预计损失80亿美元)[7] - 公司评估中国AI市场规模约500亿美元,年增长率50%[3][8] - 已通过上交15%销售额获对华销售H20许可,但本季度营收规模未定[8] - 正寻求Blackwell架构芯片(如阉割版B30A)对华销售许可[10] 产品与技术进展 - Blackwell架构芯片二季度营收环比增长17%[8] - 推出Thor SoC芯片,获中国车企理想、极氪等采用[11][13] - 公司转型AI基础设施供应商,提供多芯片组合及超级计算解决方案[21][23] - 强调通用芯片优势:跨平台兼容、统一编程模型、复杂系统整合能力[21] 业务板块分析 - 数据中心业务受对华销售限制影响,但通过其他市场弥补[6][7] - 汽车业务增长由自动驾驶解决方案驱动,但面临中国车企自研芯片竞争(如蔚来、小鹏、理想)[11][13] - 机器人业务获各行业领军企业采用,算力需求呈指数级增长[13] 行业前景与竞争 - 全球AI基础设施市场预计3-4万亿美元,公司目标占比35%[20][21][23] - 云服务提供商资本支出达6000亿美元[20] - 公司驳斥AI泡沫论,强调推理型智能体AI算力需求达聊天机器人100-1000倍[20] - 承认ASIC芯片研发挑战,但强调自身平台技术壁垒[21] - 中国车企采用地平线、华为等替代芯片,冲击英伟达汽车芯片领先地位[13]
英伟达的首批机器人“新大脑”到货了
第一财经· 2025-08-26 21:43
英伟达Jetson Thor芯片发布 - 英伟达发布机器人计算平台Jetson Thor 基于Blackwell架构 在FP4精度下提供2070 TFLOPS峰值算力 比上一代Orin芯片算力提升7.5倍 能效提升3.5倍 [3][4] - 芯片以开发者套件形式发售 售价为3499美元 全球首批到货包括北京灵初智能的机器人Psi V1 [3] 芯片性能突破对机器人行业的影响 - 算力和数据处理能力突破使机器人能直接在端侧运行大规模高性能模型 完成更通用和复杂的任务 [3] - 数据处理能力和接口带宽提升使机器人能直接承接高分辨率 高频率传感器的多模态输入并及时处理 [5] - 更多依赖云端处理的任务可能被拉回机器人本地完成 推动机器人在高节拍 复杂交互等场景加速落地 [5] 机器人行业当前技术架构 - 行业普遍采用云端+端侧混合部署模式 快系统部署在端侧负责执行和即时反应 慢系统部署在云端承担理解推理任务 [4] - 云端部署存在延迟问题 影响高节拍场景如连续抓取 快速判断的安全性和可行性 [4] 英伟达的行业战略布局 - 通过Isaac Cosmos GR00T等全栈软件塑造开发者习惯 抢先搭建基础设施并在行业爆发前影响行业标准 [5] - 延续AIGC爆发前夜的逻辑 先堆出算力天花板再建立生态 [5] 中国厂商的竞争机会 - 机器人应用碎片化特点带来差异化机会 中国厂商可在低功耗芯片 细分场景或开源生态形成优势 [5] - 国产芯片具更高性价比和更贴近市场的定制化服务 在场景优化上有差异化优势 [7] - 地瓜机器人发布RDK S100开发套件 采用大小脑异构架构设计 兼顾推理和实时运动控制 [5] - 黑芝麻智能为武汉大学天问人形机器人提供华山A2000和武当C1236芯片 分别用于大脑和小脑 [6] - 瑞芯微推出旗舰芯片RK3588 支持多模态数据处理和高性能计算 为机器人感知决策执行提供底层算力支持 [6]
英伟达机器人“新大脑”售价2.5万元,算力提升7.5倍
南方都市报· 2025-08-26 09:19
产品发布与性能参数 - 英伟达正式发售Thor芯片开发者套件 售价3499美元约合2.5万元人民币 该芯片旨在支撑具身智能机器人与物理世界实时交互 [1] - Thor芯片基于Blackwell架构GPU 在FP4精度下提供2070 TFLOPS峰值算力 较上一代Orin芯片275 TOPS提升7.5倍 [1] - 芯片能效提升3.5倍 CPU性能提升3.1倍 内存容量128GB提升2倍 可并行处理多传感器数据并实现低延迟AI处理 [1] 技术应用与生态建设 - 芯片性能提升使机器人能处理大量传感器数据 在边缘侧实时运行AI模型 减少对云端算力依赖 [3] - 该芯片为人形机器人、农业机器人、手术辅助机器人等物理AI应用提供关键实时推理能力 [3] - 波士顿动力、Figure AI及优必选、宇树科技等国内外机器人厂商已率先部署Thor芯片 [3] - 英伟达机器人技术生态已覆盖超200万开发者 涉及制造业、农业、医疗健康等众多行业 [4] 业务表现与战略定位 - 机器人与汽车业务合并收入为5.67亿美元 在英伟达整体营收占比约1.29% 但同比增长72% [5] - 公司通过提供机器人计算芯片硬件及Isaac GR00T、Isaac Sim等软件平台 持续强化在机器人领域的技术生态布局 [3]
黄仁勋对天发誓,央视拆机打脸:信老板嘴硬,还是信央视显微镜?
新浪财经· 2025-08-21 01:27
英伟达H20芯片事件 - 英伟达CEO黄仁勋面临向中国证明H20芯片无美国政府后门的挑战[1] - H20芯片性能仅为旗舰产品H100的20%,专为中国市场定制[4][6] - 中国市场贡献英伟达全球收入的22%,达171亿美元,增速66%[6] 技术争议与监管行动 - 中国国家网信办约谈英伟达,质疑H20芯片存在"追踪定位"和"远程关闭"功能,要求48小时内自证清白[6] - 技术专家推测后门可能通过硬件(电源管理模块隐形开关)或软件(CUDA生态系统隐蔽指令)实现[8][9] - 美国《芯片安全法案》要求受管制芯片内置"位置验证"和"远程关闭"功能[9] 公司应对与政治博弈 - 英伟达声明否认H20存在后门或终止开关[11] - 黄仁勋口头承诺芯片安全但未提供硬件架构证据或代码审计[13] - 英伟达陷入两难:公开设计文档可能违反美国《出口管理条例》,不公开则无法消除中国疑虑[15] - 黄仁勋与白宫达成协议:承诺在美追加500亿美元投资和3000个岗位,换取H20出口许可[17] 市场反应与行业影响 - 百度、商汤、讯飞等暂停H20采购,测试项目叫停[18] - 百度迁移部分算力至华为昇腾910B,讯飞转向寒武纪合作[19] - 华为开源神经网络架构CANN,挑战英伟达CUDA生态[19] - 英伟达在华营收暴跌42%,华为昇腾订单量增长300%[19] - 国产芯片在AI算力中心采购占比从5%(2022年)升至40%(2025年),英伟达中国市场份额从95%降至50%[21] - 车企如广汽替换英伟达Orin芯片为地平线等国产方案,成本降40%[21]
全球第一企业的能力盲区?
自动驾驶之心· 2025-07-23 17:56
英伟达汽车业务现状 - 英伟达市值达4万亿美元成为全球第一,CEO黄仁勋访华并积极拉拢中国车企[5] - 汽车业务仅占英伟达1305亿美元总收入的不到2%,2026年自动驾驶业务目标收入50亿美元[7][11] - 华为智能车BU去年软硬件综合营收264亿元,相当于英伟达10天收入[12] 车企合作与替代趋势 - 通用汽车评测英伟达辅助驾驶方案后内部评价"very scary",合作蒙上阴影[7][8] - 奔驰测试显示英伟达辅助驾驶效果不如中国公司Momenta,已将部分车型业务转给Momenta[9][10][11] - 捷豹路虎也在寻找替代供应商,英伟达员工在中国基本不对接车企项目[11] 芯片延期与客户流失 - 英伟达Thor芯片多次延期,理想汽车改款车型因此推迟导致约60亿元销售损失[18][19] - Thor芯片存在设计缺陷,算力从宣传的700TOPS缩水至不足500TOPS[21] - 小鹏汽车放弃Thor平台开发,转向自研图灵芯片并已上车交付[20] 车企自研芯片进展 - 蔚来、小鹏、理想自研芯片成本各约3-4亿美元,蔚来芯片可帮助单车降本1万元[25][32][35] - 小鹏图灵芯片集成双ISP提升感知能力,理想加快自研芯片进度提前至明年一季度[22][35] - 比亚迪、小米、理想等都将推出自研汽车芯片,未来英伟达芯片可能仅用于海外车型[24] 技术路线与行业趋势 - 英伟达将汽车和机器人部门合并,视汽车为"无手机器人"的具身智能落地场景[13] - 特斯拉FSD下一代芯片AI5算力达2000-2500TOPS,参数量将扩大4.5倍[36] - 高通汽车业务营收占比从1.2%增长至近10%,新技术加速应用于汽车芯片[54] 英伟达面临挑战 - Thor芯片采用消费级N4P制程而非车规级工艺,交付受台积电产能优先级影响[41][43][44] - 英伟达企业文化导致交付节奏慢,资源配置不足,黄仁勋很少过问汽车业务[48][49] - 自动驾驶软件领域被Momenta等中国公司超越,团队决策权集中在美国[51][52]
市值第一英伟达,被中国汽车浇冷水|深氪
36氪· 2025-07-22 18:21
英伟达汽车业务现状 - 英伟达市值达4万亿美元成为全球第一 但汽车业务收入占比不足2% [5][11][58] - 通用汽车和奔驰对英伟达辅助驾驶方案评价负面 奔驰中国区业务已转给Momenta [5][7][9][11] - 英伟达Thor芯片多次延期交付 理想汽车因此损失约60亿元销售收入 [22][24][26] 车企自研芯片进展 - 蔚小理自研芯片投入均达3-4亿美元 蔚来团队规模达600人 [33][42][44] - 小鹏图灵芯片已上车G7 理想自研芯片提前至2024Q1交付 [25][29][46] - 自研芯片可降低单车成本1万元 并实现算法芯片深度协同 [45][46][47] 技术路线与行业趋势 - 汽车被视为具身智能最先落地场景 自动驾驶进展决定行业成败 [14][15][17] - 特斯拉FSD下一代芯片算力达2000-2500TOPS 参数规模扩大4.5倍 [48] - 台积电车规级4nm工艺2025年才量产 制约英伟达Thor交付 [53][55][56] 中国市场格局变化 - 华为/地平线/Momenta等本土企业抢占市场 英伟达中国团队决策权有限 [19][65][68] - 比亚迪/小米/理想等均将推出自研芯片 长期或仅海外车型采用英伟达 [30][49] - 中国辅助驾驶公司响应速度远超英伟达 Momenta交付周期仅3个月 [64][66] 英伟达战略困境 - 汽车业务优先级低 黄仁勋极少过问 资源配置不足 [58][60][61] - 企业文化缺乏危机感 美国团队主导决策 与中国车企需求脱节 [65][67] - 消费级芯片开发模式不适应车规要求 技术缺陷需车企自行兜底 [26][55][60]
赛道Hyper | 英特尔出售Mobileye股份:肌腠影响几何?
华尔街见闻· 2025-07-11 11:00
英特尔出售Mobileye股份交易概况 - 英特尔计划出售4500万股Mobileye股票,价值9亿美元,同时Mobileye将回购1亿美元股票,交易总收益可能达10亿美元 [1] - 交易完成后英特尔在Mobileye的持股比例将降至不足80% [1] - Mobileye当前市值约135亿美元(截至7月10日收盘),较2022年IPO发行价每股21美元表现不佳,年初以来回报率为-7% [5] 英特尔战略调整背景 - 公司面临AMD、苹果和英伟达等竞争对手压力,前任CEO激进转型战略导致财务不堪重负 [2] - 新任CEO陈立武调整战略,聚焦财务健康与资源高效配置,系统梳理非核心资产 [2][3] - Mobileye 2024年二季度下调全年营收预期至16-16.8亿美元(原预期18.3-19.6亿美元),调整后营业利润预期降至1.52-2.01亿美元(原2.7-3.6亿美元) [3] 交易战略意义 - 资金将用于改善现金流,并投向数据中心芯片、人工智能芯片等核心战略领域 [3] - 部分资金可能用于先进制程研发和工厂建设,以缩小与台积电、三星的技术差距 [4][5] - 体现公司从"垂直整合"转向"水平协作"的战略转变,回归芯片制造核心能力 [8] Mobileye业务现状与挑战 - 专注ADAS和自动驾驶解决方案,客户包括宝马、奥迪、大众等主流车企 [5] - 面临"视觉主导+封闭生态"技术路线的系统性挑战,行业转向多传感器融合方案 [6] - 封闭生态模式受到特斯拉自研路线、英伟达开放平台等替代方案的冲击 [6][7] - EyeQ Ultra芯片176TOPS算力落后于英伟达Orin芯片的254TOPS+ [7] 行业趋势影响 - 汽车行业软件和服务收入占比将显著提升,预计2030年达50%以上,2025年全球规模2500亿美元 [8] - 车企加速"去Mobileye化",大众、日产等客户已减少订单,采用多供应商策略 [10] - 中国本土供应商崛起,如地平线征程6芯片进入比亚迪、理想供应链 [11] - 行业呈现三大变化:中小玩家生存空间挤压、跨界融合加速、地域化技术标准分化 [12] 交易深层影响 - 反映自动驾驶行业资本逻辑从"规模为王"转向"精益投资" [9] - 车企通过自研、合资等方式夺回产业链主导权,案例包括大众与地平线合资、宝马与高通绑定等 [10] - 可能加速全球产业链从"欧美技术输出"向"多极协同"转变 [11] - 预示行业将进入洗牌阶段,技术路线和商业模式面临重构 [12][13]