Workflow
ORION
icon
搜索文档
小鹏刚刚发布了VLA 2.0,但去掉了语言转译......
自动驾驶之心· 2025-11-06 08:04
小鹏VLA技术进展 - 小鹏发布VLA 2.0,采用两套方案并行研发:传统V→L→A路径和新型V/L→A路径,后者与特斯拉ICCV分享的技术思路类似,语言输入与视觉输入并行而非作为中间件[2][3][6] - V/L→A方案去除了语言转译环节,但仍以视觉为核心,是世界首个量产物理世界大模型,最高有效算力达2250 TOPS[6] - 技术框架参考开源算法如ORION,可同步输出感知结果、自车轨迹及思维链,世界模型参与未来场景预测[5] - 公司计划入局Robotaxi领域,配置四颗图灵AI芯片,算力提升至3000 TOPS[8] 自动驾驶技术趋势与行业动态 - 行业正加速解析特斯拉公开的新技术信息,VLA与V/LA被视为L3技术突破的关键路径,世界模型与VLA的路线竞争尚未定论[10] - 业内技术思路趋同,重点在于工程优化效果,例如ORION框架通过潜在标记与世界仿真器交互实现强化学习[5] 自动驾驶社区资源与生态 - 自动驾驶之心知识星球社区规模超4000人,覆盖近40项技术方向,包括VLA、BEV感知、世界模型等,目标两年内扩至近万人[14][20][31] - 社区整合超60个数据集、40个开源项目及仿真平台,提供技术路线图、求职内推与行业大佬直播,如小米汽车云端大模型算法工程师岗位内推[17][23][26][31] - 学习资源涵盖全栈课程、7大福利视频教程及超100场专业直播,内容涉及端到端自动驾驶、3DGS闭环仿真等热门领域[23][31][95][98]
Badger Meter (BMI) is a Top-Ranked Growth Stock: Should You Buy?
ZACKS· 2025-10-28 22:46
Zacks研究服务与工具 - Zacks Premium研究服务提供包括Zacks Rank、Zacks Industry Rank每日更新、Zacks 1 Rank List完全访问权、股票研究报告和高级选股屏幕在内的多种工具,旨在帮助投资者更智能、更自信地进行投资 [1] - 该服务还包含Zacks Style Scores,作为辅助指标,与Zacks Rank共同帮助投资者挑选在未来30天最有可能跑赢市场的股票 [1][2] Zacks Style Scores详解 - Zacks Style Scores根据价值、增长和动量特征对股票进行评级,等级从A到F,A为最佳,旨在识别具有最高成功概率的股票 [3][9] - 价值风格评分通过考察市盈率(P/E)、市盈增长比率(PEG)、价格销售比(Price/Sales)、价格现金流比(Price/Cash Flow)等一系列估值比率,来发现价格低于其真实价值的具有吸引力的股票 [3] - 增长风格评分分析预测及历史盈利、销售额和现金流等特征,以寻找能实现可持续增长的股票,关注公司未来前景和整体财务健康状况 [4] - 动量风格评分利用如一周价格变动和盈利预测的月度百分比变化等因素,识别处于有利价格或盈利趋势中的高动量股票 [5] - VGM评分是价值、增长和动量风格评分的综合,用于筛选同时具备最有吸引力估值、最佳增长前景和最强劲动量的公司 [6] Zacks Rank与Style Scores的协同使用 - Zacks Rank是一种利用盈利预测修正来帮助投资者构建成功投资组合的专有股票评级模型,其1(强力买入)评级股票自1988年以来实现了年均+23.93%的回报,表现超过标普500指数一倍以上 [7] - 在任何给定交易日,有超过200家公司被评为1(强力买入),另有约600家公司被评为2(买入),总计超过800只顶级评级股票 [8] - 为实现最佳回报,建议重点考虑同时具备Zacks Rank 1或2评级以及Style Scores为A或B的股票,这能提供最高的成功概率 [9][10] - 对于3(持有)评级的股票,其Style Scores也应为A或B以确保尽可能大的上行潜力,而4(卖出)或5(强力卖出)评级的股票即使有A或B的Style Scores,其盈利预测也处于下行趋势,股价下跌风险较大 [10] 公司案例:Badger Meter (BMI) - Badger Meter是一家成立于1905年的领先水解决方案提供商,总部位于威斯康星州密尔沃基,产品用于测量水、油、化学品及其他流体的流量、质量和其他系统参数,以精确性和耐用性著称 [11] - 该公司的BEACON云托管软件套件允许终端用户查看和管理其用水活动,其ORION系列无线电端点产品提供无需基础设施的AMI解决方案 [11] - BMI当前获得Zacks Rank 2(买入)评级,VGM风格评分为B [12] - 该公司是增长投资者的潜在首选,其增长风格评分为B,预计当前财年每股收益将实现13.5%的同比增长 [12] - 对于2025财年,过去60天内四位分析师上调了其盈利预测,Zacks共识预期上调0.08美元至每股4.80美元,该公司平均盈利意外为+6.8% [12] - 凭借坚实的Zacks Rank评级以及顶尖的增长和VGM风格评分,BMI应被列入投资者的重点关注名单 [13]
即将开课!自动驾驶VLA全栈学习路线图分享~
自动驾驶之心· 2025-10-16 07:33
自动驾驶VLA行业趋势 - 自动驾驶VLA是学术界和工业界在端到端之后聚焦的核心方向,提供了类人思考能力并通过思维链形式展现决策过程,以实现更可靠和安全的自动驾驶[1] - 行业将自动驾驶VLA划分为三个子领域:模块化VLA、一体化VLA和推理增强VLA[1] - 传统的BEV感知、车道线、Occupancy等方向相对成熟,学术界和工业界关注度逐渐下降,自动驾驶VLA成为各家企业急需攻克的方案[4] - 主流自动驾驶企业,包括智驾方案供应商和车企,均在发力自研自动驾驶VLA[4] 自动驾驶VLA技术核心 - 自动驾驶VLA涉及视觉感知、大语言模型、Action建模、大模型部署、数据集制作等核心内容[6] - 最前沿算法包括CoT、MoE、RAG、强化学习[6] - 模块化VLA强调多阶段pipeline(感知→语言→规划→控制),语言模型为规划决策提供信息[16] - 一体化VLA直接连接动作解码器,实现感知→控制的端到端映射,通过单次前向传播将传感器输入映射为控制动作[16] - 推理增强VLA新增推理模块(如Chain-of-Thought、记忆体、工具调用),同步输出控制信号和自然语言解释,支持长时序规划和因果解释[17] 课程内容与结构 - 课程第一章介绍VLA算法概念、发展历史、开源BenchMark和常见评测指标[12][13] - 第二章讲解VLA算法基础,涵盖Vision、Language、Action三个模块基础知识及大模型结合,并以Qwen 2.5VL-72为例讲解开源大模型部署[14] - 第三章讲解VLM作为自动驾驶解释器的经典及最新算法,包括DriveGPT4、TS-VLM、DynRsl-VLM、SENNA,重点分析算法动机、网络结构和核心[15] - 第四章聚焦模块化与一体化VLA,配套实战代码学习选取华科和小米最新提出的ReCogDrive,涵盖预训练、模仿学习、强化学习GRPO、扩散模型轨迹输出等技术栈[16] - 第五章聚焦推理增强VLA,讲解ORION、OpenDriveVLA、DriveMoE、DiffVLA、S4-Driver、FutureSightDrive、AutoVLA、Drive-R1等算法,并配套清华AIR和博世提出的Impromptu VLA实战代码[17][18][19][23] - 第六章设置大作业,要求学员基于ms-swift框架自定义数据集和加载模型,进行训练任务微调,并提供V-L-A各部分代码解读[20] 行业人才培养 - 课程由清华大学教研团队联合开展,旨在推动自动驾驶VLA在学术界和工业界的发展[6][22] - 讲师团队包括在ICCV/IROS/EMNLP/Nature Communications等顶级会议发表论文的清华大学硕士生、QS30高校博士在读研究员,具备丰富的自动驾驶、大模型研发和实战经验[8][9] - 学员需自备GPU,推荐算力在4090及以上,并具备自动驾驶领域基础、transformer大模型、强化学习、BEV感知等技术概念,以及概率论、线性代数、Python和PyTorch基础[24] - 课程为国内首个自动驾驶VLA进阶实战教程,预计两个半月结课,采用离线视频教学配合VIP群内答疑及三次线上答疑的模式[22][23]
清华教研团队!两个月从零搭建一套自己的自动驾驶VLA模型
自动驾驶之心· 2025-09-28 15:21
自动驾驶VLA技术趋势 - 端到端技术后,视觉语言动作模型成为学术界与工业界焦点,其提供类人思考能力并通过思维链形式展现车辆决策过程,从而提升自动驾驶可靠性及安全性[1] - 自动驾驶VLA目前划分为三个主要子领域:模块化VLA、一体化VLA以及推理增强VLA[1] - 主流自动驾驶企业,包括智驾方案供应商与车企,均在积极投入资源进行自动驾驶VLA的自研攻关,反映出行业对该技术方案的迫切需求[4] 核心技术构成与算法前沿 - 自动驾驶VLA的核心技术涵盖视觉感知、大语言模型、动作建模、大模型部署以及数据集制作等多个关键环节[6] - 该领域最前沿的算法包括思维链、混合专家模型、检索增强生成以及强化学习等[6] - 模块化VLA强调多阶段流程,语言模型在规划决策中扮演主动角色,而一体化VLA则实现感知到控制的端到端直接映射,消除模块间延迟[16] - 推理增强VLA的新趋势是引入长思维链推理、记忆和交互模块,其特点是行动与解释并行输出,支持长时序规划与因果解释[17] 行业应用与人才培养 - 为满足行业对VLA人才的迫切需求,设计了系统的学习路线图,包含从原理到实战的完整内容,旨在推动技术发展并助力从业者深入理解VLA[4][6][22] - 课程内容覆盖三大VLA子领域的前沿算法,并配备实战项目与大作业,重点培养学员复现主流算法及自主设计VLA模型的能力,适用于科研与工程落地[6][16][20][26] - 学习要求学员自备高性能GPU,并具备自动驾驶基础、Transformer大模型、强化学习等相关技术知识,目标使学员在实习、校招及社招中受益[26]
论文解读之港科PLUTO:首次超越Rule-Based的规划器!
自动驾驶之心· 2025-09-16 07:33
PLUTO模型技术架构 - 采用典型的两段式网络架构作为端到端自动驾驶的Planner模型 [1] - 不基于BEV特征图进行下游控制任务,而是直接对感知输出的结构化信息(如边界框、车道线等)进行编码 [1] - 将编码后的结构化信息作为序列标记输入到解码器中 [1] - 二段式端到端架构非常适合新人入门练手 [1] PLUTO模型训练机制 - 包含三个主要损失函数,主任务损失由回归损失和分类损失共同组成模仿学习损失 [7] - Agent轨迹预测损失有专门设计 [7] - 添加了多个辅助损失以帮助模型收敛 [9] 端到端自动驾驶技术发展趋势 - 端到端自动驾驶已发展出多个技术方向,需要掌握多模态大模型、BEV感知、强化学习、视觉Transformer、扩散模型等知识 [13] - 技术发展迅速,去年的技术方案已不适合当前环境 [13] - VLA(视觉语言动作)范式是当前端到端自动驾驶的皇冠,上限高但难度大,行业招聘需求旺盛 [29] - 基于扩散模型输出多模轨迹成为学术界和工业界追捧的热点,多家公司尝试落地 [26] 课程内容体系 - 第一章介绍端到端算法发展历史,涵盖从模块化方法到端到端的演变,分析一段式、二段式和VLA范式的优缺点 [20] - 第二章重点讲解端到端涉及的背景知识,包括大语言模型、扩散模型、强化学习、BEV感知等,这些是未来两年求职面试频率最高的技术关键词 [20][21][27] - 第三章聚焦二段式端到端,分析经典算法PLUTO、CVPR'25的CarPlanner和最新工作Plan-R1 [21] - 第四章涵盖一段式端到端与VLA,包括基于感知的方法(UniAD、VAD、PARA-Drive)、基于世界模型的方法(Drive-OccWorld、OccLLaMA)、基于扩散模型的方法(DiffusionDrive、Diffusion Planner、DiffE2E)和基于VLA的方法(ORION、OpenDriveVLA、ReCogDrive) [22][24][26][29] - 第五章设置RLHF微调大作业,提供预训练模块和强化学习模块的搭建实践 [31] 课程特色与目标 - 基于Just-in-Time Learning理念,通过通俗易懂的语言和案例帮助学员快速掌握核心技术栈 [15] - 帮助学员构建领域框架,梳理端到端自动驾驶研究发展脉络,形成自己的研究体系 [16] - 理论结合实践,配备实战环节完成从理论到实践的完整闭环 [17] - 学完课程能够达到1年左右端到端自动驾驶算法工程师水平,掌握端到端技术框架和关键技术 [36] - 可复现扩散模型、VLA等主流算法框架,将所学应用到实际项目中 [37]
闭环端到端暴涨20%!华科&小米打造开源框架ORION
自动驾驶之心· 2025-08-31 00:03
核心观点 - 端到端自动驾驶框架ORION通过视觉语言指令指导轨迹生成 解决了现有方法在语义推理空间与数值轨迹动作空间之间的鸿沟问题 在闭环评测中表现卓越 [3][5][16] 技术架构 - 引入QT-Former模块聚合长期历史上下文信息 减少计算开销并增强对静态交通元素和动态物体运动状态的捕捉能力 [3][20] - 利用视觉语言大模型(VLM)进行驾驶场景多维度分析 包括场景描述 关键物体行为分析和动作推理 并生成规划token指导轨迹预测 [3][21] - 通过生成模型(VAE或扩散模型)将VLM推理空间与轨迹动作空间对齐 实现视觉问答和规划任务的端到端统一优化 [3][22] 性能表现 - 在Bench2Drive闭环测试中驾驶得分达77.74分 成功率54.62% 较之前SOTA方法提升14.28分和19.61个百分点 [5][24] - 在多能力评估中超车场景成功率71.11% 紧急刹车78.33% 交通标志识别69.15% 平均能力值54.72%领先其他方法16.12个百分点 [26][27] - 效率指标151.48 舒适度17.38 平均L2误差0.68 在开环指标中保持竞争力 [25] 创新贡献 - 首次实现VLM与生成模型结合 弥补语义推理与数值动作空间差距 [16] - 支持多种生成模型兼容 展现框架灵活性和可扩展性 [16] - 提供端到端联合优化方案 突破传统方法在因果推理和时序建模方面的限制 [3][30] 应用案例 - 成功识别自行车骑行者并执行向左变道避撞操作 [7] - 准确识别停车标志并完成停车-等待-重启通过十字路口系列动作 [9] - 对右前方车辆先减速后变道的分层决策演示 [14]
THEON announces new strategic US and European investments and partnerships to build global leadership in Digital and Augmented Reality defense optronics domain under the THEON NEXT initiative
GlobeNewswire News Room· 2025-08-12 07:12
文章核心观点 - THEON国际公司宣布启动THEON NEXT计划 通过四项战略投资与合作建立下一代士兵系统开发平台 重点布局数字和增强现实解决方案领域 强化公司在单兵光电系统的全球领导地位 [1][2][3] 战略投资与合作协议 - 向Kopin公司投资1500万美元 包括700万美元可转换贷款(转换股价区间3-4.5美元)和800万美元资本注入获得其苏格兰子公司49%股权 共同成立欧洲合资企业负责AR系统和微LED显示器的非美地区生产分销 [3] - 与eMagin签订可续签的两年最低供应协议 该公司为军用航空、夜视和AR/VR应用提供高分辨率OLED微显示器 是公司A.R.M.E.D产品线主要显示器供应商 [7] - 与ALEREON达成战略合作 集成其超宽带无线通信技术至A.R.M.E.D产品线 在希腊生产并作为其在欧洲和中东地区主要合作伙伴推广该技术 [8] - 向芬兰Varjo公司投资500万欧元可转换贷款 另享有同等条件追加500万欧元投资期权 共同开发军用级VR/MR训练模拟技术 [9] 技术发展重点 - 增强与虚拟现实软件作为下一代士兵系统基础 实现沉浸式态势感知和实时数字叠加 [5] - 微显示器技术聚焦欧美微LED技术开发 用于视觉增强系统 [5] - 近距无线连接技术实现装备无缝集成与实时数据传输 [5] 运营布局 - THEON美国子公司将工业及产品开发业务转移至Kopin弗吉尼亚州雷斯顿工厂 该基地将成为公司AR及数字光电产品美国制造中心 [4] - 未来五年在美国投入800万美元支持与Kopin的合作运营 [4] - 合作网络覆盖美国、英国、芬兰、希腊 并计划扩展至德国和比利时欧盟热成像/数字中心 [10] 财务影响 - 当前投资总额2500万欧元 预计2-5年内通过产品功能增强、价格定位优化及合作企业增长快速收回投资 [10] - 可转换贷款机制允许将开发资金转换为股权 可能对未来财务业绩产生积极影响 [10] 行业合作意义 - 合作体现欧美防务技术跨大西洋合作趋势 通过整合Kopin微显示器、eMagin OLED、ALEREON无线通信及Varjo VR/MR技术 构建互联AR士兵系统技术框架 [2][8][9][11] - 合作伙伴确认技术协同效应:Kopin强调微显示器与光电系统整合、eMagin注重图像质量提升、ALEREON认可国际业务网络、Varjo看重国防领域经验 [11]
自动驾驶端到端VLA落地,算法如何设计?
自动驾驶之心· 2025-06-22 22:09
自动驾驶VLA模型研究进展 - 端到端自动驾驶已成为主流范式 视觉-语言-动作(VLA)方法伴随具身智能兴起 相关论文横扫前沿领域 [2] - 主机厂如理想 文远知行 小米 小鹏等都在大力尝试VLA技术量产落地 [2] - 学术界和工业界涌现AutoVLA ReCogDrive等优秀工作 关注自适应推理 强化微调等方向 [3][7][9] 关键技术突破 - AutoVLA统一推理和动作生成 采用双重思维模式(快速/慢速思维)和GRPO强化微调方法 [3][4] - ReCogDrive采用三阶段训练框架 集成VLM与扩散规划器 PDMS达89.6创SOTA [7][9] - DriveMoE引入混合专家架构 包含场景专用视觉MoE和技能专用动作MoE 处理罕见驾驶行为 [19][21][22] - OpenDriveVLA通过分层视觉语言对齐和代理-环境-自我交互过程 实现轨迹规划SOTA [28][30][32] 数据集与基准 - Impromptu VLA数据集含8万+视频片段 覆盖4类非结构化场景 显著提升模型性能 [14][18] - DriveAction基准含16185个QA对 直接关联驾驶操作 支持全面评估VLA模型 [23][24] - 行业亟需更多高质量VLA基准 当前工作多基于nuScenes Bench2Drive等有限数据 [47] 行业应用趋势 - VLA模型输出形式向多模轨迹生成发展 文本输出逐渐被替代 [47] - 大规模自动驾驶预训练模型仍欠缺 多数工作依赖Qwen等开源模型 [47] - 时序处理能力待加强 需适配车端实时性要求 [47] - 小米 博世 清华等机构积极布局VLA研发 形成产学研协同 [7][14][19][28] 性能对比 - AutoVLA在nuPlan等基准上PDMS达92.12 碰撞率低于1% [5] - ReCogDrive在NAVSIM基准PDMS达89.6 超越前SOTA 5.6分 [9][10] - DriveMoE在Bench2Drive紧急刹车等场景能力提升显著 均值达47.91% [22] - OpenDriveVLA-7B在nuScenes开环规划L2误差仅0.66m 优于GPT-3.5等基线 [31]