Workflow
自动驾驶
icon
搜索文档
信银国际:美国减息及美元转弱支撑后市 料恒指今年目标29500点
智通财经· 2026-01-05 16:47
港股市场整体展望 - 港股2026年首个交易日急升逾700点,取得开门红[1] - 对2026年股市持乐观态度,预计两大因素可提振大市[1] - 由于内地重要会议集中在3月及4月,且美联储下任主席人选未定,市况仍需观察[1] - 若美国减息预期增加且美元转弱,将对港股有利[1] - 预计恒生指数2026年目标为29500点[1] 人工智能(AI)产业链投资机会 - 内地人工智能产业链广泛,涵盖多个范畴[1] - 2026年为“十五五”规划开局年,内地可能在创新发展方面增加对AI相关开支[1] - 中美在AI领域的竞争,将带动新能源和自动驾驶等行业发展[1] - 云计算等AI应用层面亦可受惠[1] - 建议可逢低吸纳AI行业龙头股[1] 高息股投资前景 - 对高息股前景看俏[1] - 传统高息股包括中资电讯股、内银股、内险股及能源股[1] - 必需消费品股份在估值回落后,若息率达到3%以上,也具备博弈空间[1]
78ms的VLA推理!浪潮信息开源自驾加速计算框架,大幅降低推理时延
自动驾驶之心· 2026-01-05 11:33
行业趋势:VLA大模型成为高阶自动驾驶关键方向 - 随着高阶自动驾驶迈向“端到端”阶段,VLA(视觉-语言-动作)大模型正成为自动驾驶的最佳模型方案,它通过统一建模视觉感知、语义理解与逻辑决策,使系统具备类似人类的语义理解与推理能力,是突破自动驾驶“长尾场景”挑战的关键 [2] - 然而,VLA大模型参数规模已增长至数十亿甚至百亿级,多模态数据在异构算力间流转处理时,模型延时普遍超过100ms,难以满足实时性需求,亟需软硬件系统优化来解决车载端异构计算协同问题 [2][5] 技术挑战:VLA大模型车端部署面临三大瓶颈 - **计算挑战**:模型参数从千万级跃迁至数十亿甚至百亿级,对算力、存储带宽与系统协同效率提出空前挑战;其推理过程呈现多阶段强依赖特征,时延呈串行累积;Transformer架构的自注意力计算复杂度随序列长度指数增长,且自回归生成导致动作指令必须串行产出,限制了硬件并行度;数十亿级参数量导致芯片频繁访存,受限于端侧内存带宽,计算单元常因“等数据”而空转 [5][6] - **通信挑战**:与传统模块化系统相比,VLA大模型对数据通信的压力呈指数级增长,多模态特征、高清图像及中间张量频繁在不同计算单元间流转;端到端闭环对时延极为敏感,传统基于中间件的通信机制(如多次拷贝、序列化与协议栈开销)成为制约实时性的核心瓶颈 [6] - **调度挑战**:VLA大模型的执行过程具有明显的异构性与阶段性特征,不同子任务在实时性、计算量与优先级上差异显著;传统以线程或进程为粒度的粗放式调度方式,难以应对多任务并发、强优先级约束与异构算力协同的需求,容易导致关键任务阻塞、算力资源空转或端到端时延不可预测 [7] 解决方案:AutoDRRT 3.0计算加速框架 - 浪潮信息研究团队开源了面向VLA大模型的自动驾驶计算加速框架AutoDRRT 3.0,该框架基于其自动驾驶车载计算平台EIS400,通过在计算效率、通信延时、任务调度三大维度的创新重构,旨在解决VLA大模型的上车挑战 [3][8] - 该框架面向2D+CNN小模型、BEV+Transformer大模型、VLA大模型等不同算法进行了针对性的算法内核与架构升级,汽车厂商、软件平台商和中间件软件开发商可免费下载使用 [3] 技术突破一:计算革新实现全闭环加速 - 通过并行解码、视觉剪枝、算子融合与混合量化等技术,对VLA推理链路进行重构,实现了从“视觉输入”到“动作输出”的全闭环加速 [9][12] - **并行解码**:将单步预测演进为“时域序列预测”,在一个推理周期内并行产出未来多步动作指令,消除了逐个Token产出的逻辑依赖,释放了异构硬件的并行计算潜能 [12] - **视觉剪枝**:引入面向自动驾驶场景的视觉剪枝技术,通过衡量特征向量间的余弦距离,在无须模型微调的前提下,实现了对冗余视觉信息的极高比例压缩,解决了传统注意力剪枝可能导致关键感知目标被误剔除的风险 [12] - **算子融合与混合量化**:实施异构精度策略,对视觉Transformer实施INT8 PTQ量化以提升吞吐,对语言内核采用W4A16量化以突破访存带宽瓶颈;同时进行深度算子融合,并将部分高频操作前移至预处理阶段,消除冗余计算 [12] - 通过上述优化,成功将10亿级参数VLA大模型的端到端推理时延从8000ms降低到78ms,其中并行解码模块将时延从2000ms降低至300ms,视觉剪枝模块将时延从170ms降低至130ms,整体性能提升102倍,这是业内首个将VLA大模型端到端推理时延稳定压缩至100ms以内的开源计算加速框架 [13] 技术突破二:通信革新构建高性能机制 - 从底层重构了面向异构计算单元(CPU-CPU、CPU-GPU、GPU-GPU)的统一高性能通信机制,构建了“轻量调度+极速流转”的混合模式 [14][16] - “轻量调度模式”专注于微秒级的逻辑信令通路,用于精细调度与同步唤醒;“极速模式”为大数据提供共享内存,从根本上革除了传统DDS协议中的序列化损耗与冗余拷贝 [16] - 通过地址映射实现CPU与GPU之间的数据直达,在GPU之间构建以共享内存为中枢的高速流转机制,实现了以“地址共享替代数据搬运”的“零拷贝”闭环 [16] - 在1MB至16MB的负载测试中,AutoDRRT 3.0展现出代差优势:在16MB大数据流转时,其时延表现较FastDDS提升了4至5.6倍,较CycloneDDS最高提升近35倍,实现了大数据负载下的微秒级确定性响应 [17] 技术突破三:调度革新实现异构算力统一编排 - 构建了一套面向多计算单元(CPU、GPU、AI加速单元)的异构算力统一调度机制,进行精细化管理,避免算力空转与链路阻塞 [18][20] - 在CPU侧,深度融合优先级与时间片轮转等调度策略,并结合精细化绑核控制,确保逻辑控制与关键任务的实时性 [18] - 在GPU侧,引入“优先级+流水线+全并行”的一体化调度架构:通过模型级优先级管理保障关键任务算力;借助异步流水线调度实现数据处理与模型推理的重叠执行;协同GPU与专用加速单元进行并行执行,最大化整体吞吐 [18][20] - 实测数据显示,该调度框架使逻辑响应时延降低31%,核心感知模型推理时延降低30%,VLA推理链路进一步压缩28%,端到端时延稳定性显著提升,推理时延由108ms缩减至78ms [21] 生态合作与商业化应用 - AutoDRRT已率先实现了对地平线征程6(J6)平台的深度原生支持,打通了底层芯片异构算力到上层通用软件栈的全链路,完成了ROS + Autoware.ai 以及 ROS2 + Autoware.universe 的全栈原生适配,成为行业首个适配该平台的开源自动驾驶框架 [21] - 基于J6域控+AutoDRRT,客户可实现方案的“开箱即用”与快速验证,覆盖无人配送与环卫小车等多元场景,助力无人车产品缩短研发周期,抢占商业化落地先机 [21] - 该框架为业界提供了首个面向VLA大模型、可在智驾域控平台运行的开源加速框架,验证了VLA大模型在车端实时闭环运行的工程可行性,为自动驾驶从“端到端感知”迈向“全场景通用智能”提供了系统基础 [23]
港股异动 小马智行-W(02026)高开逾6% 年底车队将突破千辆 机构看好公司自驾领域占据重要市场份额
金融界· 2026-01-05 10:49
公司股价与市场反应 - 公司股价高开逾6%,截至发稿涨6.29%,报123.4港元,成交额76.51万港元 [1] 商业化进展与财务表现 - 公司在广州实现Robotaxi单车盈利(UE转正),日均单车营收达299元 [1] - 实现盈利的核心支撑来自第七代Robotaxi的技术突破与成本优化 [1] - 公司在去年第三季度在广州实现Robotaxi单车盈利转正,标志着其商业化迎来阶段性里程碑 [1] 车队规模与未来规划 - 公司计划在2025年底将车队规模突破1000辆 [1] - 公司目标在2026年将车队扩容至3000辆 [1] - 公司远期计划在2030年达成10万辆运营规模 [1] 技术实力与行业地位 - 公司是L4自动驾驶领域的先行者,技术及商业化能力构筑了护城河 [1] - 公司依托世界模型和虚拟司机技术在L4领域深耕,并在商业化应用方面取得实质性突破 [1] - 公司凭借先发优势和行业地位,在自动驾驶出行服务和自动驾驶货车领域占据重要市场份额 [1] 增长前景与市场预期 - 随着第七代车型的加速部署和车队规模扩大,公司强劲的增长势头有望延续 [1]
小马智行-W(02026.HK)高开逾6%
每日经济新闻· 2026-01-05 09:43
公司股价表现 - 公司股票代码为小马智行-W(02026 HK) [1] - 公司股价在交易时段高开超过6% [1] - 截至发稿时,公司股价上涨6.29%,报123.4港元 [1] - 公司股票成交额为76.51万港元 [1]
小马智行-W高开逾6% 年底车队将突破千辆 机构看好公司自驾领域占据重要市场份额
智通财经· 2026-01-05 09:39
公司股价与市场反应 - 公司股价高开逾6%,截至发稿涨6.29%,报123.4港元,成交额76.51万港元 [1] 商业化进展与财务里程碑 - 公司在广州实现Robotaxi单车盈利(UE转正),日均单车营收达299元 [1] - 实现盈利的核心支撑来自第七代Robotaxi的技术突破与成本优化 [1] - 公司在去年第三季度在广州实现Robotaxi单车盈利转正,标志着商业化迎来阶段性里程碑 [1] 车队规模与未来规划 - 公司计划在2025年底将车队规模突破1000辆 [1] - 公司目标在2026年将车队扩容至3000辆 [1] - 公司远期计划在2030年达成10万辆运营规模 [1] 技术与市场地位 - 公司是L4自动驾驶领域的先行者,技术及商业化能力构筑护城河 [1] - 公司依托世界模型和虚拟司机技术在L4领域深耕,并在商业化应用方面取得实质性突破 [1] - 公司凭借先发优势和行业地位,在自动驾驶出行服务和自动驾驶货车领域占据重要市场份额 [1] 增长前景 - 随着第七代车型的加速部署和车队规模扩大,公司强劲的增长势头有望延续 [1]
港股异动 | 小马智行-W(02026)高开逾6% 年底车队将突破千辆 机构看好公司自驾领域占据重要市场份额
智通财经网· 2026-01-05 09:34
公司股价与市场反应 - 公司股价高开逾6% 截至发稿涨6.29%报123.4港元 成交额76.51万港元 [1] 商业化进展与财务表现 - 公司在广州实现Robotaxi单车盈利(UE转正) 日均单车营收达299元 [1] - 实现单车盈利的核心支撑来自第七代Robotaxi的技术突破与成本优化 [1] - 公司在广州实现Robotaxi单车盈利转正 标志着其商业化迎来阶段性的里程碑式时刻 [1] 车队规模与未来规划 - 公司计划2025年底车队规模突破1000辆 2026年目标扩容至3000辆 [1] - 公司远期计划在2030年达成10万辆运营规模 [1] 技术实力与行业地位 - 公司属于L4自动驾驶领域先行者 技术及商业化能力构筑护城河 [1] - 公司依托于世界模型和虚拟司机技术在L4领域深耕 [1] - 公司凭借先发优势和行业地位 在自动驾驶出行服务和自动驾驶货车领域占据重要市场份额 [1] 增长前景 - 随着第七代车型的加速部署和车队规模扩大 公司强劲的增长势头有望延续 [1]
港股早评:恒指微幅高开0.09%,地缘政治紧张黄金股活跃
格隆汇· 2026-01-05 09:28
港股市场整体表现 - 港股三大指数在特定交易日迎来开门红行情 恒生指数小幅高开0.09% 国企指数低开0.03% 恒生科技指数上涨0.33% [1] 科技与互联网行业 - 大型科技股多数上涨 其中快手-W股价上涨约6% 阿里巴巴-SW股价上涨1.4% [1] 资源与大宗商品行业 - 受地缘政治紧张局势影响 黄金股集体上涨 [1] - 铜业股等有色金属板块表现活跃 [1] 交通运输与工业行业 - 海运股股价上涨 [1] - 机器人概念股股价上涨 [1] - 自动驾驶概念股股价上涨 [1] 能源与公用事业行业 - 石油股多数下跌 其中中国海洋石油股价下跌3.65% [1] - 风电股多数下跌 其中金风科技股价下跌4.5% [1] 金融行业 - 中资券商股多数下跌 [1]
AAAI 2026 | 小鹏联合北大,专为VLA模型定制视觉token剪枝方法
具身智能之心· 2026-01-05 09:03
文章核心观点 - 小鹏汽车与北京大学联合提出了一种专为端到端自动驾驶设计的视觉语言模型视觉token剪枝新框架FastDriveVLA [1] - 该框架基于“前景信息比背景信息对驾驶决策更有价值”的假设 [2] - 通过创新的基于重建的剪枝器ReconPruner,在显著提升推理效率的同时,保持了甚至超越了原始模型的驾驶性能 [2][8][25] 研究背景与问题 - 端到端自动驾驶系统因其简洁性和减少误差传递的潜力而受到关注,但现有VLA模型将视觉输入转换为大量视觉token,导致巨大的计算开销和推理延迟,对车端部署构成挑战 [7] - 现有的视觉token剪枝方法(如引入新投影器、基于注意力或相似性的策略)并非为自动驾驶设计,在自动驾驶场景中存在局限性 [1][7] 方法与创新 - 构建了大规模自动驾驶前景标注数据集nuScenes-FG,包含来自6个摄像头视角的24.1万个图像-掩码对,明确定义了对驾驶决策有直接影响的前景区域(如行人、车辆、道路、交通标志等) [2][13] - 提出了一个轻量级、可即插即用的基于重建的剪枝器ReconPruner [16] - ReconPruner采用MAE风格的像素重建策略,并创新性地引入了对抗性前景-背景重建策略,以增强其区分前景与背景视觉token的能力 [16][19] 实验结果 - 在nuScenes开环规划基准测试中,FastDriveVLA在不同剪枝比例下均取得了SOTA性能 [2] - 当视觉token数量从3249个减少至812个(剪枝75%)时,FastDriveVLA的FLOPs直降约7.5倍 [2][26] - 在CUDA推理延迟方面,FastDriveVLA将预填充时间减少了3.7倍、将解码时间减少了1.3倍 [2][26] - 在剪枝25%时,FastDriveVLA的L2轨迹误差和碰撞率指标分别比未剪枝的原始模型低了0.1%和1.0% [28] - 研究建议在实际部署中采用50%的剪枝比例,以实现性能与效率的最佳平衡 [25] 效率与性能对比 - 在剪枝75%的情况下,FastDriveVLA的Token FLOPs为5.1T,预填充时间为51 ms/token,解码时间为18 ms/token [27] - 与基于注意力的基线(FastV, SparseVLM)和基于相似性的基线(DivPrune, VisPruner)相比,FastDriveVLA在各种剪枝比例下均展现出更优或更具竞争力的性能 [24] - 可视化分析表明,ReconPruner能有效保留前景关键信息(如车道、车辆),而其他方法存在漏检或定位不准的问题 [29]
中国超火90后,又融资 35.5 亿元
搜狐财经· 2026-01-04 20:53
LP募资情报 - 四川社保科创基金正式签约成立,总规模500亿元人民币,首期规模200亿元人民币,重点投向人工智能、低空经济、生物医药、软件和信息服务等省内“15+N”重点产业链[2] - 湖北水利发展产业投资基金登记成立,出资额约20亿元人民币,由长江创业投资基金管理有限公司全资持股[3] 投融资动态 - 月之暗面完成5亿美元(约35.5亿元人民币)C轮融资,公司当前现金持有量超过100亿元人民币,并明确表示短期不急于上市[4] - 楚睿智能完成数亿元人民币C轮融资,该公司是一家锂电池储能系统研发商[4] - 中电信人工智能科技有限公司完成首轮增资引战,引入国家人工智能基金等4家战略投资方,并同步实施员工股权激励计划[5][6] - 红熊AI完成8000万元人民币Pre-A+轮融资,致力于构建客户智能体互动服务平台[6] IPO进行时 - 蓝箭航天科创板IPO获受理,该公司是商业航天企业,主要从事液氧甲烷发动机及运载火箭的研发、生产与发射服务[7] - 长鑫科技科创板IPO获受理,拟募资295亿元人民币,如实施将刷新科创板IPO募资规模纪录,且为首单“预先审阅”机制落地项目[7] - 智谱华章正式开启港股招股,计划募资至多51亿港元,IPO市值预计超518亿港元[8] - 壁仞科技在港交所上市,成为“国产GPU第一股”,上市首日股价上涨75.82%,总市值约825亿港元,其公开发售获2347.53倍认购[8] 上市公司动态 - 贵州茅台全资控股的贵州爱茅台数字科技有限公司成立,注册资本6亿元人民币,“i茅台”App注册用户截至2025年5月已突破7600万[10][11] - 小马智行Robotaxi车队规模突破1159辆,超额完成原定2025年1000辆的目标,并在广州实现单车盈利[11] - 贵州茅台首次回购87,059股股份,支付总金额1.20亿元人民币[12]
美股科技行业周报:CES2026将召开,建议关注端侧AI、PhysicalAI等方向-20260104
国联民生证券· 2026-01-04 20:02
报告行业投资评级 * 报告未明确给出对美股科技行业的整体投资评级 [1][6][24] 报告核心观点 * 报告核心观点围绕CES 2026展会前瞻与近期重要AI技术进展展开,认为应重点关注AI在消费端的落地场景,并看好由此带来的算力基础设施需求 [6][24] * 对于CES 2026,建议关注端侧AI、Physical AI等方向,具体包括AI PC、具身智能、自动驾驶与智能座舱、XR等领域的进展 [1][6][24] * 在技术层面,Google DeepMind的Veo 3视频模型正演变为通用的视觉基础模型和物理世界模拟器,具备零样本解决复杂视觉任务的能力,将提升具身智能与高阶自动驾驶的认知能力 [5][6][14][15][24] * DeepSeek提出的mHC架构旨在解决大模型扩大规模时增强表达能力与训练稳定性之间的矛盾,为训练更大规模模型铺平道路,意味着Scaling Law或将持续,模型参数继续增长将为算力基础设施提供更高确定性 [5][6][18][19][24] * 基于以上,投资建议重点布局算力硬件上游,以及能率先将多模态推理能力落地于实体场景的平台型公司,报告列举了建议关注的标的包括英伟达、特斯拉、LITE、AVGO、GOOG等 [6][24] CES 2026前瞻总结 * **芯片**:重点关注头部公司新芯片产品推出 [2][11] * AMD:或在主题演讲上推出锐龙系列芯片新版本,包括锐龙7 9850X3D及基于Zen 5架构的锐龙9000G系列 [2][11] * 英特尔:将推出基于2纳米18A工艺打造的酷睿Ultra 3系列Panther Lake芯片,面向高端笔记本市场,其处理性能较前代提升**50%**,内置Arc显卡性能也较上一代提高**50%** [2][11] * 高通:聚焦笔记本电脑领域,预计展示搭载Snapdragon X2 Elite芯片的终端设备,推出拥有**18个**CPU核心的旗舰型号X2 Elite Extreme [2][11] * **自动驾驶**:重点关注L3自动驾驶和车内AI座舱 [3][12] * Sony Honda Mobility:将公布AFEELA 1的最新进展并展示全新概念车型,AFEELA 1计划**2026年**向加利福尼亚州客户交付 [3][12] * BMW:将展示全新纯电iX3车型,搭载全景式iDrive系统及整合了Alexa+技术的全新AI智能个人助理 [3][12] * Mercedes-Benz:展示全新纯电CLA,展示搭载英伟达AI全栈自动驾驶软件与加速计算平台的新一代MB.DRIVE技术 [3][12] * **具身智能**:重点关注国内外头部厂商新产品/技术进展 [4][13] * 英伟达:展示重心或将转向Physical AI,包括机器人技术与大规模仿真的交叉融合,市场预计其Isaac机器人平台和Omniverse仿真引擎将迎来重大更新 [4][13] * 其他厂商:智元或将展示全系列产品线及发布灵巧手新版本;宇树或将带来人形机器人最新交互演示;加速进化或展示Booster T1、Booster K1等核心产品;波士顿动力的人形机器人Atlas或将进行首次公开演示;LG电子将首发家用机器人LG CLOiD;银河通用、云深处、傅利叶、众擎、松延动力等或将参展 [4][13] * **XR**:重点关注基于Android XR平台的Project Moohan [4][13] * Project Moohan是三星将推出的扩展现实头显设备,专为安卓扩展现实平台打造,该平台由三星、谷歌与高通联合研发,整合Gemini后能处理设备控制指令并解读周围环境,为用户提供情境化辅助 [4][13] 科技行业动态总结 * **Google DeepMind发布视频模型论文** [5][14] * 论文核心论证生成式视频模型(特别是Veo 3)正在演变为通用的视觉基础模型 [5][14] * 经过大规模网络数据训练的视频生成模型已涌现出零样本通用能力,可在无特定任务训练的情况下,仅通过提示词和图像输入解决复杂视觉任务 [5][14] * 视频模型通过生成一系列连续视频帧(Chain-of-Frames,帧链)来进行视觉推理,类比于大语言模型的思维链 [5][14] * Veo 3在**62种**不同任务上展现出四大核心能力:感知、建模、操作和推理 [15] * **DeepSeek发布大模型架构论文** [5][18] * 论文核心目标是解决大模型在扩大规模时“增强表达能力”与“训练稳定性”之间的矛盾 [5][18] * 提出mHC架构升级,旨在让大模型既能拥有“多车道”宽阔信息通路(高表达力),又能像传统ResNet一样稳定训练 [5][18] * 在**270亿**参数规模的MoE模型上验证,mHC在BBH、DROP等推理和语言基准测试中的表现全面超越传统Baseline和普通HC模型,且训练损失和梯度更稳定 [19][21]