Workflow
浪潮信息(000977)
icon
搜索文档
计算机行业政策点评:“人工智能+制造”意见发布,工业AI产业发展将提速
山西证券· 2026-01-09 15:43
报告行业投资评级 - 领先大市-A(维持)[1] 报告核心观点 - 八部门联合发布的《“人工智能+制造”专项行动实施意见》是此前“人工智能+”行动在工业制造领域的细化落地,将加速大模型在工业领域的全流程渗透,推动国内工业AI产业加速发展[3][5][7] - 在技术和政策双轮驱动下,工业大模型正从单点验证迈向全流程赋能,预计政策将加速这一进程,2026年AI应用渗透率有望进一步快速提升[6] - 中国工业企业应用大模型及智能体的比例已从2024年的9.6%大幅提升至2025年的47.5%[6] 政策内容与目标 - 政策总体目标:到2027年,实现人工智能关键核心技术安全可靠供给,产业规模和赋能水平稳居世界前列[3] - 具体量化目标:推动3-5个通用大模型在制造业深度应用、打造100个工业领域高质量数据集、推广500个典型应用场景、培育2-3家具有全球影响力的生态主导型企业和一批专精特新中小企业[3] - 政策是2025年《关于深入实施“人工智能+”行动的意见》在工业制造领域的细化落地[5] 政策聚焦的关键环节 - **算力环节**:支持高端训练芯片、端侧推理芯片、智算云操作系统等核心技术突破,推动智能芯片软硬协同发展[5] - **模型环节**:强调开发高水平的行业模型,包括制造业重点领域行业大模型及面向工业细分场景的小模型[5] - **数据环节**:提出开展“模数共振”行动,包括建立企业首席数据官制度、发布制造业高质量数据集建设指南[5] - **应用环节**:以制造业全流程转型升级为主线,涵盖研发设计、中试验证、生产制造、运营管理等环节,推动大模型技术深度嵌入[5] 工业AI应用渗透与场景深化 - **研发设计环节**:AI从文生3D模型和仿真逐步拓展至设计变更、设计审查等更深入场景[6] - **生产制造环节**:大模型已在设备运维辅助、安全监控、工艺质量分析优化等场景初步规模化落地,并开始向厂级生产绩效分析、工业控制编程、机器人智能控制等新方向探索[6] - **经营管理环节**:人力、财务、客服领域的AI应用趋于成熟,并在合规审查、采销文件生产审核、供应商跟进等场景持续深化[6] 投资建议关注方向 - **工业AI应用**:中控技术、金蝶国际、鼎捷数智、汉得信息、索辰科技、赛意信息、中望软件、容知日新、朗新科技等[7] - **数据标注**:海天瑞声、深桑达A等[7] - **AI算力**:海光信息、寒武纪、摩尔线程、沐曦、浪潮信息、深信服、协创数据、华勤技术等[8]
AI硬切软?低费率云计算50ETF(516630)涨超2.6%,易点天下涨停
搜狐财经· 2026-01-09 13:52
市场表现与行情 - 2026年1月9日,AI软件多概念走强,中证云计算与大数据主题指数(930851)强势上涨2.57% [1] - 个股方面,易点天下20cm涨停,润泽科技、卫宁健康涨超10%,奥飞数据、万兴科技等个股跟涨 [1] - 云计算50ETF(516630)当日上涨2.62%,最新价报1.76元 [1] - 拉长时间看,截至2026年1月8日,云计算50ETF近1周累计上涨4.76% [1] - 2026年1月8日,云计算50ETF获得资金净流入3102.09万元 [1] 政策驱动因素 - 2026年1月7日,工信部等八部门印发《“人工智能+制造”专项行动实施意见》,旨在促进人工智能与制造业深度融合与“双向赋能” [1] - 《意见》提出,到2027年推动3-5个通用大模型在制造业深度应用,推出1000个高水平工业智能体,打造100个工业领域高质量数据集,推广500个典型应用场景 [1] - 开源证券表示,国家积极推动AI应用发展,有望持续拉动对于国内AI算力的需求 [1] 指数与ETF产品特征 - 云计算50ETF紧密跟踪中证云计算与大数据主题指数 [2] - 该指数选取50只业务涉及提供云计算服务、大数据服务以及相关硬件设备的上市公司证券作为指数样本 [2] - 截至2025年12月31日,中证云计算与大数据主题指数前十大权重股合计占比50.01% [2] - 前十大权重股包括科大讯飞、金山办公、中际旭创、新易盛、浪潮信息、中科曙光、紫光股份、恒生电子、润泽科技、拓维信息 [2] - 云计算50ETF管理费率为0.15%,托管费率为0.05%,为同类费率最低 [1][2] - 截至2026年1月8日,云计算50ETF近3年跟踪误差为0.019% [2] 风险与回撤数据 - 截至2026年1月8日,云计算50ETF今年以来最大回撤0.35%,相对基准回撤0.01% [2] - 该ETF回撤后修复天数为1天,回撤后修复最快 [2] 部分成分股表现 - 根据表格数据,部分指数权重股在特定日期涨跌互现,例如科大讯飞上涨2.00%,金山办公上涨2.90%,而中际旭创下跌1.10%,新易盛下跌1.86% [4]
1月7日深证国企ESG(970055)指数跌0.32%,成份股云铝股份(000807)领跌
搜狐财经· 2026-01-07 18:46
深证国企ESG指数市场表现 - 深证国企ESG指数于1月7日报收1436.92点,单日下跌0.32% [1] - 指数当日成交额为436.67亿元,换手率为1.69% [1] - 指数成份股中19家上涨,29家下跌,中钨高新以7.67%的涨幅领涨,云铝股份以3.21%的跌幅领跌 [1] 指数十大权重股详情 - 海康威视为第一大权重股,权重9.57%,最新价30.07元,下跌1.05%,总市值2755.88亿元,属于计算机行业 [1] - 五粮液权重9.23%,最新价107.52元,下跌0.60%,总市值4173.50亿元,属于食品饮料行业 [1] - 徐工机械权重8.83%,最新价11.73元,下跌0.26%,总市值1378.62亿元,属于机械设备行业 [1] - 潍柴动力权重7.59%,最新价17.82元,上涨0.91%,总市值1552.76亿元,属于汽车行业 [1] - 泸州老窖权重7.52%,最新价117.12元,下跌1.26%,总市值1723.94亿元,属于食品饮料行业 [1] - 云铝股份权重5.93%,最新价33.78元,下跌3.21%,总市值1171.48亿元,属于有色金属行业 [1] - 浪潮信息权重5.93%,最新价67.42元,下跌0.98%,总市值990.05亿元,属于计算机行业 [1] - 中航光电权重3.53%,最新价37.08元,下跌0.40%,总市值785.45亿元,属于国防军工行业 [1] - 洋河股份权重3.17%,最新价62.26元,下跌1.77%,总市值937.91亿元,属于食品饮料行业 [1] - 光迅科技权重2.96%,最新价71.18元,上涨2.45%,总市值574.19亿元 [1] 指数成份股资金流向 - 指数成份股当日整体主力资金净流出2.22亿元,游资资金净流出1.27亿元,散户资金净流入3.48亿元 [1] - 中钨高新主力资金净流入3.04亿元,主力净占比8.61%,游资净流出6606.25万元,散户净流出2.38亿元 [2] - 中核科技主力资金净流入1.59亿元,主力净占比8.33%,游资净流出1106.21万元,散户净流出1.48亿元 [2] - 潍柴动力主力资金净流入1.00亿元,主力净占比8.69%,游资净流出491.23万元,散户净流出9529.92万元 [2] - 赢合科技主力资金净流入6743.63万元,主力净占比5.90%,游资净流出198.74万元,散户净流出6544.89万元 [2] - 北部湾港主力资金净流入6392.94万元,主力净占比9.50%,游资净流出1947.49万元,散户净流出4445.45万元 [2] - 光迅科技主力资金净流入4302.10万元,主力净占比1.36%,游资净流出3639.92万元,散户净流出662.19万元 [2] - 徐工机械主力资金净流入3380.36万元,主力净占比4.66%,游资净流出4563.45万元,散户净流入1183.10万元 [2] - 中油资本主力资金净流入2654.63万元,主力净占比1.93%,游资净流入171.33万元,散户净流出2825.96万元 [2] - 飞亚达主力资金净流入2580.78万元,主力净占比8.58%,游资净流出971.75万元,散户净流出1609.02万元 [2] - 泰胜风能主力资金净流入2571.53万元,主力净占比1.37%,游资净流入1.36亿元,散户净流出1.62亿元 [2]
浪潮英信NF5468M5 高性能机架服务器订购赠卡
新浪财经· 2026-01-07 09:51
产品促销信息 - 浪潮英信NF5468M5服务器正在中关村在线商家“北京科创腾达”进行特价促销,并提供京东E卡赠品 [1][7] - 产品参考价格为“价格面议”,购买咨询时提及中关村在线可能获得更优价格和服务 [5][9] 产品核心规格与设计 - 浪潮英信NF5468M5是一款4U双路机架式服务器,专为现代数据中心打造 [1][7] - 服务器搭载双Intel Xeon Gold 5218处理器,具备卓越的并行处理能力与系统稳定性 [1][7] - 产品支持多达20条PCIe 3.0扩展槽,可灵活适配AI加速卡、高速网卡及存储控制器 [1][7] - 内存采用ECC DDR4技术以保障数据完整性,存储支持多盘位热插拔 [1][7] - 整机采用模块化设计,便于运维与升级,并拥有优化的散热与电源管理机制 [1][7] 产品应用场景 - 该服务器广泛适用于人工智能训练与推理、虚拟化平台、大规模数据库集群及实时数据分析等企业级场景 [4][9] - 在AI领域,其支持多种GPU拓扑结构,可无缝对接主流加速卡,高效支撑深度学习模型的训练与部署 [4][9] - 在虚拟化环境中,其多核高并发特性可显著提升资源利用率,助力云平台弹性扩展 [4][9] - 在金融、医疗与安防等行业,其稳定性和扩展能力被用于实时交易处理、影像分析与智能监控系统 [4][9] 公司背景 - 浪潮是中国领先的计算平台与IT应用解决方案供应商,同时也是中国最大的服务器制造商和服务器解决方案提供商 [6][10] - 浪潮集团拥有“浪潮信息”和“浪潮软件”两家国内A股上市公司,以及在香港联交所创业板上市的浪潮公司 [6][10]
浪潮NF5280M5服务器 强劲算力赋能多元业务场景特惠
新浪财经· 2026-01-07 09:51
产品促销信息 - 浪潮英信NF5280M5服务器正在中关村在线商家“北京科创腾达”进行特价促销,并提供赠品京东E卡 [1][7] - 产品参考价格为面议,购买咨询时提及中关村在线可能获得更优价格和服务 [5][10] 产品核心硬件配置 - 服务器搭载双路英特尔至强金牌5218处理器,具备多核多线程架构,提供强劲的并行计算能力以应对高密度计算负载 [1][7] - 配备128GB大容量内存,为多任务并行运行提供支撑,旨在降低内存瓶颈对业务效率的影响 [1][7] - 存储系统由6块1.2TB硬盘组成大容量存储阵列,支持灵活的RAID配置以保障数据安全与读写性能 [1][7] 产品设计与功能特性 - 整机采用全模块化设计,拥有丰富的扩展插槽,支持多种网络接口与加速卡配置 [1][7] - 产品具备智能管理功能,可实时监控运行状态并简化部署维护流程,特性为稳定可靠与灵活适配 [1][7] 产品应用场景 - 适用于云计算领域,其强劲算力可支撑虚拟化集群部署,为公有云和私有云平台提供稳定算力输出 [4][9] - 适用于大数据分析任务,大容量内存与存储能高效处理海量数据检索与分析运算 [4][9] - 适用于金融服务、企业关键业务等场景,可为交易系统、数据库服务等核心业务提供持续可靠运行保障 [4][9] - 可赋能深度学习、高性能计算等需求,成为企业数字化转型过程中的核心算力支撑设备 [4][9] 公司背景 - 浪潮是中国领先的计算平台与IT应用解决方案供应商,同时是中国最大的服务器制造商和服务器解决方案提供商 [6][11] - 浪潮集团旗下拥有“浪潮信息”和“浪潮软件”两家国内A股上市公司 [6][11]
浪潮信息:截至2025年12月31日公司股东总户数将在公司年报中披露
证券日报· 2026-01-06 21:37
公司信息披露 - 浪潮信息在互动平台表示,截至2025年12月31日的公司股东总户数将在公司年报中披露 [2]
高盛聚焦全球服务器市场变革:ASIC服务器持续扩张,AI整机柜芯片平台走向多元化
智通财经· 2026-01-05 22:12
文章核心观点 - 全球服务器市场正迎来结构性变革,ASIC服务器渗透加速,AI整机柜服务器芯片平台向多元化演进,叠加全球云服务提供商资本支出大幅增长,行业将在2025-2027年维持高景气周期 [1] 全球服务器市场规模显著扩容 - 高盛上调全球服务器市场规模预期,预计2025-2027年全球服务器总营收将分别达到4331亿美元、6061亿美元和7639亿美元,同比增速依次为71%、40%和26% [2] - AI训练服务器成为核心增长引擎,2025-2027年营收预计分别达2348亿美元、3698亿美元和5062亿美元,同比增速高达97%、57%和37% [2] - 通用服务器逐步回归常态增长,营收增速预计为51%、19%和5%;AI推理服务器与HPC服务器则保持稳健增长,2027年营收将分别达484亿美元和103亿美元 [2] - 2025-2027年全球AI高功率训练服务器(8GPU等效单位)出货量预计为69.2万台、95.2万台和122.7万台,同比增速26%、38%和29% [2] - AI整机柜服务器(含英伟达、AMD等多平台)出货量将从2025年的1.9万台激增至2027年的8万台,2026年同比增幅达185% [2] - 通用服务器出货量则将从2025年的1387.2万台增长至2027年的1519.6万台,增速逐步趋稳 [2] 关键变革一:ASIC服务器渗透加速 - 高盛上调ASIC AI服务器渗透率预测,预计2025-2027年ASIC芯片在AI芯片中的占比将分别达到38%、40%和50% [3] - 这一调整主要基于中国ASIC供应商技术突破与商业化落地,以及全球AI应用对定制化算力需求的激增 [3] - 高盛预测,2025-2027年全球AI服务器对应的AI芯片需求将分别达到1100万颗、1600万颗和2100万颗,较上一轮预测上调7%、17%和26% [3] - 2026年下半年多款新型AI芯片量产将进一步助推芯片需求扩容,ASIC与GPU双轨驱动成为AI算力供给的核心特征 [3] 关键变革二:AI整机柜芯片平台多元化 - 高盛首次将非英伟达芯片平台纳入AI整机柜服务器预测,标志着行业从单一芯片依赖转向多元化竞争 [4] - AI整机柜服务器自2024年第四季度随英伟达Blackwell平台启动出货后,2026年下半年起将有更多厂商采用整机柜设计,其中AMD Helios机架等非英伟达方案将逐步放量 [4] - 2025-2027年全球AI整机柜服务器出货量预计为1.9万台、5.5万台和8万台,对应的市场规模分别达546亿美元、1646亿美元和2551亿美元 [4] - 英伟达相关整机柜服务器出货量维持1.9万台、5万台和6.7万台的预测,非英伟达阵营出货量将从2025年的0台快速增长至2027年的1.3万台 [4] - AI整机柜服务器配置持续升级,英伟达方案采用每机架144颗GPU核心设计,非英伟达方案则多为每机架72个GPU模块,具备超高算力密度 [4][5] 细分赛道展望:高功率与推理服务器分化增长 - **AI高功率训练服务器**:高功率AI训练服务器(单芯片算力>500TFLOPS)成为增长核心,高盛上调其2025-2027年出货量预测至69.2万台、95.2万台和122.7万台,较此前预测提升9%、30%和50%,对应的市场规模分别达1802亿美元、2052亿美元和2511亿美元 [5] - **AI推理服务器**:AI推理服务器(单芯片算力<500TFLOPS)将随AI应用规模化落地实现稳健增长,2025-2027年出货量预计为47万台、53.9万台和65.6万台,同比增速1%、15%和22%,市场规模从298亿美元增长至484亿美元 [6] - 全球AI模型迭代加速(如Gemini3Deep Think、OpenAI GPT-5.2等上线),以及自动驾驶、智能客服等终端应用渗透提升,成为推理服务器需求增长的核心驱动力 [6] 通用服务器与HPC:回归常态与平稳运行 - 通用服务器市场在CPU平台更新周期结束后回归正常增长,2025-2027年出货量增速预计为11%、8%和2%,营收增速51%、19%和5% [7] - 增长动力主要来自数据处理需求提升推动的产品结构升级,以及内存价格上涨带来的ASP(平均售价)提升 [7] - HPC服务器则维持平稳运行,2025-2027年营收预计为97亿美元、101亿美元和103亿美元,增速基本保持在1%-11%区间 [7] 核心公司梳理:聚焦产业链核心 - **ODM厂商**:工业富联作为全球AI服务器市占率龙头(约40%),绑定英伟达、微软等核心客户,2025年Q3净利润同比暴增62% [8];纬颖专注高端AI服务器定制,是英伟达整机柜服务器核心供应商 [8];广达、鸿海(工业富联)、仁宝也被重点提及 [8][9] - **液冷厂商**:AVC(奇鋐科技)为英伟达GB300平台提供定制冷水板,Fositek(富世达)依托AVC供应链放量,两者合计占据GB300液冷核心供应链份额 [10][11];Auras(双鸿科技)切入Meta、Oracle供应链,液冷业务成为核心增长极 [10][11] - **核心部件及制造厂商**:台积电作为AI芯片及ASIC核心制造平台,被视为算力产业链“基石型标的” [12];Chenbro(勤诚)、GCE(金像电子)、MPI(京元电子)、Hon Precision(鸿准精密)分别为机箱、PCB、探针卡、精密组件领域龙头 [12] - **中国算力行业重点公司**:高盛单独圈定8家重点推荐上市公司,第一梯队:工业富联、浪潮信息、中际旭创;第二梯队:海光信息、寒武纪-U、佰维存储;第三梯队:英维克、盛科通信 [12]
AI叙事不断递进,阿里巴巴、中际旭创双双涨超2%!云计算ETF汇添富(159273)大涨超3%!机构:2026拥抱“AI+”投资主线!
搜狐财经· 2026-01-05 17:46
市场表现 - 1月5日,沪指加速上涨超1%,重返4000点,算力板块再度强势 [1] - 云计算ETF汇添富(159273)当日大幅收涨超3%,全天成交额超3000万元,环比放量33% [1] - 该ETF标的指数权重股多数收红,其中金山办公涨超6%,中际旭创、阿里巴巴-W、中科曙光涨超2%,浪潮信息、恒生电子涨近2%,腾讯控股微涨 [2] 机构观点:AI大模型发展趋势 - 复盘美股科技巨头过去三年股价走势,AI叙事不断递进 [4] - 2023年,OpenAI领先开启AI加速度,微软因独家合作受益,估值明显抬升 [4] - 2024年,市场叙事转向推理侧,认为应用公司最优,Meta因社交垄断生态和广告场景,成为除英伟达外PE唯一抬升的巨头;同年云厂商因资本开支大增但供给受限,收入传导延迟,三大CSP(云服务提供商)估值略有回落 [4] - 2025年,模型差距与OpenAI明显收敛,谷歌后来居上,生态优势受市场追逐 [4] - 展望2026年,Scaling Law将持续,模型厂商将打开差异化应用市场,模型推理侧需求或进入放量拐点,模型和算力或为最优投资方向 [4] 资本开支与算力需求 - 2025年北美四家科技巨头资本开支同比增长50%以上,从年初的3200-3300亿美元上修至年末接近4000亿美元 [5] - 测算2026年资本开支将持续实现30%以上增速 [5] - 巨额资本开支投入数据中心建设,可能面临电力瓶颈 [5] - 2024年北美数据中心容量约25GW,据Grid Strategies估计,至2029年的五年将新增80GW需求,但煤电退役、变压器建设周期长等因素可能导致电力缺口成为主要矛盾,算力能耗比成为关键考量因素 [5] 技术演进与架构发展 - 模型架构继续演化,Scaling law延续,多模态与长文本能力为Agent爆发提供基础 [5] - 2023年为Scaling law红利期,2024年多模态、推理模型涌现,2025年算法工程与Scaling Law并进 [5] - 下一代模型架构需解决两大核心痛点:训练阶段Transformer的计算量和内存消耗瓶颈;推理时模型的记忆能力有限且参数无法跟随记忆变化 [5] - 海外已有谷歌的Titans架构及Mamba架构,国内则从成本效率优化角度出发,如Qwen3-Next、DeepSeek V3.2取得明显提升 [5] - 预计2026年Scaling law仍将延续,强化学习将成为重点突破方向 [7] - 多模态、长文本能力更加成熟,为Agent涌现提供技术基础,目前中美模型差距在3-6个月,算力和算法是追赶关键 [7] 应用市场与需求变化 - 人工智能实际上打开了软件需求的天花板,据IDC数据,预计2029年全球SaaS市场将达到近1万亿美元规模,对比2025年的5800亿美元有明显增长 [7] - 市场玩家将重新洗牌,拥有数据壁垒、布局垂类细分场景、工作流程复杂或对准确度要求极高的行业(如医疗、能源、会计、安全)被大模型替代的风险较小 [7] - 大模型厂商开始通过与B端软件服务商合作开发行业需求,或与传统SaaS厂商产生直面竞争 [7] - 2026年推理侧需求有望爆发,一级市场中,编程场景、Agent爆发为主要应用方向 [8] - 当前规模增长较快的行业以AI编程、AI Agent、AI内容创作为主,聚焦生产力提升 [8] - 今年以来诞生多个爆款应用:AI编程软件Cursor年经常性收入已达到10亿美元,AI agent Manus在8个月时间年经常性收入达到1亿美元,AI Perplexity年经常性收入也已达到2亿美元 [8] - 随着模型能力成熟,2026年在端侧的AI手机、AI眼镜,以及协助大模型在企业落地的分销商领域将看到明显增长 [8] 公司动态 - 1月5日,阿里巴巴旗下高德已正式布局"世界模型"技术,并计划基于该模型推出全新产品应用,标志着其在空间智能领域的战略进一步深化 [6] 投资主线 - 华西证券认为,AI大模型的研发从侧重规模,到追求效率,再到追求推理能力,一切朝着更利于应用的方向不断发展 [8] - 2023年及以前,大语言模型发展遵循"Scaling Laws",GPT-4的成功印证了该路径 [8] - 效率追求:传统Transformer架构的注意力机制存在二次方计算复杂度,限制了上下文长度扩展和模型实际部署,催生了对稀疏架构和新型注意力机制(如MoE架构、MLA注意力机制)的需求 [9] - 推理追求:单纯的规模扩张不能赋予模型多步骤逻辑推理能力,催生了思考模型(如CoT)的诞生 [9] - 智能体的诞生:模型基础能力、效率及推理能力的提升,为智能体的诞生奠定基础,智能体在传统大模型基础上引入了与外部工具和环境的交互 [9]
78ms的VLA推理!浪潮信息开源自驾加速计算框架,大幅降低推理时延
自动驾驶之心· 2026-01-05 11:33
行业趋势:VLA大模型成为高阶自动驾驶关键方向 - 随着高阶自动驾驶迈向“端到端”阶段,VLA(视觉-语言-动作)大模型正成为自动驾驶的最佳模型方案,它通过统一建模视觉感知、语义理解与逻辑决策,使系统具备类似人类的语义理解与推理能力,是突破自动驾驶“长尾场景”挑战的关键 [2] - 然而,VLA大模型参数规模已增长至数十亿甚至百亿级,多模态数据在异构算力间流转处理时,模型延时普遍超过100ms,难以满足实时性需求,亟需软硬件系统优化来解决车载端异构计算协同问题 [2][5] 技术挑战:VLA大模型车端部署面临三大瓶颈 - **计算挑战**:模型参数从千万级跃迁至数十亿甚至百亿级,对算力、存储带宽与系统协同效率提出空前挑战;其推理过程呈现多阶段强依赖特征,时延呈串行累积;Transformer架构的自注意力计算复杂度随序列长度指数增长,且自回归生成导致动作指令必须串行产出,限制了硬件并行度;数十亿级参数量导致芯片频繁访存,受限于端侧内存带宽,计算单元常因“等数据”而空转 [5][6] - **通信挑战**:与传统模块化系统相比,VLA大模型对数据通信的压力呈指数级增长,多模态特征、高清图像及中间张量频繁在不同计算单元间流转;端到端闭环对时延极为敏感,传统基于中间件的通信机制(如多次拷贝、序列化与协议栈开销)成为制约实时性的核心瓶颈 [6] - **调度挑战**:VLA大模型的执行过程具有明显的异构性与阶段性特征,不同子任务在实时性、计算量与优先级上差异显著;传统以线程或进程为粒度的粗放式调度方式,难以应对多任务并发、强优先级约束与异构算力协同的需求,容易导致关键任务阻塞、算力资源空转或端到端时延不可预测 [7] 解决方案:AutoDRRT 3.0计算加速框架 - 浪潮信息研究团队开源了面向VLA大模型的自动驾驶计算加速框架AutoDRRT 3.0,该框架基于其自动驾驶车载计算平台EIS400,通过在计算效率、通信延时、任务调度三大维度的创新重构,旨在解决VLA大模型的上车挑战 [3][8] - 该框架面向2D+CNN小模型、BEV+Transformer大模型、VLA大模型等不同算法进行了针对性的算法内核与架构升级,汽车厂商、软件平台商和中间件软件开发商可免费下载使用 [3] 技术突破一:计算革新实现全闭环加速 - 通过并行解码、视觉剪枝、算子融合与混合量化等技术,对VLA推理链路进行重构,实现了从“视觉输入”到“动作输出”的全闭环加速 [9][12] - **并行解码**:将单步预测演进为“时域序列预测”,在一个推理周期内并行产出未来多步动作指令,消除了逐个Token产出的逻辑依赖,释放了异构硬件的并行计算潜能 [12] - **视觉剪枝**:引入面向自动驾驶场景的视觉剪枝技术,通过衡量特征向量间的余弦距离,在无须模型微调的前提下,实现了对冗余视觉信息的极高比例压缩,解决了传统注意力剪枝可能导致关键感知目标被误剔除的风险 [12] - **算子融合与混合量化**:实施异构精度策略,对视觉Transformer实施INT8 PTQ量化以提升吞吐,对语言内核采用W4A16量化以突破访存带宽瓶颈;同时进行深度算子融合,并将部分高频操作前移至预处理阶段,消除冗余计算 [12] - 通过上述优化,成功将10亿级参数VLA大模型的端到端推理时延从8000ms降低到78ms,其中并行解码模块将时延从2000ms降低至300ms,视觉剪枝模块将时延从170ms降低至130ms,整体性能提升102倍,这是业内首个将VLA大模型端到端推理时延稳定压缩至100ms以内的开源计算加速框架 [13] 技术突破二:通信革新构建高性能机制 - 从底层重构了面向异构计算单元(CPU-CPU、CPU-GPU、GPU-GPU)的统一高性能通信机制,构建了“轻量调度+极速流转”的混合模式 [14][16] - “轻量调度模式”专注于微秒级的逻辑信令通路,用于精细调度与同步唤醒;“极速模式”为大数据提供共享内存,从根本上革除了传统DDS协议中的序列化损耗与冗余拷贝 [16] - 通过地址映射实现CPU与GPU之间的数据直达,在GPU之间构建以共享内存为中枢的高速流转机制,实现了以“地址共享替代数据搬运”的“零拷贝”闭环 [16] - 在1MB至16MB的负载测试中,AutoDRRT 3.0展现出代差优势:在16MB大数据流转时,其时延表现较FastDDS提升了4至5.6倍,较CycloneDDS最高提升近35倍,实现了大数据负载下的微秒级确定性响应 [17] 技术突破三:调度革新实现异构算力统一编排 - 构建了一套面向多计算单元(CPU、GPU、AI加速单元)的异构算力统一调度机制,进行精细化管理,避免算力空转与链路阻塞 [18][20] - 在CPU侧,深度融合优先级与时间片轮转等调度策略,并结合精细化绑核控制,确保逻辑控制与关键任务的实时性 [18] - 在GPU侧,引入“优先级+流水线+全并行”的一体化调度架构:通过模型级优先级管理保障关键任务算力;借助异步流水线调度实现数据处理与模型推理的重叠执行;协同GPU与专用加速单元进行并行执行,最大化整体吞吐 [18][20] - 实测数据显示,该调度框架使逻辑响应时延降低31%,核心感知模型推理时延降低30%,VLA推理链路进一步压缩28%,端到端时延稳定性显著提升,推理时延由108ms缩减至78ms [21] 生态合作与商业化应用 - AutoDRRT已率先实现了对地平线征程6(J6)平台的深度原生支持,打通了底层芯片异构算力到上层通用软件栈的全链路,完成了ROS + Autoware.ai 以及 ROS2 + Autoware.universe 的全栈原生适配,成为行业首个适配该平台的开源自动驾驶框架 [21] - 基于J6域控+AutoDRRT,客户可实现方案的“开箱即用”与快速验证,覆盖无人配送与环卫小车等多元场景,助力无人车产品缩短研发周期,抢占商业化落地先机 [21] - 该框架为业界提供了首个面向VLA大模型、可在智驾域控平台运行的开源加速框架,验证了VLA大模型在车端实时闭环运行的工程可行性,为自动驾驶从“端到端感知”迈向“全场景通用智能”提供了系统基础 [23]
软件ETF(515230)涨超1.2%,行业景气度获市场关注
每日经济新闻· 2026-01-05 10:32
行业整体表现与市场关注 - 软件ETF(515230)在1月5日上涨超过1.2%,显示计算机与软件开发行业景气度获得市场关注 [1] - 软件ETF跟踪的软件指数(H30202)主要反映软件行业上市公司的整体表现,成分股涵盖系统软件、应用软件开发及相关服务企业 [2] - 该指数侧重于信息技术领域,具有较高的成长性和创新性特征,能够较好地代表软件行业相关上市公司的整体表现 [2] GPU芯片领域发展 - 天数智芯已形成天垓(训练)和智铠(推理)两大GPU系列,产品均价分别为3-4万元和1万元,并已实现小规模批量销售 [1] - 壁仞科技聚焦自研GPGPU芯片及智能算力解决方案,2025年在手订单超过12亿元 [1] - 壁仞科技的下一代BR20X芯片预计将于2026年实现商业化 [1] 大模型领域进展 - 智谱和MiniMax已通过港交所上市聆讯,分别代表ToB和ToC商业模式 [1] - 智谱背靠清华大学,模型能力国内领先,提供语言、多模态、智能体和代码模型,2024年收入为3.1亿元,同比增长150.9% [1] - MiniMax注重高效模型架构和产品迅速商业化,其ToC产品海螺AI和Talkie为核心收入来源,73.1%的收入来自海外 [1] AI服务器产品更新 - 浪潮信息推出了超节点AI服务器“元脑SD200”,该产品支持万亿参数大模型的推理 [1]