Workflow
深度思考大模型
icon
搜索文档
2025年上汽集团自主品牌销量占比首超65%
中国证券报· 2026-01-09 04:50
文章核心观点 - 2025年中国汽车市场进入存量博弈下的竞争深化阶段,上汽集团通过结构性调整实现逆势增长,其转型路径为传统车企智能化升级提供了参考 [1] 整体经营业绩 - 2025年全年整车销量达450.7万辆,同比增长12.3%,终端零售量高于批发量 [1] - 前三季度营收达4689.9亿元,归母净利润达81.01亿元,分别同比增长9%和17.3% [1] - 自主品牌销量占比首次超过65%,新能源汽车销量突破164.3万辆,海外市场销量达107.1万辆 [1] 自主品牌业务 - 2025年自主品牌销量达292.8万辆,同比增长21.6%,在集团总销量中占比从2024年的60%提升至65% [1] - 上汽乘用车旗下荣威、MG品牌国内销量同比增长245.3% [2] - MG品牌在欧洲市场销量达30万辆,同比增长近30%,连续11年蝉联中国汽车品牌欧洲销量冠军;在英国市场累计销量突破37万辆,纯电车型占比超27% [2] - 高端品牌智己汽车全年销量达8.1万辆,同比增长23.68%,LS6车型上市27分钟锁单破万 [2] - 上汽通用五菱年销量163.5万辆,新能源车型年销量首次突破百万辆,宏光MINIEV家族累计销量超185万辆 [2] 合资品牌业务 - 合资品牌板块形成“自主引领、合资托底”的风险抵御格局 [2] - 上汽大众全年终端销量达106万辆,2025年12月销量环比增长10.9%,电动化车型占比提升至15% [2] - 上汽通用全年销量同比下滑16.5%,但通过产品结构优化实现连续5个季度盈利,别克至境L7等新能源车型上市10天大定突破1.2万辆 [2] 海外市场布局 - 2025年海外销量达107.1万辆,同比增长3.1%,其中自主品牌海外销量占比达75% [3] - 采用“本地化研发+本地化生产+本地化运营”全产业链布局战略 [3] - 泰国、印尼工厂合计50万辆/年产能稳步释放,墨西哥工厂精准切入北美市场 [3] - MG品牌在意大利、西班牙、法国等国累计销量均突破10万辆,跻身欧洲主流汽车品牌阵营 [3] 技术研发与创新 - 近十年累计投入超1500亿元用于电动化、智能化技术研发,累计形成近2.6万项有效专利 [3] - MG4半固态安芯版以9.98万元限时补贴价实现技术普及,累计订单突破7.5万辆,连续三个月单月销量破万辆 [4] - 智己LS9搭载的恒星超级增程系统实现1508公里综合续航,刷新增程车型续航纪录 [4] - 荣威M7 DMH以46.3%的超级混动热效率和2050公里综合续航,精准解决用户续航焦虑 [4] - 作为行业内唯一同时拥有乘用车和商用车L4级智能网联商业化示范运营双牌照的企业,智己Robotaxi累计订单量突破30万单 [4] - 与OPPO合作打造“手车互联”系统及联合开发深度思考大模型 [4] 核心零部件与产业生态 - 通过超180亿元战略直投,精准布局芯片、电池材料、智能硬件等关键产业链环节,推动24家被投企业实现IPO,形成“投运结合”的产业生态 [4] - 自研魔方电池保持零自燃安全纪录,灵蜥数字底盘实现操控性能与安全防护的双重提升 [4] 体系变革与市场响应 - 通过组建大乘用车板块,打破乘用车业务、海外业务、研发体系等板块间的协同壁垒 [5] - 体系优化直接提升市场响应速度,2025年下半年密集推出的荣威飞凡序列F7换电版、MG4半固态版、尚界H5等车型均实现上市即热销 [5][6] 未来展望 - 随着全固态电池、高阶自动驾驶等前沿技术的量产落地,以及海外本地化产能的持续释放,公司有望在巩固国内市场优势的基础上,进一步提升全球产业链话语权 [6]
经验记忆黑科技!LightSearcher让AI工具调用减39.6%、推理快48.6%
量子位· 2025-12-18 17:26
文章核心观点 - 深度思考大模型在利用外部搜索工具(DeepSearch)提升推理准确性时,面临准确率与效率难以兼顾的“跷跷板”困境 [1] - 北京邮电大学百家AI团队提出的LightSearcher框架,通过基于经验记忆的强化学习优化技术,有效解决了这一困境,在保持顶尖准确率的同时,显著提升了工具调用效率 [1][14] 深度思考大模型的困境与挑战 - **困境本质**:频繁调用外部搜索工具能补充实时与领域知识、提升推理准确性与事实可靠性,但会导致计算开销激增、推理延迟大幅升高,等待时间可达几十秒至几分钟 [1][4][5] - **用户体验风险**:信息加载时间超过10秒会导致50%的移动用户放弃访问,长时推理等待存在类似的用户流失风险 [6][7] - **效率妥协的代价**:反之,若为提升效率而减少工具调用,则会因大语言模型内部知识局限,导致推理结果的准确性与完整性不足 [8] - **现有方法的缺陷**:提示工程或监督学习方法依赖人工标注,成本高且泛化差;而强化学习驱动的方法奖励偏重准确性,易导致模型为确保正确而过度调用工具,造成冗余开销和效率低下 [10][11][12][13] LightSearcher框架的解决方案 - **核心思路**:在强化学习推理过程中,通过“对比经验学习”将隐性推理轨迹转化为显性指导经验,并结合自适应奖励来优化工具调用策略 [14][15] - **关键组件一:对比经验推理机制**:收集高质量与低质量的推理轨迹,通过大语言模型生成成功模式的自然语言总结,构建动态经验记忆库 [16] - **关键组件二:自适应奖励塑造机制**:引入最小工具调用基准,仅在答案正确时惩罚冗余调用,并使用指数衰减函数动态平衡准确性和效率,避免盲目优化 [16] - **关键组件三:基于经验的强化学习训练机制**:采用GRPO算法,将积累的经验和少样本示例融入提示模板,指导模型生成高效推理轨迹,确保探索与利用的均衡 [16] - **优化目标**:最终优化目标为多目标奖励函数的加权和,旨在协同提升工具调用精简度与答案质量 [18] 实验性能与效果 - **准确性保持顶尖**:在四个多跳QA基准数据集上的实验显示,LightSearcher在F1分数和大语言模型评判得分上与当前最优的ReSearch基线相当,部分数据集上甚至更优 [19][22] - **效率显著提升**:与基线相比,搜索工具调用次数减少39.6%,推理时间缩短48.6%,Token消耗降低21.2% [2] - **泛化能力强**:在不同难度的查询上表现稳定,在域外测试集上也超越了依赖固定检索的迭代方法 [23] - **消融实验验证核心作用**:移除经验记忆组件导致F1分数下降7.2%,证明其核心作用;同时移除经验与少样本示例则导致F1分数下降8.8% [24][25] 技术意义与应用前景 - **技术路径创新**:该框架通过“对比经验”的设计思想,将隐性推理轨迹转化为可解释的指导,为构建高效、可靠的深度思考系统提供了新的技术路径 [27] - **成功解决关键痛点**:实现了从隐性到显性的经验转化、通过自适应奖励精准平衡调用、优先保证效率、以及对推理质量和执行效率的双重优化 [27] - **领域扩展性**:目前研究限于多跳问答领域,未来有潜力扩展到代码合成、策略规划等其他复杂推理任务领域 [26]
经验记忆黑科技:LightSearcher让AI工具调用减39.6%、推理快48.6%
机器之心· 2025-12-17 13:28
深度思考大模型面临的效率困境 - 以DeepSeek-R1为代表的深度思考大模型依赖DeepSearch作为核心搜索器,通过迭代调用外部搜索工具来提升推理深度和事实可靠性[2] - 现有强化学习驱动的系统面临准确率与效率的“跷跷板”困境:频繁调用搜索工具虽能提升准确性,但导致计算开销大、效率低下[2] - 高频调用外部搜索工具使推理延迟大幅升高,等待时间可达几十秒至几分钟,超过50%的移动用户会在信息加载时间超过10秒后放弃访问[2] LightSearcher框架的技术创新 - 北邮百家AI团队提出LightSearcher框架,首创基于经验记忆的高效强化学习优化技术,通过引入文本化经验记忆和自适应奖励塑造机制解决效率痛点[3] - 框架核心思路是将隐性推理轨迹转化为显性指导经验,并结合自适应奖励优化工具调用,包含对比经验推理机制、自适应奖励塑造机制和基于经验的强化学习训练机制三大关键组件[9][14] - 模型最终优化目标为多目标奖励函数的加权和,旨在协同提升工具调用精简度与答案质量[11] LightSearcher的实验性能表现 - 研究团队在四个多跳问答基准数据集上进行了全面评估,实验结果显示该框架在保持与最先进基线ReSearch相当准确率的同时,效率显著提升[3][13] - 具体性能提升包括:搜索工具调用次数减少39.6%,推理时间缩短48.6%,Token消耗降低21.2%[3][18] - 消融实验表明,移除经验记忆组件导致F1分数下降7.2%,证明了该组件的核心作用[16] 框架解决的问题与优势 - 解决了现有方法依赖人工标注成本高、泛化差,以及强化学习方法奖励偏重准确性导致工具过度调用的问题[7] - 克服了工具调用“过度依赖”问题,避免了模型对简单查询也反复检索导致的推理时间延长和Token消耗激增[7] - 成功平衡了准确性与效率,部分模型变体在移除自适应奖励后,工具调用次数从1.62次升至2.06次,显示该机制对控制调用频率的关键作用[17] 技术影响与未来潜力 - LightSearcher通过“对比经验”设计思想,将对比轨迹转化为可解释的推理指导,实现了从隐性到显性的知识转化[19] - 该框架在不同难度的查询上均表现稳定,即使在域外测试集也能超越依赖固定检索的迭代方法,显示出强大的泛化能力[18] - 尽管目前研究限于多跳问答领域,但该框架为构建高效、可靠的深度推理系统提供了新路径,未来可扩展到代码合成、策略规划等领域[17][20]