Mid-Training
搜索文档
Mid-Training 会成为未来的 Pre-Training 吗?
机器之心· 2025-11-23 09:30
OpenAI 一年前就布局「Mid-Training」了?Mid-Training 和预训练&后训练有什么关系?为什么 Mid-Training 定义不清晰却颇受关注?高校与企业研究者分别如何定义 Mid-Training?非公式 下 Mid-Training 有望成为下一个 Pre-Training 吗?... 2. 从 Apple M5 到 DGX Spark ,Local AI 时代的到来还有多久? 机器之心PRO · 会员通讯 Week 47 --- 本周为您解读 ③ 个值得细品的 AI & Robotics 业内要事 --- 1. Mid-Training 会成为未来的 Pre-Training 吗? DGX Spark 从 DGX-1 的「云端起点」走到「桌面回迁」,Local AI 的拐点已到?Apple Silicon 等硬件如何把本地工作负载变成可用体验?Ollama 等用户级运行时叠加 Gemma 3 等端侧模型 供给,会催生什么样的本地产品形态?SLM 和端侧芯片新架构的结合,会把消费终端 Local AI 的能力边界推到哪一步?... 3. 「人本主义超级智能」未来走得更远?微软为何选 ...
电子行业跟踪周报:三季度AI业绩持续兑现,Mid-trAIning开启结构化智能新阶段-20251026
东吴证券· 2025-10-26 17:38
行业投资评级 - 电子行业投资评级为“增持”,且维持该评级 [1] 核心观点 - 三季度AI产业链公司业绩表现强劲,带动市场情绪回升,AI业绩持续兑现 [1] - Mid-Training标志着AI训练进入“资本效率”拐点,构建从预训练、中期训练到后训练的三段式架构,以质量驱动替代规模堆叠 [3] - AI算力驱动下的光互连需求增长趋势明显,1.6T光模块持续加单,景气扩张趋势有望传导至PCB、铜连接、液冷、服务器代工等环节 [2] - 高功率AI服务器机柜持续演进,带动高端材料等需求全面升级,具备技术壁垒与规模优势的企业将受益于本轮AI硬件景气上行周期 [2] 市场表现与短期催化 - 本周AI产业链股价强势反弹,数通PCB/CCL板块中生益电子股价上涨29.35%,胜宏科技上涨19.13%,景旺电子上涨17.41% [1] - 铜连接板块瑞可达股价上涨9.76%,华丰科技上涨9.19% [1] - 光芯片/光器件板块源杰科技股价上涨38.00%,仕佳光子上涨24.63%,长光华芯上涨17.71%,太辰光上涨14.01% [1] - 液冷板块思泉新材股价上涨20.33%,英维克上涨7.45%;服务器代工板块工业富联上涨12.06%,华勤技术上涨4.48% [1] - 后续需关注海外CSP等大厂财报披露,可能迎来新催化 [1] 海外公司业绩印证 - 安费诺FY25Q3营收创单季历史记录,达61.94亿美元,同比增长53.35%,环比增长9.63%,超出指引上限(54-55亿美元)[4] - 安费诺FY25Q3毛利率为38.09%,同比提升4.49个百分点,环比提升1.75个百分点 [4] - 安费诺通信解决方案部门营收33.1亿美元,同比大幅增长96.35% [4] - 安费诺预计第四季度营收为60-61亿美元,全年预计营收226.6-227.6亿美元,按中值计算同比增长49.5% [4] - 维谛FY25Q3营收为26.76亿美元,同比增长60%,环比增长20%,超出指引上限 [8] - 维谛FY25Q3毛利率为37.77%,同比提升1.29个百分点,环比提升3.81个百分点 [8] - 维谛三季度订单环比增加10亿美元,未交付订单总额达95亿美元 [8] - 维谛预计第四季度营收为28.1-28.9亿美元,全年预计营收101.6-102.4亿美元,按中值计算同比增长27% [9] PCB产业景气度 - 生益电子Q3预计实现营业收入28.45-32.65亿元,按中值计算同比增长153%,环比增长39.6% [10] - 生益电子Q3预计实现归母净利润5.43-6.23亿元,按中值计算同比大幅增长547.8%,环比增长76.7%,业绩超预期 [10] - 生益科技Q3业绩符合预期,预计实现归母净利润9.94-10.34亿元,按中值计算同比增长130.5%,环比增长17.5% [10] - AI服务器与高速网络设备放量推动M9 CCL材料对应的PCB产业链规模快速增长 [11] - M9材料应用方向包括Rubin系列新增的CPX模块与正交中板、1.6T交换机支持224G传输速率、以及未来ASIC升级迭代 [11] Mid-Training范式演变 - Mid-Training依赖于强化学习与合成数据的精确提效,将算力从成本项转化为驱动模型迭代的“主动资本” [3][17] - 该过程需要大量算力支撑数据处理,通过复利式持续投入强化模型能力,有望进一步推动算力需求增长 [3] - Mid-Training通过剔除噪声语料、引入高质量或合成数据,实现从“规模驱动”向“质量驱动”的转变 [13] - 其底层机制基于梯度噪声优化、信息瓶颈压缩及课程学习三大路径,实现模型由“记忆模式”向“抽象理解”的跃迁 [14] - Mid-Training已成为头部实验室算力消耗的核心驱动,取代Pre-Training成为新的竞争焦点 [17] 产业链相关公司 - PCB/CCL板块包括胜宏科技、沪电股份、深南电路、景旺电子等公司 [19] - 铜缆/铜连接板块包括沃尔核材、兆龙互连、华丰科技、立讯精密等公司 [19] - 光芯片/光器件板块包括长芯博创、源杰科技、仕佳光子、太辰光等公司 [19] - 液冷板块包括英维克、思泉新材、申菱环境、高澜股份等公司 [19] - 服务器代工板块包括工业富联、华勤技术等公司 [19]