中国电子：国产开源模型千帆竞发，阿里 Qwen-3、小米 MiMo、DeepSeek Prover 集中发布

报告行业投资评级未提及报告的核心观点 - 阿里 Qwen 当前位列开源大模型排行榜首，凭借领先性能及完善开源策略，未来有望在能力与生态变现方面持续领先，且部署成本显著降低 [2] - 随着国产模型开源增多，未来应用和商业化会面临同质化竞争问题，开源模型将向定制化演进，成熟 Agent 会改写行业格局，是 AI 商业化下个突破口 [5] 根据相关目录分别进行总结事件 - 2025 年 4 月 28 日，阿里发布新一代 Qwen - 3 系列大语言模型，含多个量级版本 [1] - 2025 年 4 月 30 日，小米发布并开源首个专为推理任务设计的大语言模型 Xiaomi MiMo；DeepSeek 团队在 Hugging Face 平台发布最新大语言模型 DeepSeek - Prover - V2 - 671B [1] 阿里 Qwen - 3 - 具备多尺寸覆盖能力，推出多个参数规模模型，能满足不同场景推理需求 [1] - 性能显著提升，在多项公开评测基准上，相较前代模型准确率提升 10–30% [1] - 引入先进稀疏注意力机制和推理加速技术，相同硬件资源下推理速度提高 20%–40%，增强实用性和部署效率 [1] 小米 Xiaomi MiMo - 70 亿参数规模，在数学推理和代码生成等任务中性能卓越，超越部分更大规模模型 [3] - 采用三阶段逐步提升难度训练方法，总计训练 25T tokens 增强推理能力 [3] - 后训练阶段引入“测试难度驱动奖励”机制，结合“简单数据重采样”策略和“无缝推出系统”，提升强化学习稳定性和训练效率，使强化学习训练速度提升 2.29 倍、验证过程加快 1.96 倍 [3] DeepSeek - Prover - V2 - 671B - 在数学定理证明任务中表现出色，特别是形式化数学证明领域 [4] - 发布展示了 DeepSeek 在大模型领域技术实力，预示其在形式化推理和专业领域应用的战略布局 [4] - 上线可能为即将发布的 DeepSeek - R2 模型做能力验证或预热，显示推动 AI 技术向更深层次发展的决心 [4]