报告行业投资评级 未提及 报告的核心观点 - 阿里 Qwen 当前位列开源大模型排行榜首,凭借领先性能及完善开源策略,未来有望在能力与生态变现方面持续领先,且部署成本显著降低 [2] - 随着国产模型开源增多,未来应用和商业化会面临同质化竞争问题,开源模型将向定制化演进,成熟 Agent 会改写行业格局,是 AI 商业化下个突破口 [5] 根据相关目录分别进行总结 事件 - 2025 年 4 月 28 日,阿里发布新一代 Qwen - 3 系列大语言模型,含多个量级版本 [1] - 2025 年 4 月 30 日,小米发布并开源首个专为推理任务设计的大语言模型 Xiaomi MiMo;DeepSeek 团队在 Hugging Face 平台发布最新大语言模型 DeepSeek - Prover - V2 - 671B [1] 阿里 Qwen - 3 - 具备多尺寸覆盖能力,推出多个参数规模模型,能满足不同场景推理需求 [1] - 性能显著提升,在多项公开评测基准上,相较前代模型准确率提升 10–30% [1] - 引入先进稀疏注意力机制和推理加速技术,相同硬件资源下推理速度提高 20%–40%,增强实用性和部署效率 [1] 小米 Xiaomi MiMo - 70 亿参数规模,在数学推理和代码生成等任务中性能卓越,超越部分更大规模模型 [3] - 采用三阶段逐步提升难度训练方法,总计训练 25T tokens 增强推理能力 [3] - 后训练阶段引入“测试难度驱动奖励”机制,结合“简单数据重采样”策略和“无缝推出系统”,提升强化学习稳定性和训练效率,使强化学习训练速度提升 2.29 倍、验证过程加快 1.96 倍 [3] DeepSeek - Prover - V2 - 671B - 在数学定理证明任务中表现出色,特别是形式化数学证明领域 [4] - 发布展示了 DeepSeek 在大模型领域技术实力,预示其在形式化推理和专业领域应用的战略布局 [4] - 上线可能为即将发布的 DeepSeek - R2 模型做能力验证或预热,显示推动 AI 技术向更深层次发展的决心 [4]
中国电子:国产开源模型千帆竞发,阿里 Qwen-3、小米 MiMo、DeepSeek Prover 集中发布