百度发布文心X1.1深度思考模型:多个基准测试达到SOTA,同步开源一款轻量化模型
IPO早知道·2025-09-09 18:47
文心大模型X1.1升级 - 百度发布文心大模型X1.1深度思考模型 基于文心大模型4.5训练 采用迭代式混合强化学习训练框架 [2][3][4] - 模型在事实性提升34.8% 指令遵循提升12.5% 智能体提升9.6% [4] - 在多个基准测试中整体表现超越DeepSeek R1-0528 部分任务领先 与国际顶尖模型GPT-5和Gemini 2.5 Pro效果持平 [5] 模型部署与生态 - 文心大模型X1.1已在文心一言官网和文小言APP上线 并对企业客户及开发者全面开放 [7] - 飞桨文心生态开发者达到2333万 服务企业达到76万家 [8] - 飞桨核心框架v3.2发布 在大模型训练、硬件适配和生态支持上全面升级 [7] 开源模型ERNIE-4.5-21B-A3B-Thinking - 百度开源轻量化思考模型ERNIE-4.5-21B-A3B-Thinking 采用混合专家架构 总参数规模210亿 每个token激活30亿参数 [9][10] - 模型支持128K上下文窗口 适用于复杂推理任务 在逻辑推理、数学、科学、代码与文本生成等任务实现显著提升 [10] - 模型以Apache License 2.0协议开源 允许商业使用 已在HuggingFace、星河社区等平台发布 [10] 模型性能与行业应用 - ERNIE-4.5-21B-A3B-Thinking作为轻量级模型 在各项测试中表现紧追业界顶级大尺寸模型 实现接近SOTA的智能表现 [11] - 百度于6月30日开源文心大模型4.5系列模型 涵盖47B、3B等10款模型 预训练权重和推理代码完全开源 [13] - 文心开源系列模型已在行业中得到广泛应用 [13]