万亿参数思考模型
搜索文档
蚂蚁开源万亿思考模型Ring-2.5-1T,强代码与Agent能力
凤凰网· 2026-02-13 16:07
模型发布与核心能力 - 蚂蚁集团开源发布全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T [1] - 该模型在长文本生成、数学推理与智能体任务执行上达到开源领先水平 [1] - 模型旨在为智能体(Agent)时代的复杂任务处理提供高性能基础支撑 [1] 性能表现与效率提升 - 在32K以上长文本生成场景中,对比上代模型访存规模降低10倍以上,生成吞吐提升3倍以上 [1] - 模型激活参数规模从前代的51B提升至63B,但在混合线性架构下推理效率相比上一代大幅提升 [3] - 与仅具备32B激活参数的KIMI K2架构相比,在1T总参数量下,Ling2.5架构在长序列推理任务中的吞吐表现优势显著,且随着生成长度增加效率优势持续扩大 [3] 深度思考与推理能力 - 在国际数学奥林匹克竞赛(IMO2025)和中国数学奥林匹克(CMO2025)自测均达到金牌水平(IMO35分、CMO105分) [1] - 在深度思考模式下,于IMOAnswerBench、HMMT-25等数学竞赛推理基准和LiveCodeBench-v6代码生成基准中超越所有对比模型 [2] - 在数学推理、代码生成、逻辑推理和智能体任务执行等高难场景中达到开源领先水平 [2] 技术架构与兼容性 - 模型基于Ling2.5架构,通过优化注意力机制显著提升长文本推理的效率与稳定性 [3] - 可轻松适配Claude Code等智能体框架与OpenClaw个人AI助理,支持多步规划与工具调用 [1] 行业对比与市场定位 - 在多项权威基准测试中,与DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking、GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking等主流开源与闭源模型进行了系统对比 [2] - 展现了强大的复杂推理与跨任务泛化能力 [2] 发布与获取方式 - 模型权重与推理代码已在Hugging Face、ModelScope等主流开源平台发布 [3] - 官方平台Chat体验页和API服务将在近期上线 [3]
蚂蚁开源万亿参数思考模型 Ring-1T,综合能力逼近 GPT-5、数学能力对标 IMO 银牌
AI前线· 2025-10-15 15:45
模型发布与核心能力 - 蚂蚁集团正式推出并开源万亿参数思考模型Ring-1T [2] - 模型在IMO2025赛题解题中达到银牌水平 一次解出第1、3、4、5题 [2] - 在人类偏好对齐测试Arena-Hard V2中取得81.59%的成功率 位居开源模型榜首 [3] - 在医疗问答HealthBench测评中以最高分取得开源领域最佳成绩 [3] 技术创新与工程实现 - 采用自研"棒冰(icepop)"算法解决万亿参数模型训推精度差异难题 [5] - 自研高性能强化学习系统ASystem 实现单机显存碎片秒级回收和权重零冗余交换 [6] - 模型基于Ling 2.0架构 采用稀疏MoE、1/32专家激活比、FP8混合精度等技术 [8] - 通过LongCoT-SFT + RLVR + RLHF多阶段后训练提升复杂推理和通用能力 [8] 产品矩阵与战略发展 - 蚂蚁百灵大模型已发布18款模型 形成从160亿到1万亿参数的产品矩阵 [9] - 拥有两款万亿参数模型:通用大语言模型Ling-1T和思考模型Ring-1T [9] - 随着两款万亿模型发布 百灵大模型正式步入2.0阶段 [9]