文章核心观点 - 阿里巴巴正式发布其旗舰推理大模型Qwen3-Max-Thinking,该模型在规模、推理能力和原生智能体(Agent)能力上实现重大突破,并在关键基准测试中刷新纪录 [1][2][3] - 公司正加速AI生态整合,将千问大模型深度接入其广泛的C端产品与业务场景,推动AI从“炫技”走向“办事”,旨在打造AI时代的“超级App”和第一入口 [4][5] - 行业观点认为,阿里的生态整合模式重新定义了AI应用的“入口”价值逻辑,其“训练-部署-应用-反馈”的闭环飞轮和真实业务数据反哺,构成了强大的可持续竞争力 [6] 模型技术突破与性能 - 模型规模创纪录:Qwen3-Max-Thinking总参数量超万亿(1T),预训练数据量高达36T Tokens,是公司目前规模最大、能力最强的推理大模型 [3] - 推理机制革新:模型采用全新的测试时扩展(Test-time Scaling)机制,能对推理结果进行“经验提取”式提炼并进行多轮自我迭代,从而在相同上下文中实现更高效、更智能的推理 [2] - 基准测试领先:在启用工具的“人类最后的测试”(HLE)中,千问得分58.3,大幅超过GPT-5.2-Thinking的45.5和Gemini 3 Pro的45.8,获得当前所有模型的最高分 [2] - 原生智能体能力增强:通过基于规则奖励与模型奖励的联合强化学习训练,模型大幅增强了自主调用工具的原生Agent能力,能更智能地结合工具进行思考 [2] - 降低模型幻觉:模型在自主调用搜索、个性化记忆和代码解释器等核心Agent工具时,幻觉有所降低 [4] 生态发展与商业化落地 - C端事业群成立与整合:公司于2025年12月初正式成立千问C端事业群,整合智能信息、智能互联、千问App、夸克及AI硬件等多条C端产品线,明确将千问App打造为面向用户的“超级App”与AI时代的第一入口 [5] - 千问App功能升级:千问App于1月15日完成新一轮功能升级,全面接入淘宝、支付宝、飞猪、高德等阿里生态业务,上线生活、政务、工作、教育四大场景多项办事功能,从“聊天对话”工具迈入“办事时代” [5] - 硬件产品能力更新:搭载千问AI助手的夸克AI眼镜在2025年12月31日迎来首次OTA,新增录音纪要、图文备忘录、大模型多意图理解和执行等五项新功能 [5] - 未来生态接入计划:未来,优酷、大麦、菜鸟驿站、阿里健康、1688、盒马等更多阿里生态业务也将陆续接入千问,进一步拓展场景覆盖与服务深度 [5] 行业影响与竞争力分析 - 重新定义入口价值:千问的生态整合模式对国内AI应用产业的核心影响在于重新定义了“入口”价值逻辑,促使行业竞争从单一模型能力转向全维度比较 [6] - 中小型应用面临选择:在阿里、字节等头部玩家生态化竞争下,中小型AI应用有望加速接入头部生态换取流量,或聚焦垂直领域开拓新空间 [6] - 构建闭环飞轮优势:公司AI生态已从“单点模型突破”迈向“全栈协同落地”,依托通义千问大模型、阿里云算力底座与电商、物流、本地生活等高频场景,构建了“训练—部署—应用—反馈”的闭环飞轮 [6] - 形成可持续竞争力:其独特优势在于真实业务数据反哺模型迭代,形成技术与商业的正向循环,具备强大的可持续竞争力 [6] 市场表现与社区影响力 - 开源社区数据亮眼:AI开源社区Hugging Face最新数据显示,阿里千问衍生模型数突破20万个,同时千问系列模型下载量突破10亿次,平均每天被下载110万次,已完全超越美国Llama [4]
阿里新版推理模型性能和效率显著提升