千问旗舰推理模型Qwen3-Max-Thinking发布 - 公司正式发布千问旗舰推理模型Qwen3-Max-Thinking,该模型总参数量超万亿(1T),预训练数据量高达36T Tokens,是公司规模最大、能力最强的千问推理模型 [3] - 新模型在科学知识(GPQA Diamond)、数学推理(IMO-AnswerBench)、代码编程(LiveCodeBench)等多项关键性能基准测试中刷新全球纪录 [1] - 在涵盖事实知识、复杂推理、指令遵循等19个大模型基准测试中,模型刷新了数项最佳表现纪录,整体性能可媲美GPT-5.2-Thinking-xhigh、Claude Opus 4.5和Gemini 3 Pro [3] - 模型增强了面向智能体时代的原生Agent能力,通过联合强化学习训练,拥有更智能结合工具进行思考的能力,可自主调用搜索、个性化记忆和代码解释器等工具,并降低了模型幻觉 [3] 模型应用与生态接入 - 开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取API服务,普通用户可通过千问PC端和网页端试用,千问APP也即将接入新模型 [4] - 千问APP已全面接入淘宝、支付宝、飞猪、高德等阿里生态业务,实现点外卖、购物、订机票等AI购物功能,并向所有用户开放测试 [6] - 此次升级上线超过400项AI办事功能,AI在拥有超强大脑之后,开始长出了能够触达真实世界的手和脚 [6] - 公司利用阿里巴巴的交易和服务数据来增强模型,以保障AI购物功能保持客观和准确 [6] - 千问APP已接入支付宝政务服务,并实现跨应用协同能力,例如调用飞猪订票、调用高德规划行程 [7] - 基于千问底层技术的“任务助理”功能已启动定向邀测,具备类人化的多步骤规划能力,覆盖应用开发、Office办公、咨询调研及生活办事等核心场景,测试结束后将免费开放 [7] 公司AI战略与未来展望 - 公司CEO吴泳铭认为大模型是下一代操作系统,AI云是下一代计算机,未来全世界可能只有五六个超级云计算平台 [9] - 公司正积极推进3800亿元的AI基础设施建设,并计划追加更大的投入 [9] - 实现AGI(通用人工智能)已是确定性事件,但仅是起点,终极目标是发展出能自我迭代、全面超越人类的ASI(超级人工智能),以解决气候、能源、星际旅行等重大科学难题 [9] - 通往超级人工智能之路分为三个阶段:智能涌现、自主行动(当前阶段)、自我迭代 [9] - 在未来几乎所有链接真实世界的工具接口都将与大模型连接,所有用户需求和行业应用将会通过大模型相关的工具执行任务 [9] - 公司计划最终通过海外版本向全球扩张,CEO吴泳铭已从各部门调集了超过百名开发人员投入到此次项目中 [7] - 这是2025年公司宣布的额外AI基础设施投入的一部分,反映了公司既要开发服务,也要开发支撑该技术的基础设施的意图 [7]
阿里正式发布!千问最强模型来了