Workflow
阿里巴巴,登顶全球开源模型!

模型性能 - 千问3在GPQA、AIME24/25、LiveCodeBench等多个权威基准测试中全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球开源模型 [1] - 在奥数水平的AIME25测评中获得81.5分,刷新开源纪录 [1] - 在LiveCodeBench测评中突破70分大关,表现超过Grok3 [1] - 在Arena Hard测评中以95.6分超越OpenAI-o1及DeepSeek-R1 [1] - 采用混合专家架构,总参数量为235B,激活参数量仅需22B [2] 技术亮点 - 国内首个"混合推理模型",集成"快思考"与"慢思考",可在思考模式与非思考模式之间无缝切换 [3] - 提供8款不同尺寸的模型版本,包含2款30B、235B的混合专家模型和6款稠密模型 [3] - 推理能力显著提升,在数学、代码生成和常识逻辑推理方面超越QwQ和Qwen2.5 instruct models [4] - 支持MCP协议,具备强大的工具调用能力,在BFCL评测中拿下70.8的新高 [5] - 旗舰模型部署成本仅为满血版R1的25%—35%,成本大降75%—65% [5] 开源与应用 - 采用宽松的Apache2.0协议开源,首次支持119多种语言 [6] - 已上线魔塔社区、HuggingFace、Github等平台,全球开发者可免费下载模型并商用 [6] - 个人用户可通过通义APP直接体验,夸克即将全线接入 [6] - 阿里通义已开源200余个模型,全球下载量超3亿次,千问衍生模型数超10万个 [7] - 超越Meta的Llama,成为全球第一开源模型 [7]