阿里巴巴，登顶全球开源模型！

模型性能 - 千问3在GPQA、AIME24/25、LiveCodeBench等多个权威基准测试中全面超越R1、OpenAI-o1等全球顶尖模型，登顶全球开源模型 [1] - 在奥数水平的AIME25测评中获得81.5分，刷新开源纪录 [1] - 在LiveCodeBench测评中突破70分大关，表现超过Grok3 [1] - 在Arena Hard测评中以95.6分超越OpenAI-o1及DeepSeek-R1 [1] - 采用混合专家架构，总参数量为235B，激活参数量仅需22B [2] 技术亮点 - 国内首个"混合推理模型"，集成"快思考"与"慢思考"，可在思考模式与非思考模式之间无缝切换 [3] - 提供8款不同尺寸的模型版本，包含2款30B、235B的混合专家模型和6款稠密模型 [3] - 推理能力显著提升，在数学、代码生成和常识逻辑推理方面超越QwQ和Qwen2.5 instruct models [4] - 支持MCP协议，具备强大的工具调用能力，在BFCL评测中拿下70.8的新高 [5] - 旗舰模型部署成本仅为满血版R1的25%—35%，成本大降75%—65% [5] 开源与应用 - 采用宽松的Apache2.0协议开源，首次支持119多种语言 [6] - 已上线魔塔社区、HuggingFace、Github等平台，全球开发者可免费下载模型并商用 [6] - 个人用户可通过通义APP直接体验，夸克即将全线接入 [6] - 阿里通义已开源200余个模型，全球下载量超3亿次，千问衍生模型数超10万个 [7] - 超越Meta的Llama，成为全球第一开源模型 [7]