Workflow
阿里开源千问3模型 成本仅需DeepSeek-R1三分之一
21世纪经济报道·2025-04-29 08:24

阿里通义千问3模型发布 - 阿里开源新一代通义千问模型Qwen3,参数量235B,激活仅需22B,成本大幅下降,性能全面超越DeepSeek-R1、OpenAI-o1等全球顶尖模型 [1] - 千问3是国内首个"混合推理模型",集成"快思考"与"慢思考",对简单需求可低算力"秒回"答案,对复杂问题可多步骤"深度思考",大大节省算力消耗 [1] - 千问3采用混合专家(MoE)架构,预训练数据量达36T,并在后训练阶段多轮强化学习,将非思考模式无缝整合到思考模型中 [1] 性能表现 - 千问3在AIME25测评中斩获81.5分,刷新开源纪录;在LiveCodeBench评测中突破70分,表现超过Grok3;在ArenaHard测评中以95.6分超越OpenAI-o1及DeepSeek-R1 [2] - 千问3仅需4张H20即可部署满血版,显存占用仅为性能相近模型的三分之一 [2] - 千问3在BFCL评测中创下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等顶尖模型 [5] 模型版本与部署 - 千问3提供2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,每款模型均斩获同尺寸开源模型最佳性能 [4] - 千问3的30B参数MoE模型实现了10倍以上的模型性能杠杆提升,仅激活3B就能媲美上代Qwen2.5-32B模型性能 [4] - 32B版本的千问3模型可跨级超越Qwen2.5-72B性能 [4] - 4B模型适合手机端,8B可在电脑和汽车端侧部署,32B最受企业大规模部署欢迎 [4] 应用支持与开源 - 千问3原生支持MCP协议,具备强大的工具调用能力,结合Qwen-Agent框架可大大降低编码复杂性 [5] - 千问3系列模型采用Apache2.0协议开源,支持119多种语言,全球开发者、研究机构和企业可免费下载并商用 [5] - 阿里通义已开源200余个模型,全球下载量超3亿次,千问衍生模型数超10万个,已超越美国Llama [6] - 个人用户可通过通义APP体验千问3,夸克即将全线接入千问3 [6]