Seek .-阿里开源千问3模型成本仅需DeepSeek-R1三分之一

阿里通义千问3模型发布 - 阿里开源新一代通义千问模型Qwen3，参数量235B，激活仅需22B，成本大幅下降，性能全面超越DeepSeek-R1、OpenAI-o1等全球顶尖模型 [1] - 千问3是国内首个"混合推理模型"，集成"快思考"与"慢思考"，对简单需求可低算力"秒回"答案，对复杂问题可多步骤"深度思考"，大大节省算力消耗 [1] - 千问3采用混合专家（MoE）架构，预训练数据量达36T，并在后训练阶段多轮强化学习，将非思考模式无缝整合到思考模型中 [1] 性能表现 - 千问3在AIME25测评中斩获81.5分，刷新开源纪录；在LiveCodeBench评测中突破70分，表现超过Grok3；在ArenaHard测评中以95.6分超越OpenAI-o1及DeepSeek-R1 [2] - 千问3仅需4张H20即可部署满血版，显存占用仅为性能相近模型的三分之一 [2] - 千问3在BFCL评测中创下70.8的新高，超越Gemini2.5-Pro、OpenAI-o1等顶尖模型 [5] 模型版本与部署 - 千问3提供2款30B、235B的MoE模型，以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型，每款模型均斩获同尺寸开源模型最佳性能 [4] - 千问3的30B参数MoE模型实现了10倍以上的模型性能杠杆提升，仅激活3B就能媲美上代Qwen2.5-32B模型性能 [4] - 32B版本的千问3模型可跨级超越Qwen2.5-72B性能 [4] - 4B模型适合手机端，8B可在电脑和汽车端侧部署，32B最受企业大规模部署欢迎 [4] 应用支持与开源 - 千问3原生支持MCP协议，具备强大的工具调用能力，结合Qwen-Agent框架可大大降低编码复杂性 [5] - 千问3系列模型采用Apache2.0协议开源，支持119多种语言，全球开发者、研究机构和企业可免费下载并商用 [5] - 阿里通义已开源200余个模型，全球下载量超3亿次，千问衍生模型数超10万个，已超越美国Llama [6] - 个人用户可通过通义APP体验千问3，夸克即将全线接入千问3 [6]