Workflow
阿里发布新一代千问3模型,其8种模型版本全部开源
贝壳财经·2025-04-29 10:37

模型性能与架构 - 新一代通义千问模型Qwen3采用混合专家(MoE)架构,总参数量235B,激活仅需22B [3] - 预训练数据量达36T,并在后训练阶段多轮强化学习,将非思考模式无缝整合到思考模型中 [3] - 在推理、指令遵循、工具调用、多语言能力等方面均大幅增强,创下国产及全球开源模型性能新高 [3] - 在AIME25测评中斩获81.5分,LiveCodeBench评测突破70分,ArenaHard测评以95.6分超越OpenAI-o1及DeepSeek-R1 [3] 成本与部署优势 - 参数量仅为DeepSeek-R1的1/3,成本大幅下降 [1] - 仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一 [3] - 提供丰富的模型版本,包含2款MoE模型和6款密集模型,每款均获同尺寸开源模型最佳性能 [4] - 30B参数MoE模型实现10倍以上性能杠杆提升,32B版本可跨级超越Qwen2.5-72B性能 [4] 应用场景与生态 - 4B模型适合手机端,8B模型适合电脑和汽车端,32B模型受大规模部署企业欢迎 [5] - 采用Apache2.0协议开源,支持119种语言,全球开发者可免费下载商用 [5] - 个人用户可通过通义APP体验,夸克即将全线接入 [5] - 阿里通义已开源200余个模型,全球下载量超3亿次,千问衍生模型数超10万个 [6] 界面创新 - 界面布局创新,通过拖动"时间轴"按钮控制思考最大长度,实现算力消耗预算控制 [1] - 搜索框添加"MCP"(模型上下文协议)选项,显示为"即将推出" [1]