凌晨,Qwen又更新了,3090就能跑,3B激活媲美GPT-4o
机器之心·2025-07-30 08:48

模型性能突破 - Qwen3-30B-A3B-Instruct-2507为非思考模式模型,仅激活30亿参数即可媲美谷歌Gemini 2.5-Flash和OpenAI GPT-4o等顶尖闭源模型,实现效率与性能的重大突破[2] - 新版本在多项基准测试中表现显著提升:AIME25从21.6升至61.3,Arena-Hard v2从24.8升至69.0[3] - 在知识、推理、编程等领域的平均得分达62.8,超越DeepSeek-V3-0324(61.2)和GPT-4o-0327(58.9)[10] 技术参数优化 - 模型参数总量减少22倍,活跃参数减少10倍,仅需30亿总参数和3亿活跃参数即可达到与大型模型相当的智能水平[8] - 支持256K长文本理解能力,并在多语言知识覆盖、逻辑推理、数学及编程能力上实现通用能力大幅提升[13][27][28] - 提供多种量化版本(1-bit至16-bit),最小量化版本仅9.05GB,可在消费级GPU(如RTX 3090)和Apple M2 Ultra等设备本地部署[22][24][26] 行业影响与生态支持 - 模型已在魔搭社区、HuggingFace开源,并集成至QwenChat和anycoder等平台,支持vibe编程等场景[16][17][19] - 社区快速响应推出量化版本,开发者实测可在Mac(8bit量化)和PC端流畅运行,验证其消费级硬件兼容性[23][24][26] - 非思考模式设计虽在复杂代码生成任务中可能弱于推理模型,但在效率与成本平衡上为行业提供新选择[34] 研发进展与竞争态势 - 公司4个月内实现模型效率跃升,参数效率优化速度远超行业预期[7][8] - 新模型在创造性写作(WritingBench 85.5分)和多语言任务(PolyMATH 43.1分)等细分领域超越同类产品[6][10] - 持续深夜更新策略推动技术迭代速度,加剧行业竞争压力[35]

凌晨,Qwen又更新了,3090就能跑,3B激活媲美GPT-4o - Reportify