阿里推出Qwen3升级版,性能超过Kimi-K2等领先闭源模型
快讯·2025-07-22 01:32
模型更新 - 公司推出Qwen3-235B-A22B-Instruct-2507-FP8模型 更新了旗舰版Qwen3模型 [1] - 新模型采用非思考模式(Non-thinking) 命名为Qwen3-235B-A22B-FP8的更新版本 [1] 性能提升 - 新模型通用能力显著提升 包括指令遵循 逻辑推理 文本理解 数学 科学 编程及工具使用等方面 [1] - 在GQPA(知识) AIME25(数学) LiveCodeBench(编程) Arena-Hard(人类偏好对齐) BFCL(Agent能力)等测评中表现出色 [1] - 性能超过Kimi-K2 DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型 [1]