还有高手?千问新模型压轴亮相
搜狐财经·2026-02-17 00:25

阿里发布新一代大模型Qwen3.5 - 阿里在大年初一前发布了新一代大模型Qwen3.5 [1] - Qwen系列在开源阵营中通常“发布即登顶” [1] Qwen3.5-Plus的核心技术突破 - Qwen3.5-Plus总参数为3970亿,相比上一代旗舰Qwen3-Max的万亿参数不增反降 [2] - 该模型以不到前代模型40%的参数量,将性能做到了Gemini 3 Pro的级别 [2] - 每次响应的激活参数只有170亿,相当于只用5%的算力资源调动满血智能 [2] - 交付给用户的token成本只有Gemini 3 Pro的1/18 [2] - 模型引入了混合注意力模式,学会“有详有略的读” [2] - 其重大突破的门控技术,源自阿里在2025 NeurIPS上斩获最佳的论文,成果可供所有科技公司吸收 [3] 模型架构的演进路径 - 千问大模型持续死磕MoE架构 [2] - 从Qwen1.5启动细粒度专家模式开始,到Qwen3摒弃共享专家改用路由专家,再到Qwen3.5引入混合注意力模式 [2] - 历次更新都在推翻和重建,是开源大模型中前沿含量最高的一个 [1] 行业竞争格局与影响 - 中国厂商(Qwen、GLM、Kimi、DeepSeek等)已彻底领跑开源模型队列,并以无死角的交叉线路完成对闭源模型的全面包围 [3] - 阿里成为在全模态上100%对标谷歌的公司,从预训练第一天起就在文本和视觉的混合数据上联合学习,实现视觉与语言在统一参数空间内的深度融合 [3] - 国产大模型与地表最强SOTA之间的距离已缩短至3个月,超车的身位已经可以看到 [3]

还有高手?千问新模型压轴亮相 - Reportify