Workflow
最低仅需2G显存,谷歌开源端侧模型刷新竞技场纪录,原生支持图像视频
量子位·2025-06-27 12:40

克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌开源模型,又上新了。 今天凌晨,谷歌正式官宣了 Gemma 3n ,原生支持文本、图像和音视频等多种模态。 在大模型竞技场中,Gemma 3n取得了1303分,成为了 第一个超过1300分的10B以下模型 。 Gemma 3n一共有5B(E2B)和8B(E4B)两种型号,但通过架构创新,其VRAM占用与2B和4B相当,最低只要2GB。 有网友表示,Gemma 3n能够用低内存占用实现这样的表现,对端侧设备意义重大。 目前,Gemma 3n已在谷歌AI Studio或Ollama、llama.cpp等第三方工具中可用,模型权重也可在Hugging Face上下载。 同时谷歌也公开了Gemma 3n的一些技术细节,接下来就一起来了解。 套娃式Transformer架构 在Gemma 3n的两种型号——E2B和E4B中,谷歌提出了"有效参数"的概念,这里的"E"指的就是effective(有效的)。 Gemma 3n的核心是 MatFormer (Matryoshka Transformer) 架构 ,这是一种专为弹性推理而构建的嵌套式Transforme ...