Workflow
谷歌开源Gemma 3 270M,性能超越Qwen 2.5同级模型
机器之心·2025-08-15 12:17

产品发布 - 谷歌正式发布Gemma 3系列最新模型Gemma 3 270M,拥有2.7亿参数,专为特定任务微调设计[2][3] - 新模型继承Gemma 3系列先进架构,在IFEval基准测试中树立同级模型新性能水平[3] - 模型体积仅241MB,便于下载和使用[1] 技术架构 - 模型参数构成:1.7亿个嵌入参数和1亿个Transformer模块参数[6][7] - 采用256k token的庞大词汇量,可处理特定和罕见token[7] - 支持INT4量化,在Pixel 9 Pro手机SoC上测试显示25次对话仅消耗0.75%电量[7] - 提供量化感知训练(QAT)检查点,最大限度减少INT4精度下的性能下降[7] 功能特点 - 具备强大的指令跟踪和文本结构化能力[3] - 提供预训练检查点和指令调整模型,开箱即用支持通用指令[7] - 适用于情绪分析、实体提取、查询路由等定义明确的任务[12] - 支持完全在设备上运行,保障用户隐私[12] 应用场景 - 适合高容量且定义明确的任务,如创意写作和合规性检查[12] - 适用于时延要求高、需要精打细算的任务,可大幅降低推理成本[12] - 支持快速迭代和部署,微调实验可在数小时内完成[12] - 可构建多个专业模型,每个模型专注不同任务[12] 市场表现 - Gemma系列累计下载量已突破2亿次[14] - 案例显示微调后的Gemma 3 4B模型在特定任务上超越大型专有模型[11] - 开发者已使用该模型支持Transformers.js的网页应用开发[11] 开发者支持 - 提供完整微调指南和快速入门方案[12] - 发布预训练模型和指令调优模型[12] - 支持Vertex AI、llama.cpp等多种推理工具[13] - 可在Colab上快速完成微调,耗时不到5分钟[13]