Workflow
Llama 3.2 1B
icon
搜索文档
仅0.27B参数,谷歌开源史上最小Gemma 3,手机能跑,25次对话耗电不到1%
36氪· 2025-08-15 18:15
产品发布与定位 - 谷歌推出史上最小的Gemma 3开源模型,拥有2.7亿个参数,是一款轻量级模型 [2] - 该模型底层设计以特定任务微调为目标,具备强大的指令跟踪和文本能力 [2] - 模型尺寸和性能使其非常适合离线、基于网页的创意任务,如驱动睡前故事生成器网页应用 [3] 核心性能与技术特点 - 模型架构轻量而强大,共有2.7亿个参数,其中嵌入参数有1.7亿个,Transformer模块参数有1亿个 [4] - 得益于256k个token的庞大词汇量,模型能够处理特定和稀有的token,是可在特定领域和语言中进一步微调的优质基础模型 [4] - 模型具备极致能效,INT4量化版本在Pixel 9 Pro SoC上进行25次对话仅消耗0.75%的电量,成为谷歌最节能的Gemma模型 [4] - 模型提供量化感知训练检查点,支持以INT4精度运行且性能损失极小,便于在手机等资源受限设备上部署 [4] 市场竞争力与表现 - 在指令执行能力测试中,Gemma 3 270M超越了尺寸更大的Qwen2.5 0.5B Instruct模型,并与Llama 3.2 1B模型能力比肩 [1] - 该模型适合需要高容量、定义明确任务、精打细算成本、快速迭代部署或有隐私保护需求的用户选择 [5] - 轻量化模型正在打破参数规模决定性能的固有认知,展现出小模型遵循指令的能力以及微调后的威力 [5] 行业趋势与战略意义 - 谷歌Gemma开源模型加速迭代,此次Gemma 3 270M的推出填补了其轻量模型版块 [5] - 从轻量而强大的模型入手,用户可以构建精简、快速且运行成本显著降低的生产系统 [5]