Llama 3.2 1B - 财报，业绩电话会，研报，新闻 - Reportify

Llama 3.2 1B

搜索文档

仅0.27B参数，谷歌开源史上最小Gemma 3，手机能跑，25次对话耗电不到1%

36氪· 2025-08-15 18:15

产品发布与定位 - 谷歌推出史上最小的Gemma 3开源模型，拥有2.7亿个参数，是一款轻量级模型 [2] - 该模型底层设计以特定任务微调为目标，具备强大的指令跟踪和文本能力 [2] - 模型尺寸和性能使其非常适合离线、基于网页的创意任务，如驱动睡前故事生成器网页应用 [3] 核心性能与技术特点 - 模型架构轻量而强大，共有2.7亿个参数，其中嵌入参数有1.7亿个，Transformer模块参数有1亿个 [4] - 得益于256k个token的庞大词汇量，模型能够处理特定和稀有的token，是可在特定领域和语言中进一步微调的优质基础模型 [4] - 模型具备极致能效，INT4量化版本在Pixel 9 Pro SoC上进行25次对话仅消耗0.75%的电量，成为谷歌最节能的Gemma模型 [4] - 模型提供量化感知训练检查点，支持以INT4精度运行且性能损失极小，便于在手机等资源受限设备上部署 [4] 市场竞争力与表现 - 在指令执行能力测试中，Gemma 3 270M超越了尺寸更大的Qwen2.5 0.5B Instruct模型，并与Llama 3.2 1B模型能力比肩 [1] - 该模型适合需要高容量、定义明确任务、精打细算成本、快速迭代部署或有隐私保护需求的用户选择 [5] - 轻量化模型正在打破参数规模决定性能的固有认知，展现出小模型遵循指令的能力以及微调后的威力 [5] 行业趋势与战略意义 - 谷歌Gemma开源模型加速迭代，此次Gemma 3 270M的推出填补了其轻量模型版块 [5] - 从轻量而强大的模型入手，用户可以构建精简、快速且运行成本显著降低的生产系统 [5]

轻量化模型

Qwen2.5 0.5B Instruct

轻量化模型

Qwen2.5 0.5B Instruct