谷歌版小钢炮开源,0.27B大模型,4个注意力头,专为终端而生
模型性能特点 - 模型仅含2.7亿参数 其中1.7亿为嵌入层参数 1亿为Transformer模块参数[7] - 词汇量达25.6万token 可处理特定及罕见词汇[7] - 注意力头仅4个 比Qwen 3 0.6B少12个[4] - 在Pixel 9 Pro手机运行INT4量化版时 25轮对话仅耗电0.75%[8] 功能应用场景 - 支持文本分类和数据提取任务 可生成创意内容如睡前故事[4][7] - 可直接在浏览器本地运行 无需联网[4] - 支持OCR应用 可将图片或PDF转换为结构化Markdown格式[4] - 提供INT4量化支持 性能损耗极微[10] 开发部署优势 - 微调过程仅需数分钟 开箱即具备指令遵循能力[1][9] - 支持通过Hugging Face/Ollama/Kaggle等平台获取模型[13] - 可使用Vertex AI/llama.cpp/Keras等工具测试[14] - 支持通过Hugging Face/UnSloth/JAX进行个性化微调[15] 行业应用案例 - SK Telecom采用Gemma 3 4B进行多语言内容审核 微调后性能超越大型专有模型[11] - 适用于情感分析/实体提取/合规检查等专业任务批量处理[13] - 可实现完全本地化部署 保障用户隐私数据不传输至云端[13]