Workflow
2Bit量化
icon
搜索文档
首个产业级2Bit量化新突破 腾讯混元推出0.3B端侧模型
格隆汇APP· 2026-02-10 12:11
模型发布与技术参数 - 腾讯混元正式推出一款面向消费级硬件场景的“极小”模型HY-1.8B-2Bit [1] - 该模型基于首个产业级2Bit端侧量化方案,是首个实现2bit产业级量化的端侧模型实践 [1] - 模型等效参数量仅有0.3B,内存占用仅600MB,比常用的一些手机应用还小 [1] 技术实现与性能提升 - 模型通过对小尺寸语言模型HY-1.8B-Instruct进行2比特量化感知训练(QAT)产出 [1] - 对比原始精度模型,等效参数量降低了6倍 [1] - 在真实端侧设备上对比原始精度模型,生成速度提升2—3倍,可大幅提升使用体验 [1] - 模型在沿用原模型全思考能力的同时,实现了显著的性能优化 [1] 应用场景与部署优势 - 该模型可以在边缘设备上无压力部署 [1] - 模型面向消费级硬件场景,具备在资源受限的端侧设备上高效运行的能力 [1]