4B

搜索文档
腾讯混元开源 4 个小尺寸模型,主打 Agent 和长文
AI前线· 2025-08-05 16:39
腾讯混元开源小尺寸模型 - 公司宣布开源四款小尺寸模型,参数分别为0.5B、1.8B、4B、7B,适用于低功耗场景如笔记本电脑、手机、智能座舱等,支持垂直领域低成本微调 [2] - 四款模型已在Github和HuggingFace等开源社区上线,并获得Arm、高通、Intel、联发科技等终端芯片平台支持部署 [2] 模型技术特点 - 四款模型属于融合推理模型,具备推理速度快、性价比高的特点,支持快思考和慢思考两种模式 [4] - 在语言理解、数学、推理等领域表现优异,在多个公开测试集上达到领先水平 [5] - 具备出色的Agent和长文能力,原生支持256k上下文窗口,可一次性处理相当于40万中文汉字或50万英文单词的超长内容 [10] - 采用单卡部署方案,支持主流推理框架和多种量化格式,已在腾讯多个业务中实际应用 [10] 实际应用案例 - 腾讯会议AI小助手和微信读书AI问书利用模型的长文能力处理完整会议内容和整本书籍 [11] - 腾讯手机管家提升垃圾短信识别准确率至毫秒级拦截,实现隐私零上传 [11] - 金融AI助手通过微调实现95%+意图识别准确率,游戏翻译和NPC在多语言理解和智能对话方面表现突出 [11] 开源战略布局 - 公司持续推进大模型开源,已覆盖文本、图像、视频和3D生成等多个模态 [12] - 此前已开源52B参数的Hunyuan large和混合推理MoE模型Hunyuan-A13B [12] - 多模态方面开源了文生图、视频生成和3D生成能力,衍生模型数量达3000个 [12] - 最新开源的3D世界模型1.0登上Hugging Face趋势榜第二,下载量近9k [12] 未来发展方向 - 公司表示将持续提升模型能力,推出更多尺寸和模态的模型,加速产业落地和应用 [13] - 计划与开发者和合作伙伴共建大模型开源生态 [13]
腾讯混元发布4款小尺寸模型并开源 支持消费级显卡运行
新浪科技· 2025-08-04 16:08
腾讯混元模型发布 - 公司发布4款小尺寸开源模型,参数规模分别为0.5B、1.8B、4B、7B,全部开源并支持消费级显卡运行[1] - 新模型兼容主流芯片平台包括ARM、高通、MTK、Intel等,适用于手机、电脑、智能座驾及智能家居设备[1] - 模型已在Github和Huggingface等开源社区上线,获Arm、高通、Intel、联发科技等终端芯片平台支持部署[1] - 实测显示新模型在语言理解、数学、推理等领域得分达领先水平[1] 模型技术特性 - Hunyuan-4B具备32K最大输入/输出能力,总参数48B,激活参数4B,支持256K超长上下文窗口[2] - Hunyuan-7B总参数7B,激活参数7B,最大输入16K/输出32K,同样支持256K上下文窗口[2] - 4B版本适合实时响应场景,在推理性能与准确性上实现双优[2] - 7B版本知识密度显著高于同尺寸模型,专业领域效果接近更大模型,可在消费级GPU高效运行[2] 应用场景优势 - 模型支持金融、教育、医疗等垂直领域低成本微调[2] - 4B版本被推荐为智能座舱优选方案,7B版本适合家用电脑部署[2] - 所有模型支持在回答效率与深度间自由切换,更新时间均为2025年07月25日[2]