腾讯混元开源小尺寸模型 - 公司宣布开源四款小尺寸模型,参数分别为0.5B、1.8B、4B、7B,适用于低功耗场景如笔记本电脑、手机、智能座舱等,支持垂直领域低成本微调 [2] - 四款模型已在Github和HuggingFace等开源社区上线,并获得Arm、高通、Intel、联发科技等终端芯片平台支持部署 [2] 模型技术特点 - 四款模型属于融合推理模型,具备推理速度快、性价比高的特点,支持快思考和慢思考两种模式 [4] - 在语言理解、数学、推理等领域表现优异,在多个公开测试集上达到领先水平 [5] - 具备出色的Agent和长文能力,原生支持256k上下文窗口,可一次性处理相当于40万中文汉字或50万英文单词的超长内容 [10] - 采用单卡部署方案,支持主流推理框架和多种量化格式,已在腾讯多个业务中实际应用 [10] 实际应用案例 - 腾讯会议AI小助手和微信读书AI问书利用模型的长文能力处理完整会议内容和整本书籍 [11] - 腾讯手机管家提升垃圾短信识别准确率至毫秒级拦截,实现隐私零上传 [11] - 金融AI助手通过微调实现95%+意图识别准确率,游戏翻译和NPC在多语言理解和智能对话方面表现突出 [11] 开源战略布局 - 公司持续推进大模型开源,已覆盖文本、图像、视频和3D生成等多个模态 [12] - 此前已开源52B参数的Hunyuan large和混合推理MoE模型Hunyuan-A13B [12] - 多模态方面开源了文生图、视频生成和3D生成能力,衍生模型数量达3000个 [12] - 最新开源的3D世界模型1.0登上Hugging Face趋势榜第二,下载量近9k [12] 未来发展方向 - 公司表示将持续提升模型能力,推出更多尺寸和模态的模型,加速产业落地和应用 [13] - 计划与开发者和合作伙伴共建大模型开源生态 [13]
腾讯混元开源 4 个小尺寸模型,主打 Agent 和长文