Workflow
融合推理模型
icon
搜索文档
手机也能跑,腾讯混元一口气开源4款小模型
机器之心· 2025-08-04 17:01
腾讯混元开源小模型 - 公司宣布开源4款小模型,参数规模分别为7B、4B、1.8B和0.5B [1] - 模型支持消费级显卡运行,适用于笔记本电脑、手机、智能座舱等低功耗场景 [3] - 模型已在GitHub和HuggingFace上线,并获得ARM、高通、英特尔等终端芯片平台支持部署 [3] 模型技术特点 - 属于融合推理模型,具备推理速度快、性价比高的特点 [6] - 支持快思考(简洁高效输出)和慢思考(复杂问题全面推理)两种模式 [7] - 在语言理解、数学、推理等领域表现突出,多个公开测试集得分领先 [6] - 原生长上下文窗口达256k,可处理40万中文汉字或50万英文单词的超长内容 [12] 应用场景与部署 - 具备强大的agent能力,可胜任深度搜索、电子表格操作、旅行攻略规划等任务 [12] - 只需单卡即可部署,部分PC、手机、平板等设备可直接接入 [12] - 支持主流推理框架(SGLang、vLLM、TensorRT-LLM)和多种量化格式 [12] 业务落地情况 - 已在腾讯会议AI小助手、微信读书AI问书等生产力工具中应用 [18] - 腾讯手机管家利用小模型实现毫秒级垃圾短信精准拦截 [18] - 在金融领域实现超过95%的意图识别准确率,游戏领域提升NPC对话智能度 [18] 公司AI开源布局 - 此前已开源Hunyuan Large(52B激活参数)和Hunyuan-A13B混合推理MoE模型 [16] - 开源覆盖文本、图像、视频和3D生成等多模态能力,衍生模型达3000个 [16] - 混元3D世界模型1.0发布后登上Hugging Face趋势榜第二,下载量近9k [17] 行业趋势 - 小语言模型被视为智能体AI的未来发展方向 [16] - 中国AI开源浪潮持续升温,科技公司和创业公司都积极参与 [20]