腾讯混元机器翻译模型发布 - 腾讯混元开源首批翻译模型Hunyuan-MT-7B和Hunyuan-MT-Chimera-7B 支持33个语种互译 包括粤语、维吾尔语、藏语等少数民族语言或方言 [1] - 模型重点优化中文与少数民族语言双向翻译 采用针对性数据整理和优化措施 显著提升资源匮乏环境下的翻译效果 [4] - 模型基于腾讯自研AngelSlim大模型压缩工具进行FP8量化压缩 推理性能提升30% 7B尺寸可在消费级GPU流畅运行 [7] 模型性能表现 - 在WMT 2025通用机器翻译任务中 Hunyuan-MT-7B在31对语言组合互译中获得30项第一 涵盖中文、英语等资源丰富语言及捷克语、冰岛语等资源匮乏语言 [4] - 在FLORES-200和WMT24pp等基准测试中 模型表现超越同尺寸模型及谷歌翻译等专用系统 甚至击败参数数十倍于它的DeepSeek-V3等模型 [2][23] - 在汉语与少数民族语言翻译任务中 Hunyuan-MT-7B获得0.6082分 Hunyuan-MT-Chimera-7B获得0.6089分 高于所有竞品 最接近的Gemini-2.5-Pro为0.5811分 [27] 技术特点与创新 - 模型能精准理解网络用语、游戏用语等并结合语境意译 如将"砍一刀"准确翻译为拼多多降价机制 将"小红薯"理解为社交平台REDnote [8][9] - 采用"弱到强"强化学习方法 Hunyuan-MT-Chimera-7B在推理阶段整合不同系统的多条候选译文 生成质量超越单一候选译文的输出 [5] - 预训练数据包含1.3万亿个token的非中英文少数语种数据集 涵盖112种语言及方言 通过多语种数据质量评估模型进行加权处理 [19] 应用场景与局限性 - 模型在游戏场景、俚语表达和专业术语翻译上表现优异 能正确翻译医学术语和完整地址 而谷歌翻译往往保持原文不变 [10][12] - 但在专业翻译考试中表现一般 在CATTI真题翻译中出现会议名称错误和缩写混淆等问题 仅达到入门级译者水平 [15][16][17] - 模型在文化背景理解和语用处理上优势明显 能恰当翻译非正式语言和强调性脏话 避免直译为粗俗用语 [13] 行业意义与发展 - 机器翻译模型对开展跨国业务的企业具有现实价值 可替代或加速部分人工翻译流程 实现降本增效 [28] - 生成式AI为机器翻译带来新解决方案 越来越多厂商使用Transformer等新架构打造翻译模型 [28] - 腾讯混元通过监督微调、强化学习和弱到强强化学习三种后训练方法进一步提升模型翻译能力 [24][25]
AI模型终于能翻译“拼多多砍一刀”了