机器翻译
搜索文档
腾讯元宝上线同传翻译功能,使用自研7B参数模型
格隆汇· 2026-01-17 13:06
腾讯元宝产品功能更新 - 腾讯元宝上线“同传翻译”功能 用户需将应用升级至最新版本 并在语音通话界面选择该模式即可使用 [1] - 该功能基于腾讯混元HY-MT1.5-7B模型开发 旨在提升翻译准确度 [1] 腾讯混元翻译模型技术细节 - 腾讯混元HY-MT1.5-7B模型于2025年12月正式开源 是混元翻译模型1.5系列的升级版本 [3] - 该模型支持33种语言互译 包括常用语种及5种中国少数民族语言和方言 [3] - 在FLORES-200基准测试中 该模型得分约82-85% [3] - 在典型硬件上 模型处理50个token的响应延迟约为0.45秒 [3] 腾讯翻译业务整合与战略 - 腾讯混元翻译模型系列已应用于腾讯会议、企业微信、QQ浏览器和客服翻译等公司核心业务 [3] - 2025年3月 公司宣布将关停腾讯翻译君业务 包括其App、在线网站和小程序 后续不再提供在线服务并删除用户个人信息 [3] - 公司表示 翻译服务将完全迁移至腾讯元宝 [3]
OpenAI入局翻译市场,正面挑战谷歌?
第一财经· 2026-01-16 12:53
OpenAI推出独立翻译工具 - OpenAI近期加快应用落地探索,继推出ChatGPT健康后,又上线了独立的网页版翻译工具“ChatGPT翻译”,该工具目前为免费开放,无需付费订阅,但上线仓促,功能未完善[3] - 该工具界面与谷歌翻译类似,支持50多种语言之间的即时互译,官方介绍其特点在于能理解语境和语气,支持正式、日常或地域化等不同风格的表达[3] - 行业普遍认为,OpenAI独立推出翻译工具意在直接与谷歌翻译竞争,但目前体验称不上惊喜,更谈不上颠覆市场,此举或是为了率先卡位,积累用户与数据,为后续迭代做准备[3][6] 与谷歌翻译的产品对比 - **语言覆盖与功能**:谷歌翻译支持243种语言,覆盖文本、图片、文档及网页翻译,功能成熟;ChatGPT翻译目前仅支持50多种语言,且官方虽称支持文本、语音和图像翻译,但实际界面缺乏语音和图片的输入入口[3] - **翻译质量与风格**:根据对DeepSeek论文摘要的对比测试,谷歌翻译在部分专业词汇翻译上更精准,表达更接近日常;ChatGPT翻译则对原文的错误断句进行了修正,使语言更流畅,但“机翻感”较重[4][6] - **交互体验**:ChatGPT翻译提供了语言风格提示选项,但点击切换后会跳转至ChatGPT聊天界面完成,交互流程较为繁琐[4] 市场竞争格局与未来展望 - 谷歌翻译在融入Gemini模型后,在习语、俚语等复杂语言处理上更为流畅,并推出了“实时翻译 Beta”功能,可通过耳机实现同声传译并保留说话者语气与节奏[6] - 面对功能成熟且持续进化的谷歌,OpenAI若想在翻译市场真正分得一杯羹,还需要在技术打磨与用户体验上投入更多[6]
腾讯混元开源翻译模型1.5 支持端侧部署和离线实时翻译 效果超越商用API
智通财经网· 2025-12-30 16:01
公司动态:腾讯混元翻译模型开源更新 - 腾讯混元于12月30日正式开源翻译模型1.5版本,包含Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B两个模型 [1] - 模型支持33个语种互译以及5种民汉/方言,涵盖中文、英语、日语等常见语种及捷克语、马拉地语等小语种 [1] - 两个模型已在腾讯混元官网上线,并可在Github和Huggingface等开源社区直接下载使用 [1] 产品技术规格与性能 - HY-MT1.5-1.8B参数规模为1.8B,面向手机等消费级设备,量化后仅需约1GB内存即可流畅运行 [1] - 该模型支持端侧直接部署和离线实时翻译,内存占用与一款常见手机应用体量大致相同 [1] - 在多项主流翻译测试集中,HY-MT1.5-1.8B的整体表现已达到超大尺寸闭源模型的90分位水平,明显领先同尺寸开源模型与主流商用翻译API [1] - HY-MT1.5-1.8B推理速度更快,处理50个tokens的平均耗时仅0.18秒,而其他模型耗时在0.4秒左右 [1] - HY-MT1.5-7B模型是此前获得WMT25比赛30个语种翻译冠军模型的升级版,相比前一版本效果有较大提升 [2] - 7B版本重点提升了翻译准确率,大幅减少了译文中夹带注释和语种混杂的情况,实用性增加 [2] 部署策略与市场反响 - 在实际使用场景下,1.8B和7B两个尺寸模型可协同部署,实现端侧和云侧协同,提升模型效果的一致性和稳定性 [2] - 腾讯混元翻译模型此前在国际机器翻译比赛拿下30个第1名,并在首次开源一周内登上HuggingFace模型趋势榜第一位 [2] - 混元翻译模型已在腾讯内部多个业务场景落地应用,包括腾讯会议、企业微信、QQ浏览器、客服翻译等 [2]
美媒:“即时翻译”剥夺跨文化交流的乐趣?
环球时报· 2025-11-13 06:51
自动翻译技术的现状与影响 - 自动翻译技术依靠大型语言模型 几乎实现了科幻小说中即时跨语言交流的幻想 只需佩戴具备实时翻译功能的耳机即可与任何人用任何语言进行无障碍交流 [1] 人工翻译与机器翻译的核心差异 - 翻译不仅仅是传递意义 更需要关注文化、时代、思想、表达方式等无法完美契合的差异 这些细微差别需要被感受、权衡和选择而非通过计算实现 [3] - 翻译过程需要译者的经验、直觉以及对不同世界观的理解和好奇心 这是机器翻译难以做到的 [2][3] - 文学翻译尤其吸引人的是难以翻译的事物 如韵律、趣味、文化特性及某些难以言喻的微妙之处 当语言无法顺利表意时必须重新构想其意义而非简单解码和扁平化 [4] 语言学习与跨文化交流的潜在损失 - 自动翻译技术的普及可能使人们无法体验语言学习的魅力与跨文化交流的乐趣 例如在陌生国度使用非母语时所带来的返璞归真的坦率表达和思维重塑 [1][2] - 跨越语言障碍的努力本身是一种丰富多彩、充满活力的思维和交流方式 自动翻译技术可能将这些努力及其带来的文化感知和情感边界的重新划分视为多余信息过滤掉 [3][4] - 技术若承诺消除语言障碍 需警惕其可能抹去语言所承载的独特世界地图和历史画卷 每种语言都绝非纯粹的工具 [3][4]
“翻译界哈佛”倒闭:有学生哭了两晚,AI冲击下译员何去何从?
第一财经· 2025-11-11 08:23
行业结构性变革 - 被誉为“翻译界哈佛”的蒙特雷国际研究院(MIIS)宣布将于2027年夏季正式关停线下研究生项目,校方归咎于招生规模急剧下降和财务缺口扩大等财务与结构性问题 [1] - 从学界到产业界,一场深刻的结构性变革已然发生,AI浪潮是推动行业加速变革的关键因素 [1] - 根据Nimdzi的调查数据,MTPE(机器翻译后人工编辑)的平均采用率已从2022年的26%激增至2024年的近46%,译后编辑的机器翻译逐渐成为新的生产基准 [2] 效率与成本影响 - 相比于纯人工翻译,MTPE模式速度快、成本低,例如翻译10万字技术资料,人工翻译费用约20万元以上、周期1个月,而MTPE费用在12万~15万元之间、周期可缩短至2周左右 [3] - AI翻译正在大量接管市场,导致译员报酬下降,例如中英短剧纯人工翻译价格为8~10元/分钟,MTPE价格为3~5元/分钟,部分客户甚至将价格压至1~2元/分钟 [5] - 英国作家协会(SOA)调查显示,超过三分之一的受访翻译人员因生成式AI发展而失去工作,超过14%的人翻译收入减少,超过四分之三的受访者预期新技术将对收入产生负面影响 [5] 企业应对与人才需求转变 - 上海翻译协会的交流信息显示,翻译公司的口笔译订单量明显减少,AI冲击迅猛且直接 [5] - 中国翻译协会报告显示,80%的全球头部翻译企业已部署生成式人工智能工具,人工智能应用能力成为从业必备技能 [6] - 招聘平台上的翻译相关职位开始要求雇员“能够熟练使用AI翻译软件”,公司招聘更看重技术亲和力与学习能力,而不仅仅是语言类证书 [6] 教育机构学科调整 - 上海外国语大学在2022年推出翻译—工商管理双学士学位项目,该专业首届毕业生就业前景在学院内最好,并正筹备开设翻译(人工智能方向)专业 [6] - 国内多所高校开始学科交叉融合创新,例如复旦大学成功获批“英语-计算机科学与技术”、“翻译-计算机科学与技术”等四个双学士学位项目 [6] - 蒙特雷国际研究院的翻译与本地化管理专业日常学习内容偏重技术,包括学习处理软件、网站、游戏等产品文件,以及熟练掌握计算机辅助翻译工具 [3] AI翻译的技术局限与人类价值 - 机器翻译最擅长半结构化文本翻译,如法律合同、财务报表、产品说明书,这类文本的丢单率会非常高 [9] - 当文本用于信息披露、公开宣传时,专业译员的公信力仍高于AI,同时涉及责任与伦理问题,例如法律、医疗文本一旦出错AI无法承担责任,且企业有数据泄露隐忧 [9] - 在涉及文言文、散文文本时,AI生成的译文几乎不能用;在口译时,面对晦涩讲稿,AI生成内容有所延迟,无法满足同传要求 [9] - 游戏行业头部公司出于翻译质量、创意输出、信息安全等综合因素考虑,对AI翻译处于有限使用而非全面依赖状态 [7]
俄开发出分析机器翻译错误的应用程序
科技日报· 2025-10-27 07:43
机器翻译行业痛点 - 机器翻译在提升文字处理效率的同时,不稳定的翻译质量成为一大困扰 [1] - 尽管有各种特殊指标可用于分析和改进翻译错误,但低效的校准能力无法满足需求 [1] 新技术解决方案 - 俄罗斯苏尔古特国立大学科学家开发出一款能够分析机器翻译错误的应用程序,有助于提升机器翻译质量 [1] - 该在线翻译分析程序能提供比普通标准方法更深入、更多维的分析结果 [1] - 该程序能进行综合分析,在句法和语义传达层面发现翻译的薄弱环节 [1] - 该工具不仅能评估词汇的匹配度(选词准确度),还能评估语义准确度(意义传递是否正确)和句法结构的正确性(句子构建是否规范) [1] - 与同类工具相比,其主要优势在于将多种评估方法整合到一个自动化工具中 [1] 技术应用与测试结果 - 研究团队对主流在线翻译服务和商用神经网络的译文进行了分析 [1] - 针对每份译文都生成了详细报告,任何指标得分较低的句子都会自动标亮以供进一步分析 [1] - 部分翻译工具在词汇匹配度方面表现良好,但所有参与测试的系统在翻译复杂语法结构时都遇到了困难 [1] 工具价值与意义 - 该工具不仅能提供整体评估,更能精确识别错误类型,无论是词汇、语法还是语义 [2] - 这使分析过程更加高效,有助于明确机器翻译系统的改进方向 [2]
阿里国际Marco获WMT机器翻译大赛六项冠军,英中赛道超GPT-4.1与Gemini 2.5 Pro等巨头
财经网· 2025-10-23 13:56
赛事成绩与排名 - 阿里国际AI的翻译大模型Marco-MT-Algharb在2025年WMT大赛中斩获6项冠军、4项亚军和2项季军 [1] - 在最受关注的英中语向上,该模型超越了Gemini 2.5 Pro、GPT-4.1、Claude 4和Mistral-Medium等所有顶尖闭源AI系统,登顶榜首 [1] - 该模型在包括英译中在内的13个核心语向表现优异,并在英译中等多个语向上表现超过人工翻译 [1][3] 技术路径与创新 - 模型参加的是难度更高的受限赛道,要求仅使用开源数据和模型,且模型规模不超过200亿参数 [2] - 成功的关键在于将电商翻译训练经验与原创训练方法M2PO(多阶段偏好优化)相结合,首次将强化学习范式应用于大模型翻译领域 [2] - M2PO系统分三步提升翻译质量:通过两轮监督微调拓宽知识基础;引入强化学习让模型学会判断译文优劣;在解码阶段融合词对齐与重排序技术 [2] 行业地位与影响 - WMT的人工评测被视为机器翻译领域的“黄金标准”,其评测结果被全球学术界与工业界视为技术风向标 [1][3] - 此次获奖标志着Marco-MT从电商行业翻译迈向通用翻译的领先行列 [1] - 该模型发布于2024年,最初专注于电商场景翻译,高质量、低幻觉率等核心优势为其向通用翻译拓展打下坚实基础 [3] 业务基础与多模态能力 - 模型已接入公司旗下的电商平台,支持搜索、商品信息、对话、图片等多种场景的翻译 [3] - 跨文化、多语种的业务需求使其具备高质量、低幻觉率等核心优势 [3] - 模型在机器翻译领域展现出多模态竞争力,此前已在2025年IWSLT国际语音翻译赛事中斩获2项冠军和2项亚军 [3]
“翻译界哈佛”倒闭,AI杀死首个世界名校?
虎嗅APP· 2025-09-05 19:27
学校关闭决策 - 蒙特雷国际研究学院(MIIS)将于2027年6月正式停止招收研究生[3] - 学院所有住校研究生项目和部分在线学位课程将在明年6月前终止[8] - 该决定直接源于财务压力 学院目前面临2500万美元年度亏损[30] 财务与运营状况 - 明德学院今年4月出现1410万美元巨额赤字 其中870万美元由MIIS直接造成[23] - 全日制入学人数自2009年持续下降 目前仅440名学生 不足850人目标的一半[30] - 削减教职工福利和扩大招生等自救措施适得其反 引发师生大规模抗议[24][25] 行业冲击与职业影响 - 微软研究报告将口译和笔译员列为TOP 40高危职业首位 替代评分达0.49[11][40] - 该职业在美国就业人数为51,560人 AI覆盖度0.98 完成度0.88[12][42] - 专业翻译人员收入锐减 "译后编辑"(PED)工作报酬仅为正常翻译的1/4[52] 技术发展现状 - AI翻译实现毫秒级延迟 Meta AI实时翻译模型延迟已缩短至2秒内[56] - 谷歌翻译支持超70种语言实时双向对话[31] - 技术仍存在局限 术语管理和分类仍需人工干预[62][64] 市场反应与个案影响 - 高端学术会议已普遍采用AI口译服务[2] - 从业15年的专业翻译面临生计困难 医疗制药等专业领域同样受影响[48][50] - 有翻译从业者转行从事清洁工等职业[52]
腾讯混元最新开源成“最强翻译”:国际机器翻译比赛获30个语种第一
量子位· 2025-09-03 13:49
国际翻译比赛表现 - 腾讯混元Hunyuan-MT-7B模型在ACL WMT2025比赛中获得31个语种中的30个第一名 处于绝对领先地位[4] - 该模型以7B总参数量击败了众多参数更大的模型 包括Gemini-2.5-Pro、GPT-4.1、Qwen3-235B等大型模型[4][5] - 比赛要求参数规模≤20B 且只能使用公开数据训练 在严格约束下取得优异成绩[5][29] 技术框架创新 - 采用协同增强策略优化(Shy)框架 包含基础模型开发和集成策略两大组成部分[15][19] - 基础模型开发通过持续预训练、监督微调和GRPO强化学习三阶段构建[16][17] - 集成策略采用学习型集成方法 通过生成多个候选翻译并训练专门模型进行智能选择或组合[18][26][27] 算法突破 - 首次在机器翻译领域应用GRPO(组相对策略优化)算法 采用组内相对优势替代全局基线[21][22] - GRPO算法显著降低梯度方差 提升训练稳定性 并提高样本效率加速模型收敛[23][24] - 采用复合奖励函数r=0.2×BLEU+0.4×XCOMET+0.4×DeepSeek 综合评估准确性、语义质量和流畅性[24] 模型性能优势 - 支持33个语种和5种民汉语言/方言互译 包括中文、英语、日语及捷克语、马拉地语等小语种[1][4] - 在Flores200测评数据集上表现卓越 明显领先同尺寸模型 与超大尺寸模型效果相当[6][8][9] - 在英语-简体中文翻译任务中AutoRank达到满分1.0 得分87.2 领先第二名Gemini-2.5-Pro的85.2分[5] 应用与部署优势 - 计算效率高 7B模型推理速度快 经FP8量化压缩后推理性能提升30%[30] - 部署友好 可在从高端服务器到边缘设备的多样化硬件环境中运行[30] - 已接入腾讯会议、企业微信、QQ浏览器、翻译君等多个业务产品[30] 开源生态建设 - 模型完全开源 基于Hunyuan-7B基础模型构建[2][31] - 使用OPUS Collection、ParaCrawl、UN Parallel Corpus等公开数据集训练[16][31] - 提供GitHub和HuggingFace等多个平台访问渠道 降低技术门槛[35] 行业方法论价值 - 为垂直领域专业化优化提供可借鉴模板 涵盖数据、算法、架构等多维度系统性设计[33][34] - 学习型集成方法实现从启发式到学习型的跃升 为模型融合提供新思路[26][34] - GRPO算法证明强化学习在序列生成任务中的潜力 具有行业推广价值[21][34]
全球机器翻译比赛拿下30个语种第1名,腾讯混元翻译模型开源
搜狐财经· 2025-09-02 19:32
模型开源与性能 - 腾讯混元于9月1日开源轻量级翻译模型Hunyuan-MT-7B 总参数量7B 支持33个语种及5种民汉语言/方言互译 [1] - 同步开源业界首个翻译集成模型Hunyuan-MT-Chimera-7B 可综合多个模型结果生成更优翻译 支持接入Deepseek等第三方模型 [3] - 在ACL WMT2025比赛中 该模型获得31个语种中30个第一名 涵盖中文英语日语及捷克语等小语种 [4] 技术优势与突破 - 模型采用完整训练范式 覆盖预训练CPT监督调参翻译强化和集成强化全链条 [4] - 基于FP8量化压缩技术 推理性能提升30% 支持高端服务器到边缘设备的多硬件部署 [6] - 在Flores200测评数据集上表现卓越 效果领先同尺寸模型且不逊于超大尺寸模型 [4] 应用场景与生态建设 - 模型已接入腾讯会议企业微信QQ浏览器翻译君等业务 助力产品体验提升 [6] - 公司自2023年起持续开源文生文文生图视频生成及3D生成能力工具集 相关模型多次登顶开源社区热度榜 [7] - 模型已在腾讯官网Huggingface及Github提供下载 技术报告与论文同步公开 [7]