机器翻译 - 财报，业绩电话会，研报，新闻 - Reportify

机器翻译

搜索文档

美媒：“即时翻译”剥夺跨文化交流的乐趣？

环球时报· 2025-11-13 06:51

自动翻译技术的现状与影响 - 自动翻译技术依靠大型语言模型几乎实现了科幻小说中即时跨语言交流的幻想只需佩戴具备实时翻译功能的耳机即可与任何人用任何语言进行无障碍交流 [1] 人工翻译与机器翻译的核心差异 - 翻译不仅仅是传递意义更需要关注文化、时代、思想、表达方式等无法完美契合的差异这些细微差别需要被感受、权衡和选择而非通过计算实现 [3] - 翻译过程需要译者的经验、直觉以及对不同世界观的理解和好奇心这是机器翻译难以做到的 [2][3] - 文学翻译尤其吸引人的是难以翻译的事物如韵律、趣味、文化特性及某些难以言喻的微妙之处当语言无法顺利表意时必须重新构想其意义而非简单解码和扁平化 [4] 语言学习与跨文化交流的潜在损失 - 自动翻译技术的普及可能使人们无法体验语言学习的魅力与跨文化交流的乐趣例如在陌生国度使用非母语时所带来的返璞归真的坦率表达和思维重塑 [1][2] - 跨越语言障碍的努力本身是一种丰富多彩、充满活力的思维和交流方式自动翻译技术可能将这些努力及其带来的文化感知和情感边界的重新划分视为多余信息过滤掉 [3][4] - 技术若承诺消除语言障碍需警惕其可能抹去语言所承载的独特世界地图和历史画卷每种语言都绝非纯粹的工具 [3][4]

自动翻译技术

即时翻译耳机

自动翻译技术

即时翻译耳机

“翻译界哈佛”倒闭：有学生哭了两晚，AI冲击下译员何去何从？

第一财经· 2025-11-11 08:23

行业结构性变革 - 被誉为“翻译界哈佛”的蒙特雷国际研究院（MIIS）宣布将于2027年夏季正式关停线下研究生项目，校方归咎于招生规模急剧下降和财务缺口扩大等财务与结构性问题 [1] - 从学界到产业界，一场深刻的结构性变革已然发生，AI浪潮是推动行业加速变革的关键因素 [1] - 根据Nimdzi的调查数据，MTPE（机器翻译后人工编辑）的平均采用率已从2022年的26%激增至2024年的近46%，译后编辑的机器翻译逐渐成为新的生产基准 [2] 效率与成本影响 - 相比于纯人工翻译，MTPE模式速度快、成本低，例如翻译10万字技术资料，人工翻译费用约20万元以上、周期1个月，而MTPE费用在12万~15万元之间、周期可缩短至2周左右 [3] - AI翻译正在大量接管市场，导致译员报酬下降，例如中英短剧纯人工翻译价格为8~10元/分钟，MTPE价格为3~5元/分钟，部分客户甚至将价格压至1~2元/分钟 [5] - 英国作家协会（SOA）调查显示，超过三分之一的受访翻译人员因生成式AI发展而失去工作，超过14%的人翻译收入减少，超过四分之三的受访者预期新技术将对收入产生负面影响 [5] 企业应对与人才需求转变 - 上海翻译协会的交流信息显示，翻译公司的口笔译订单量明显减少，AI冲击迅猛且直接 [5] - 中国翻译协会报告显示，80%的全球头部翻译企业已部署生成式人工智能工具，人工智能应用能力成为从业必备技能 [6] - 招聘平台上的翻译相关职位开始要求雇员“能够熟练使用AI翻译软件”，公司招聘更看重技术亲和力与学习能力，而不仅仅是语言类证书 [6] 教育机构学科调整 - 上海外国语大学在2022年推出翻译—工商管理双学士学位项目，该专业首届毕业生就业前景在学院内最好，并正筹备开设翻译（人工智能方向）专业 [6] - 国内多所高校开始学科交叉融合创新，例如复旦大学成功获批“英语-计算机科学与技术”、“翻译-计算机科学与技术”等四个双学士学位项目 [6] - 蒙特雷国际研究院的翻译与本地化管理专业日常学习内容偏重技术，包括学习处理软件、网站、游戏等产品文件，以及熟练掌握计算机辅助翻译工具 [3] AI翻译的技术局限与人类价值 - 机器翻译最擅长半结构化文本翻译，如法律合同、财务报表、产品说明书，这类文本的丢单率会非常高 [9] - 当文本用于信息披露、公开宣传时，专业译员的公信力仍高于AI，同时涉及责任与伦理问题，例如法律、医疗文本一旦出错AI无法承担责任，且企业有数据泄露隐忧 [9] - 在涉及文言文、散文文本时，AI生成的译文几乎不能用；在口译时，面对晦涩讲稿，AI生成内容有所延迟，无法满足同传要求 [9] - 游戏行业头部公司出于翻译质量、创意输出、信息安全等综合因素考虑，对AI翻译处于有限使用而非全面依赖状态 [7]

俄开发出分析机器翻译错误的应用程序

科技日报· 2025-10-27 07:43

机器翻译行业痛点 - 机器翻译在提升文字处理效率的同时，不稳定的翻译质量成为一大困扰 [1] - 尽管有各种特殊指标可用于分析和改进翻译错误，但低效的校准能力无法满足需求 [1] 新技术解决方案 - 俄罗斯苏尔古特国立大学科学家开发出一款能够分析机器翻译错误的应用程序，有助于提升机器翻译质量 [1] - 该在线翻译分析程序能提供比普通标准方法更深入、更多维的分析结果 [1] - 该程序能进行综合分析，在句法和语义传达层面发现翻译的薄弱环节 [1] - 该工具不仅能评估词汇的匹配度（选词准确度），还能评估语义准确度（意义传递是否正确）和句法结构的正确性（句子构建是否规范） [1] - 与同类工具相比，其主要优势在于将多种评估方法整合到一个自动化工具中 [1] 技术应用与测试结果 - 研究团队对主流在线翻译服务和商用神经网络的译文进行了分析 [1] - 针对每份译文都生成了详细报告，任何指标得分较低的句子都会自动标亮以供进一步分析 [1] - 部分翻译工具在词汇匹配度方面表现良好，但所有参与测试的系统在翻译复杂语法结构时都遇到了困难 [1] 工具价值与意义 - 该工具不仅能提供整体评估，更能精确识别错误类型，无论是词汇、语法还是语义 [2] - 这使分析过程更加高效，有助于明确机器翻译系统的改进方向 [2]

分析机器翻译错误的应用程序

分析机器翻译错误的应用程序

阿里国际Marco获WMT机器翻译大赛六项冠军，英中赛道超GPT-4.1与Gemini 2.5 Pro等巨头

财经网· 2025-10-23 13:56

赛事成绩与排名 - 阿里国际AI的翻译大模型Marco-MT-Algharb在2025年WMT大赛中斩获6项冠军、4项亚军和2项季军 [1] - 在最受关注的英中语向上，该模型超越了Gemini 2.5 Pro、GPT-4.1、Claude 4和Mistral-Medium等所有顶尖闭源AI系统，登顶榜首 [1] - 该模型在包括英译中在内的13个核心语向表现优异，并在英译中等多个语向上表现超过人工翻译 [1][3] 技术路径与创新 - 模型参加的是难度更高的受限赛道，要求仅使用开源数据和模型，且模型规模不超过200亿参数 [2] - 成功的关键在于将电商翻译训练经验与原创训练方法M2PO（多阶段偏好优化）相结合，首次将强化学习范式应用于大模型翻译领域 [2] - M2PO系统分三步提升翻译质量：通过两轮监督微调拓宽知识基础；引入强化学习让模型学会判断译文优劣；在解码阶段融合词对齐与重排序技术 [2] 行业地位与影响 - WMT的人工评测被视为机器翻译领域的“黄金标准”，其评测结果被全球学术界与工业界视为技术风向标 [1][3] - 此次获奖标志着Marco-MT从电商行业翻译迈向通用翻译的领先行列 [1] - 该模型发布于2024年，最初专注于电商场景翻译，高质量、低幻觉率等核心优势为其向通用翻译拓展打下坚实基础 [3] 业务基础与多模态能力 - 模型已接入公司旗下的电商平台，支持搜索、商品信息、对话、图片等多种场景的翻译 [3] - 跨文化、多语种的业务需求使其具备高质量、低幻觉率等核心优势 [3] - 模型在机器翻译领域展现出多模态竞争力，此前已在2025年IWSLT国际语音翻译赛事中斩获2项冠军和2项亚军 [3]

大模型翻译

大模型翻译

“翻译界哈佛”倒闭，AI杀死首个世界名校？

虎嗅APP· 2025-09-05 19:27

学校关闭决策 - 蒙特雷国际研究学院(MIIS)将于2027年6月正式停止招收研究生[3] - 学院所有住校研究生项目和部分在线学位课程将在明年6月前终止[8] - 该决定直接源于财务压力学院目前面临2500万美元年度亏损[30] 财务与运营状况 - 明德学院今年4月出现1410万美元巨额赤字其中870万美元由MIIS直接造成[23] - 全日制入学人数自2009年持续下降目前仅440名学生不足850人目标的一半[30] - 削减教职工福利和扩大招生等自救措施适得其反引发师生大规模抗议[24][25] 行业冲击与职业影响 - 微软研究报告将口译和笔译员列为TOP 40高危职业首位替代评分达0.49[11][40] - 该职业在美国就业人数为51,560人 AI覆盖度0.98 完成度0.88[12][42] - 专业翻译人员收入锐减 "译后编辑"(PED)工作报酬仅为正常翻译的1/4[52] 技术发展现状 - AI翻译实现毫秒级延迟 Meta AI实时翻译模型延迟已缩短至2秒内[56] - 谷歌翻译支持超70种语言实时双向对话[31] - 技术仍存在局限术语管理和分类仍需人工干预[62][64] 市场反应与个案影响 - 高端学术会议已普遍采用AI口译服务[2] - 从业15年的专业翻译面临生计困难医疗制药等专业领域同样受影响[48][50] - 有翻译从业者转行从事清洁工等职业[52]

腾讯混元最新开源成“最强翻译”：国际机器翻译比赛获30个语种第一

量子位· 2025-09-03 13:49

国际翻译比赛表现 - 腾讯混元Hunyuan-MT-7B模型在ACL WMT2025比赛中获得31个语种中的30个第一名处于绝对领先地位[4] - 该模型以7B总参数量击败了众多参数更大的模型包括Gemini-2.5-Pro、GPT-4.1、Qwen3-235B等大型模型[4][5] - 比赛要求参数规模≤20B 且只能使用公开数据训练在严格约束下取得优异成绩[5][29] 技术框架创新 - 采用协同增强策略优化（Shy）框架包含基础模型开发和集成策略两大组成部分[15][19] - 基础模型开发通过持续预训练、监督微调和GRPO强化学习三阶段构建[16][17] - 集成策略采用学习型集成方法通过生成多个候选翻译并训练专门模型进行智能选择或组合[18][26][27] 算法突破 - 首次在机器翻译领域应用GRPO（组相对策略优化）算法采用组内相对优势替代全局基线[21][22] - GRPO算法显著降低梯度方差提升训练稳定性并提高样本效率加速模型收敛[23][24] - 采用复合奖励函数r=0.2×BLEU+0.4×XCOMET+0.4×DeepSeek 综合评估准确性、语义质量和流畅性[24] 模型性能优势 - 支持33个语种和5种民汉语言/方言互译包括中文、英语、日语及捷克语、马拉地语等小语种[1][4] - 在Flores200测评数据集上表现卓越明显领先同尺寸模型与超大尺寸模型效果相当[6][8][9] - 在英语-简体中文翻译任务中AutoRank达到满分1.0 得分87.2 领先第二名Gemini-2.5-Pro的85.2分[5] 应用与部署优势 - 计算效率高 7B模型推理速度快经FP8量化压缩后推理性能提升30%[30] - 部署友好可在从高端服务器到边缘设备的多样化硬件环境中运行[30] - 已接入腾讯会议、企业微信、QQ浏览器、翻译君等多个业务产品[30] 开源生态建设 - 模型完全开源基于Hunyuan-7B基础模型构建[2][31] - 使用OPUS Collection、ParaCrawl、UN Parallel Corpus等公开数据集训练[16][31] - 提供GitHub和HuggingFace等多个平台访问渠道降低技术门槛[35] 行业方法论价值 - 为垂直领域专业化优化提供可借鉴模板涵盖数据、算法、架构等多维度系统性设计[33][34] - 学习型集成方法实现从启发式到学习型的跃升为模型融合提供新思路[26][34] - GRPO算法证明强化学习在序列生成任务中的潜力具有行业推广价值[21][34]

腾讯控股(HK:00700)

腾讯混元Hunyuan-MT-7B

Hunyuan-MT-Chimera-7B（奇美拉）

腾讯混元Hunyuan-MT-7B

Hunyuan-MT-Chimera-7B（奇美拉）

全球机器翻译比赛拿下30个语种第1名，腾讯混元翻译模型开源

搜狐财经· 2025-09-02 19:32

模型开源与性能 - 腾讯混元于9月1日开源轻量级翻译模型Hunyuan-MT-7B 总参数量7B 支持33个语种及5种民汉语言/方言互译 [1] - 同步开源业界首个翻译集成模型Hunyuan-MT-Chimera-7B 可综合多个模型结果生成更优翻译支持接入Deepseek等第三方模型 [3] - 在ACL WMT2025比赛中该模型获得31个语种中30个第一名涵盖中文英语日语及捷克语等小语种 [4] 技术优势与突破 - 模型采用完整训练范式覆盖预训练CPT监督调参翻译强化和集成强化全链条 [4] - 基于FP8量化压缩技术推理性能提升30% 支持高端服务器到边缘设备的多硬件部署 [6] - 在Flores200测评数据集上表现卓越效果领先同尺寸模型且不逊于超大尺寸模型 [4] 应用场景与生态建设 - 模型已接入腾讯会议企业微信QQ浏览器翻译君等业务助力产品体验提升 [6] - 公司自2023年起持续开源文生文文生图视频生成及3D生成能力工具集相关模型多次登顶开源社区热度榜 [7] - 模型已在腾讯官网Huggingface及Github提供下载技术报告与论文同步公开 [7]

腾讯控股(HK:00700)

大模型技术

Hunyuan-MT-Chimera-7B

大模型技术

Hunyuan-MT-Chimera-7B

AI模型终于能翻译“拼多多砍一刀”了

36氪· 2025-09-02 16:25

腾讯混元机器翻译模型发布 - 腾讯混元开源首批翻译模型Hunyuan-MT-7B和Hunyuan-MT-Chimera-7B 支持33个语种互译包括粤语、维吾尔语、藏语等少数民族语言或方言 [1] - 模型重点优化中文与少数民族语言双向翻译采用针对性数据整理和优化措施显著提升资源匮乏环境下的翻译效果 [4] - 模型基于腾讯自研AngelSlim大模型压缩工具进行FP8量化压缩推理性能提升30% 7B尺寸可在消费级GPU流畅运行 [7] 模型性能表现 - 在WMT 2025通用机器翻译任务中 Hunyuan-MT-7B在31对语言组合互译中获得30项第一涵盖中文、英语等资源丰富语言及捷克语、冰岛语等资源匮乏语言 [4] - 在FLORES-200和WMT24pp等基准测试中模型表现超越同尺寸模型及谷歌翻译等专用系统甚至击败参数数十倍于它的DeepSeek-V3等模型 [2][23] - 在汉语与少数民族语言翻译任务中 Hunyuan-MT-7B获得0.6082分 Hunyuan-MT-Chimera-7B获得0.6089分高于所有竞品最接近的Gemini-2.5-Pro为0.5811分 [27] 技术特点与创新 - 模型能精准理解网络用语、游戏用语等并结合语境意译如将"砍一刀"准确翻译为拼多多降价机制将"小红薯"理解为社交平台REDnote [8][9] - 采用"弱到强"强化学习方法 Hunyuan-MT-Chimera-7B在推理阶段整合不同系统的多条候选译文生成质量超越单一候选译文的输出 [5] - 预训练数据包含1.3万亿个token的非中英文少数语种数据集涵盖112种语言及方言通过多语种数据质量评估模型进行加权处理 [19] 应用场景与局限性 - 模型在游戏场景、俚语表达和专业术语翻译上表现优异能正确翻译医学术语和完整地址而谷歌翻译往往保持原文不变 [10][12] - 但在专业翻译考试中表现一般在CATTI真题翻译中出现会议名称错误和缩写混淆等问题仅达到入门级译者水平 [15][16][17] - 模型在文化背景理解和语用处理上优势明显能恰当翻译非正式语言和强调性脏话避免直译为粗俗用语 [13] 行业意义与发展 - 机器翻译模型对开展跨国业务的企业具有现实价值可替代或加速部分人工翻译流程实现降本增效 [28] - 生成式AI为机器翻译带来新解决方案越来越多厂商使用Transformer等新架构打造翻译模型 [28] - 腾讯混元通过监督微调、强化学习和弱到强强化学习三种后训练方法进一步提升模型翻译能力 [24][25]

腾讯控股(HK:00700)

Artificial Intelligence

Hunyuan-MT-Chimera-7B

Artificial Intelligence

Hunyuan-MT-Chimera-7B

同花顺：上半年净利润同比增长38.29% 拟10派1元

格隆汇APP· 2025-08-22 20:13

财务表现 - 2025年上半年实现营业收入17.79亿元同比增长28.07% [1] - 实现归属于上市公司股东的净利润5.02亿元同比增长38.29% [1] - 拟向全体股东每10股派发现金红利1元（含税） [1] 业务驱动因素 - 受资本市场回暖影响公司网站和APP用户活跃度上升 [1] - 广告及互联网推广服务业务收入增加 [1] - 投资者对金融信息服务需求上升增值电信业务收入增加 [1] 技术发展 - 报告期内公司大模型、智能语音、自然语言处理技术取得较大突破 [1] - 机器翻译、图形图像等技术应用取得较大突破 [1]

同花顺(SZ:300033)

自然语言处理

图形图像技术

金融信息服务

自然语言处理

图形图像技术

金融信息服务

理想VLA实质是强化学习占主导的持续预测下一个action token

理想TOP2· 2025-08-11 17:35

核心观点 - 对predict the next token的不同理解反映了对LLM或AI潜力与实质的认知差异 [1] - 认为predict the next token超越统计学的人更倾向于认可LLM潜力大、推理过程是意识雏形、超级对齐重要 [1] - 理想VLA架构通过连续预测action token实现物理世界理解，类比OpenAI的O1O3 [1][10] - 辅助驾驶比chatbot更适合强化学习，因奖励函数更明确且仿真环境更简单 [12][13] Ilya的观点与背景 - Ilya是OpenAI前首席科学家，推动AlexNet、AlphaGo、TensorFlow等多项AI领域突破 [3] - 他认为predict the next token能超越人类表现，因足够聪明的神经网络可推断"理想人物"行为 [4][8] - 预测token的本质是理解其背后的现实世界逻辑，而非单纯统计学 [6][7] - Ilya的论证风格严谨，常以"误差范围对数刻度"等表述体现审慎态度 [9] 理想VLA的技术逻辑 - VLA架构通过传感器输入实时输出action token，结合diffusion优化轨迹，实现物理世界理解 [10] - VLA在NOA开启期间连续预测action token，其推理过程被视为一种动态意识 [11] - 理想将AI软件（神经网络权重）与硬件平台高效结合，技术整合含金量被低估 [13] 辅助驾驶与AI软件的差异 - 辅助驾驶的强化学习优势在于明确奖励函数（安全/舒适/效率）和可仿真性 [12][13] - AI软件内核是神经网络权重，与传统代码式开发范式存在根本差异 [13] - 硬件迭代速度慢于软件，AI软件需AB测试快速迭代，与硬件开发逻辑冲突 [13]

预测下一个token

Artificial Intelligence

预测下一个token

Artificial Intelligence