DeepL Translate - 财报，业绩电话会，研报，新闻

DeepL Translate

搜索文档

量子位· 2025-11-19 14:20

核心观点 - 百度文档翻译在翻译准确性、AI辅助功能和排版还原度方面表现优于Google翻译和DeepL，尤其在处理学术论文等专业文档时优势明显 [59] 通用场景翻译能力 - 百度文档翻译将功能细分为通用场景、AI论文精翻、AI译后编辑、arXiv在线翻译四个专区，并内置覆盖10+专业领域的翻译模型 [8] - 产品支持200+种语言互译，专业翻译准确率高达90% [17] - 在学术论文翻译测试中，百度文档翻译对"examples"等术语的翻译更贴合学术语境，译为"样本"而非"示例" [17] - 产品支持图片内文字识别与翻译，以及表格内容翻译，能处理图文混排的复杂文档 [18][20] - 支持直接输入arXiv论文链接进行一键全文翻译，省去下载和格式转换步骤 [21] AI辅助功能 - 百度文档翻译在翻译界面右侧提供AI助手，支持快速回答、专业回答、深度思考三种模式 [26] - AI助手能总结论文的创新点、研究方法和结论，并支持逐句提问解答具体内容 [28][30] - 具备一键润色功能，可优化翻译文本的语句表达，减少机翻痕迹 [32] - 能够对论文中的专业术语进行详细解释 [34] - 相比之下，Google翻译不支持AI功能，DeepL的Write功能仅提供基础润色，智能程度有限 [24] 排版还原与编辑能力 - 百度文档翻译在公式、图表、字体样式、段落间距等方面几乎实现1:1原文格式还原 [43] - 支持上传最大200M的文件，并支持Word、PDF、PPT等多种格式的导入和导出 [44] - 提供"AI译后编辑"功能，支持在保留原文格式的基础上逐句对照修改，可进行加粗、倾斜、划线等操作 [52][54] - 提供表格视图模式，便于逐段审阅和编辑，并自动核查术语准确性 [55] - Google翻译仅支持标记原文，DeepL不支持翻译后编辑 [49]

首个AI翻译实战榜单出炉！GPT-4o稳坐天花板，文化方面Qwen系列一马当先丨开源

量子位· 2025-05-23 08:24

核心观点 - 首个应用型AI翻译测评榜单TransBench上线，由阿里国际AI Business团队联合上海人工智能实验室、北京语言大学共同发布，旨在通过新增幻觉率、文化禁忌词、敬语规范等指标重新定义翻译测评标准 [1][2][3][32] - TransBench评测体系从"通用标准""电商文化""文化特性"三大维度构建，数据集涵盖中英法日韩西等多语言并持续更新小语种，评测方法与数据已全面开源 [5][6][7][8][44] - 首期测评结果显示GPT-4o在英语翻译综合得分领先，DeepSeek-V3在中文翻译综合得分第一，阿里Qwen系列在文化特性维度表现突出 [14][16][20][23][24][26] - 阿里国际自研翻译大模型Marco MT日均调用量达6亿次，其真实用户反馈成为TransBench测评体系构建基础 [39][40][41] 评测体系创新 - 新增幻觉率、鲁棒性评测，解决大模型翻译中"编造内容"问题 [3][34] - 首次针对电商等垂直行业构建评测数据，采用真实场景反馈和专家标注训练行业打分模型 [4][35] - 首创文化禁忌和敬语规范评测标准，覆盖跨文化场景下的用户体验痛点 [36][38] 首期测评结果英语翻译能力 - **综合得分前三**：GPT-4o（51.596）、DeepL Translate（49.855）、GPT-4-Turbo（47.753）[16] - **电商行业前三**：Qwen2.5-0.5B-Instruct（0.488）、Qwen2.5-1.5B-Instruct（0.451）、EuroLLM-1.7B-Instruct（0.377）[19] - **文化特性前三**：GPT-4o、DeepL Translate、GPT-4-Turbo [20] 中文翻译能力 - **综合得分前三**：DeepSeek-V3（4.420）、Gemini-2.5-Pro（4.391）、Claude-3.5-Sonnet（4.377）[23] - **文化特性前三**：Qwen2.5-0.5B-Instruct、Llama-3.3-70B-Instruct、Qwen2.5-1.5B-Instruct [24] - **电商行业第一**：DeepSeek-V3（4.420）[25] 阿里国际业务关联 - 旗下AliExpress等电商平台覆盖200+国家地区，多语言翻译需求驱动AI技术投入 [42] - AI Business部门已服务超50万卖家，形成全球化电商AI应用规模效应 [43] - 2026届校招80%岗位为AI相关，包括算法、研发、产品经理等方向 [45]

AI翻译

Artificial Intelligence

Artificial Intelligence

首个AI翻译实战榜单出炉！GPT-4o稳坐天花板，文化方面Qwen系列一马当先丨开源

量子位· 2025-05-22 22:24

TransBench评测体系发布 - 首个应用型AI翻译测评榜单TransBench在OpenCompass上线由阿里国际AI Business团队联合上海人工智能实验室、北京语言大学共同发布[1][2] - 与传统测评体系相比新增幻觉率、文化禁忌词、敬语规范等指标专门针对大模型翻译易出错的关键问题[3] - 评测方法与数据集已全面开源首期测评结果已发布[5] 评测维度与数据集 - 数据集涵盖中、英、法、日、韩、西班牙等多种语言并持续更新海量小语种[6][7] - 根据"通用标准""电商文化""文化特性"三大类整理不同数据集[8] - 从"综合得分""通用标准""电商文化""文化特性"四个维度对模型翻译能力打分[9] 英语翻译评测结果 - 综合得分和通用标准前三：GPT-4o(51.596)、DeepL Translate(49.855)、GPT-4-Turbo(47.753)[16] - 电商行业前三：Qwen2.5-0.5B-Instruct(0.488)、Qwen2.5-1.5B-Instruct(0.451)、EuroLLM-1.7B-Instruct(0.377)[19] - 文化特性前三：GPT-4o、DeepL Translate、GPT-4-Turbo[20] 中文翻译评测结果 - 综合得分和通用标准前三：DeepSeek-V3(4.420)、Gemini-2.5-Pro(4.391)、Claude-3.5-Sonnet(4.377)[23] - 电商行业第一：DeepSeek-V3(4.420)[25] - 文化特性前三：Qwen2.5-0.5B-Instruct、Llama-3.3-70B-Instruct、Qwen2.5-1.5B-Instruct[24] 评测标准创新 - 三大创新维度：全面的通用标准(含幻觉率和鲁棒性)、行业垂直标准、跨文化特性标准[33][35][36] - 首次提出文化禁忌和敬语规范评测数据来自行业真实场景反馈[4][38] - 基于阿里国际Marco MT翻译大模型日均6亿次调用的真实用户反馈构建[40][41] 阿里国际AI布局 - 2023年3月成立AI Business 基于全球化电商场景探索AI技术[43] - 电商平台已广泛应用AI能力服务超50万卖家[43] - 2026届校招80%岗位为AI相关包括算法、研发、产品经理等[45]

阿里巴巴(US:BABA)

AI翻译

大模型翻译测评

Artificial Intelligence

Artificial Intelligence

GPT-4o

DeepL Translate

Qwen系列