Workflow
机器翻译
icon
搜索文档
AI模型终于能翻译“拼多多砍一刀”了
36氪· 2025-09-02 16:25
腾讯混元机器翻译模型发布 - 腾讯混元开源首批翻译模型Hunyuan-MT-7B和Hunyuan-MT-Chimera-7B 支持33个语种互译 包括粤语、维吾尔语、藏语等少数民族语言或方言 [1] - 模型重点优化中文与少数民族语言双向翻译 采用针对性数据整理和优化措施 显著提升资源匮乏环境下的翻译效果 [4] - 模型基于腾讯自研AngelSlim大模型压缩工具进行FP8量化压缩 推理性能提升30% 7B尺寸可在消费级GPU流畅运行 [7] 模型性能表现 - 在WMT 2025通用机器翻译任务中 Hunyuan-MT-7B在31对语言组合互译中获得30项第一 涵盖中文、英语等资源丰富语言及捷克语、冰岛语等资源匮乏语言 [4] - 在FLORES-200和WMT24pp等基准测试中 模型表现超越同尺寸模型及谷歌翻译等专用系统 甚至击败参数数十倍于它的DeepSeek-V3等模型 [2][23] - 在汉语与少数民族语言翻译任务中 Hunyuan-MT-7B获得0.6082分 Hunyuan-MT-Chimera-7B获得0.6089分 高于所有竞品 最接近的Gemini-2.5-Pro为0.5811分 [27] 技术特点与创新 - 模型能精准理解网络用语、游戏用语等并结合语境意译 如将"砍一刀"准确翻译为拼多多降价机制 将"小红薯"理解为社交平台REDnote [8][9] - 采用"弱到强"强化学习方法 Hunyuan-MT-Chimera-7B在推理阶段整合不同系统的多条候选译文 生成质量超越单一候选译文的输出 [5] - 预训练数据包含1.3万亿个token的非中英文少数语种数据集 涵盖112种语言及方言 通过多语种数据质量评估模型进行加权处理 [19] 应用场景与局限性 - 模型在游戏场景、俚语表达和专业术语翻译上表现优异 能正确翻译医学术语和完整地址 而谷歌翻译往往保持原文不变 [10][12] - 但在专业翻译考试中表现一般 在CATTI真题翻译中出现会议名称错误和缩写混淆等问题 仅达到入门级译者水平 [15][16][17] - 模型在文化背景理解和语用处理上优势明显 能恰当翻译非正式语言和强调性脏话 避免直译为粗俗用语 [13] 行业意义与发展 - 机器翻译模型对开展跨国业务的企业具有现实价值 可替代或加速部分人工翻译流程 实现降本增效 [28] - 生成式AI为机器翻译带来新解决方案 越来越多厂商使用Transformer等新架构打造翻译模型 [28] - 腾讯混元通过监督微调、强化学习和弱到强强化学习三种后训练方法进一步提升模型翻译能力 [24][25]
同花顺:上半年净利润同比增长38.29% 拟10派1元
格隆汇APP· 2025-08-22 20:13
财务表现 - 2025年上半年实现营业收入17.79亿元 同比增长28.07% [1] - 实现归属于上市公司股东的净利润5.02亿元 同比增长38.29% [1] - 拟向全体股东每10股派发现金红利1元(含税) [1] 业务驱动因素 - 受资本市场回暖影响 公司网站和APP用户活跃度上升 [1] - 广告及互联网推广服务业务收入增加 [1] - 投资者对金融信息服务需求上升 增值电信业务收入增加 [1] 技术发展 - 报告期内公司大模型、智能语音、自然语言处理技术取得较大突破 [1] - 机器翻译、图形图像等技术应用取得较大突破 [1]
理想VLA实质是强化学习占主导的持续预测下一个action token
理想TOP2· 2025-08-11 17:35
核心观点 - 对predict the next token的不同理解反映了对LLM或AI潜力与实质的认知差异 [1] - 认为predict the next token超越统计学的人更倾向于认可LLM潜力大、推理过程是意识雏形、超级对齐重要 [1] - 理想VLA架构通过连续预测action token实现物理世界理解,类比OpenAI的O1O3 [1][10] - 辅助驾驶比chatbot更适合强化学习,因奖励函数更明确且仿真环境更简单 [12][13] Ilya的观点与背景 - Ilya是OpenAI前首席科学家,推动AlexNet、AlphaGo、TensorFlow等多项AI领域突破 [3] - 他认为predict the next token能超越人类表现,因足够聪明的神经网络可推断"理想人物"行为 [4][8] - 预测token的本质是理解其背后的现实世界逻辑,而非单纯统计学 [6][7] - Ilya的论证风格严谨,常以"误差范围对数刻度"等表述体现审慎态度 [9] 理想VLA的技术逻辑 - VLA架构通过传感器输入实时输出action token,结合diffusion优化轨迹,实现物理世界理解 [10] - VLA在NOA开启期间连续预测action token,其推理过程被视为一种动态意识 [11] - 理想将AI软件(神经网络权重)与硬件平台高效结合,技术整合含金量被低估 [13] 辅助驾驶与AI软件的差异 - 辅助驾驶的强化学习优势在于明确奖励函数(安全/舒适/效率)和可仿真性 [12][13] - AI软件内核是神经网络权重,与传统代码式开发范式存在根本差异 [13] - 硬件迭代速度慢于软件,AI软件需AB测试快速迭代,与硬件开发逻辑冲突 [13]