StreamUni

搜索文档
有助于出海 | 理想新翻译框架既提高翻译质量又降低响应延迟
理想TOP2· 2025-09-13 19:50
以下文章来源于理想汽车硅基研究所 ,作者理想硅基研究所 同声传译(Simultaneous Interpreting)是一项极具挑战的翻译工作,被誉为外语领域的"皇冠技能",要求译员能几乎同步 地将讲话者的内容转换成另一种语言,不打断交流节奏。AI流式语音翻译的目标,就是让机器像人类同传员一样,能 够"边听边翻译",把连续不断的语音流实时变成高质量的翻译结果。 现实中,人类同传具备理解上下文、灵活判断和快速反应的能力,而让机器做到这一点非常困难。相比于传统的"听一 句、翻一句", 流式语音翻译要求模型在面对长时间、不断输入的语音流时,也能持续、低延迟、高质量地输出译文, 不 漏信息也不出现失误。然而在实际研发和应用中,这项任务面临着三大核心挑战: 引言: 近日,理想汽车参与发布了一项新成果——StreamUni,这是一个 流式语音翻译框架 ,旨在解决长时流式语音 翻译中的关键挑战。StreamUni通过单一语音大模型实现了高效的流式语音翻译,并在多个流式语音翻译的评 测标准(Benchmark)上达到了当前最好性能。这一成果不仅为机器同声传译领域带来了新的希望,也为跨文 化交流提供了技术支持。 1. 研究背景 ...