六问讯飞 AI:新品耳机发布背后,如何理解讯飞 AI 翻译战略与技术创新?

AI同传技术升级与新品发布 - 公司对中英同传效果进行优化,翻译主观体验提升至4.6分(满分5分),首字响应时间降低至2秒 [2] - 专业词库扩充至10万以上,覆盖医疗、金融、法律等高壁垒行业,并新增中英到阿拉伯语、西班牙语的端到端同传互译功能 [2] - 中英同传引入“声音复刻”功能,用户仅需一句话语音样本即可用自身音色播报翻译结果 [2] 翻译硬件产品功能升级 - 新一代AI翻译耳机搭载“多感融合AI降噪系统”,采用骨导与气导结合的开放式设计,支持60种语言同传互译,内置10万以上专业词库 [4] - 耳机中英同传首响播报延迟低至2秒,采用蓝牙6.0连接技术,覆盖通话实时翻译、面对面翻译、线上同传和旁听同传四大核心场景 [4] - 双屏翻译机2.0新增讲话人分离功能,可智能区分讲话人并支持自定义名称,结合星火办公大模型新增会议纪要生成与内容分享功能,预计10月底上线 [4] 技术实力与行业地位 - 国际权威咨询机构IDC最新报告显示,公司在AI翻译速度、效果、专业度等8大核心维度中排名第一,其中6项获得满分 [6] - 公司坚持大模型自主研发战略,核心是“自主研发 + 场景落地”,所有研发均基于自主芯片与国产化硬件,确保技术自主可控 [9][10] - 公司在大模型领域致力于打造多语种能力突出的模型,并与教育、医疗、翻译等行业场景深度融合,解决行业实际问题 [10] 核心技术与创新优势 - 公司在语音识别、多语种翻译准确率等核心技术持续投入,星火语音大模型支持101种语言识别、全国202个地市级方言识别,并支持55种语言的语音合成 [11] - 翻译耳机采用全球首创的“多感融合能源降噪”,配备2个数字硅麦克风和1个骨传导麦克风,结合自研降噪算法,在嘈杂场景下能清晰拾音 [12] - 复杂降噪算法全离线运行,通过模型芯片化将复杂模型压缩至几十KB大小,在内存有限的设备上实现高效实时处理 [12] 方言与小语种翻译突破 - 针对方言翻译,公司已覆盖全国202个地市级方言,并与输入法合作推行“方言保护计划”以持续收集数据 [15] - 在多语言方面,公司支持101个语种的识别和55个语种的合成,采用多语种共享建模关键技术提升小语种语音系统性能 [15] - 通过设计多语种通用音素体系和基本语言单元,实现多语种统一音素韵律体系的构建,利用元学习和语族分组进行共享建模 [15] 产品战略与场景应用 - 公司AI翻译战略定位围绕全球化交流深化趋势,形成“语音识别-翻译-语音合成-端侧产品”的完整技术链条 [8] - 构建全产品矩阵,从轻量级软件到标准化硬件,再到软硬件一体解决方案,不同场景适配不同产品形态,技术底座打通 [8][9] - 随着“一带一路”推进和中国企业出海,跨国商务沟通对即时、准确、便携的翻译工具需求激增,公司硬件产品覆盖从个人使用到企业级会议的全场景 [17] 外事场景定制化解决方案 - 双屏翻译机2.0采用双屏设计,在对话过程中为工作人员和外国乘客提供专属屏幕,提升沟通效率并体现尊重 [18] - 设备支持在线翻译为200多个国家和地区的语言,能识别35种语言,可自动识别语言以快速打破沟通壁垒 [18] - 配备5麦克风阵列与AI降噪技术,支持全向、定向两种收音模式,能过滤1米外背景噪音,在嘈杂环境下精准锁定目标音源 [19] - 设备具备离线模式,在无网、弱网情况下依然可使用,适配高保密场景 [19]