Workflow
用大脑“说话”:脑机接口让失语者再次发声
虎嗅·2025-07-15 08:26

脑机接口技术突破 - 加州大学戴维斯分校联合团队首次实现通过大脑信号直接生成自然语音的技术,让渐冻症患者恢复对话能力[1][4] - 系统采用256通道微电极阵列植入患者大脑左侧前中央回腹部,捕捉"试图说话"时的神经电信号[7] - 双路径解码机制结合两套深度神经网络,分别预测语音内容(音素概率及声学特征)和副语言信息(语调/情绪),还原率超90%[11][12] 核心技术架构 - 系统工作流程分为神经信号采集、解码、语音合成和实时播放四步闭环,延迟达毫秒级[7][12] - 创新算法通过屏幕提示语引导患者生成神经-语音配对数据,解决训练数据缺失问题[8] - Transformer架构模型每10毫秒预测一次语音频谱与音高特征,个性化声码器融合患者早期录音保留音色特征[9][10] 性能指标 - 疑问语调识别准确率90.5%,词语重读识别准确率95.7%,自由表达音频质量Pearson相关系数0.79±0.05[12] - 成功实现语速调控、语调区分(疑问/陈述句)、词语强调定位及音高合成(精度>73%)[17] - 系统在无提示问答任务中仍能生成清晰语音输出,显示向自主表达迈进的技术潜力[20] 应用前景与局限 - 技术已开源并计划拓展至中风、脑瘫等多类失语人群,未来或与非侵入式脑电技术结合[18] - 当前局限包括依赖外部引导(屏幕提示)、样本仅1例ALS患者、语调自然度与真实对话存在差距[19][21] - 长期挑战涉及自由表达实现、设备侵入性降低及长期稳定性提升[22]