Workflow
全双工通话大模型
icon
搜索文档
赛道Hyper | Soul推出全双工通话大模型
华尔街见闻· 2025-08-01 16:12
公司技术突破 - Soul App在2025世界人工智能大会上展示了其自研的端到端全双工通话大模型,该模型即将开启平台内测 [1] - 该模型摒弃了传统的VAD机制与轮次对话模式,通过算法使AI能自主把控对话节奏,实现实时监测、主动打断、边听边说等操作 [2] - 模型构建了多维度感知体系,包括时间感知、环境感知和事件感知,以更好地理解用户意图和情感状态 [3] - 在技术优化上,模型模拟了语气词、结巴等日常口语特征,并可复刻特定音色,使AI的声音情绪能随对话内容变化 [4] 技术应用场景 - 该大模型计划应用于虚拟人实时通话、AI匹配等1V1及多对多互动场景 [1] - 在虚拟人实时通话中,模型可使虚拟人实时捕捉用户情绪和话语变化,提供更个性化的陪伴服务 [6] - 在AI匹配的1V1互动中,模型能通过算法帮助用户筛选聊天对象,并在交流出现冷场时提供相关话题建议以打破僵局 [6] - 在多人语音互动如群聊派对中,AI主持人可管理秩序、控制发言,并通过发起话题来提升群聊参与度 [6] 行业影响与展望 - 该模型展示了通过技术创新突破传统交互限制,以实现更自然社交体验的可能性 [7] - 技术的推广应用可能促使其他社交平台增加AI技术研发投入,从而推动行业技术发展 [7] - 公司的实践有望吸引更多开发者关注AI社交领域,促使新的社交应用和服务出现 [7] - AI社交的发展可能改变人们的社交方式和观念,更注重情感共鸣和信息交流,并打破地域和时间限制 [7]