端到端全双工语音通话大模型

搜索文档
Soul App全双工语音大模型升级 让AI在交互中拥有“主动性”
证券日报网· 2025-07-04 17:46
公司技术升级 - 公司自研端到端全双工语音通话大模型全面升级 重新定义"全双工"交互范式 新模型摒弃传统VAD机制与延迟控制逻辑 打破"轮次对话"模式 赋予AI自主决策对话节奏能力 [1] - 新模型具备多维度感知能力 包括时间感知 环境感知 事件感知 支持口语化表达 音色复刻 让AI更具"真人感" [1] - 该模型即将开启站内内测 将落地于虚拟人实时通话 AI匹配等1V1互动场景 同时探索应用于多人互动场景 [1] 公司AI战略布局 - 公司自2016年上线后便积极拥抱AI 重塑关系的发现 建立 沉淀环节 2020年启动系统AIGC技术研发 在智能对话 语音 3D虚拟人方面有前沿积累 [2] - 2023年推出自研语言大模型SoulX 陆续上线语音生成大模型 语音通话大模型 音乐生成大模型等 2024年AI大模型能力整体升级为多模态端到端大模型 [2] - 公司致力于构建AIBeing和HumanBeing共存的社交社区 让AI作为社交关系网络的重要组成 丰富用户情感支撑体系 [4] 行业趋势与用户需求 - 2025年"AI应用爆发"成为行业共识 社交领域因具备高流量价值 网络效应和交互入口特点 被视为诞生AI时代"KillerApp"重要领域之一 [2] - 公司调研显示 近四成年轻人每天使用AI产品获得情感陪伴 71.1%年轻人愿意和AI做朋友 较去年32.8%比例大幅增长 [3] - 约六成"AI伴侣"活跃用户希望"AI表现更接近真人" 全双工语音通话大模型升级将推动AI社交进入全新阶段 [3] 技术应用场景 - 新模型支持AI实现主动打破沉默 适时打断用户 边听边说 时间语义感知 并行发言讨论等交互功能 [1] - 技术将应用于虚拟人实时通话 AI匹配等1V1互动场景 并探索多人对话场景 让AI精准把握说话时机 延展话题 [1] - 多模态端到端大模型支持文字对话 语音通话 多语种 多模态理解 真实拟人等特性 [2]