Workflow
全双工语音通话大模型
icon
搜索文档
Soul即将内测全双工语音通话大模型
北京商报· 2025-07-29 20:19
北京商报讯(记者 魏蔚)7月29日,北京商报记者获悉,Soul即将内测自研端到端全双工语音通话大模 型,后续将陆续落地于虚拟人实时通话、AI匹配等1V1、多对多互动场景。2020年,Soul启动系统的 AIGC(人工智能生成内容)技术研发工作,自2023年推出自研的Soul X后,陆续上线语音生成大模 型、语音通话大模型、音乐生成大模型等大模型能力。2024年,Soul AI大模型能力体升级为多模态端 到端大模型,支持文字对话、语音通话、多语种、多模态理解、真实拟人等特性。 ...
直击WAIC|Soul App亮相WAIC 2025,公布全双工语音通话大模型
新浪科技· 2025-07-27 15:58
公司动态 - Soul App在2025世界人工智能大会(WAIC 2025)上展示最新升级的自研端到端全双工语音通话大模型及其在多人语音互动场景群聊派对AI主持的应用交互效果 [1] - 公司CTO陶明表示AI融入社交关系网络、重构交互方式已成为大势所趋,Soul致力于构建AI与人类共存的社交社区 [3] - 公司在大会现场以"AI社交练习"为主题,重点展示全双工语音/视频通话能力支持的"超类真人"和"深度沉浸"社交体验 [3] 技术突破 - Soul自研的端到端全双工语音通话大模型摒弃传统VAD机制与延迟控制逻辑,打破行业"轮次对话"模式,赋予AI自主决策对话节奏能力 [4] - 全双工通话大模型即将在平台内测,后续将落地于虚拟人实时通话、AI匹配等1V1、多对多互动场景 [4] - 公司展示了基于全双工语音通话能力和实时视频生成能力的最新探索成果,使用户可以看到"AI的形象和世界" [4] 产品应用 - AI在社交中扮演双重角色:情感疗愈伙伴(解析用户社交困境,提供情绪赋能)和真人关系桥梁(捕捉共鸣信号催化真实友谊) [3] - 公司通过全双工实时视频通话能力,使用户能多维度塑造"数字人格",促进关系深度链接 [4] - 此前Soul团队实时人像视频生成研究成果已被国际学术顶会CVPR2025接收 [4]
Soul App携全双工语音通话大模型亮相WAIC 2025,重新定义AI社交边界
IPO早知道· 2025-07-26 20:58
技术创新驱动AI社交升级 - 公司Soul App在WAIC 2025展览中展示了AI社交创新解决方案,重点呈现自研端到端全双工语音通话大模型,应用于多人语音互动场景的群聊派对AI主持,提升交互智能性和沉浸感[2] - 公司CTO陶明提出AI融入社交关系网络是大势所趋,致力于构建AI与人类共存的社交社区,通过AI赋能提升用户体验和归属感[2] 全双工音视频通话技术突破 - 公司最新升级的全双工语音通话大模型摒弃传统VAD机制和延迟控制逻辑,赋予AI自主决策对话节奏能力,打破行业"轮次对话"模式[4] - 该技术即将内测,计划应用于虚拟人实时通话、AI匹配等1V1及多对多互动场景,现场展示中AI主持人可自然互动并提升群聊参与度[5][6] - 公司探索多模态交互,结合全双工语音和实时视频生成能力,使用户能感知"AI形象和世界",相关研究成果已被CVPR2025收录[8] AI社交场景应用与社区构建 - 公司以"AI辅助社交"和"人机互动"为方向,通过虚拟人与真人社交融合推动"情感共生",例如灵犀引擎和Soul X大模型系列(含语音生成、音乐生成等)[12][16] - 平台广场18%新发帖反映用户真实社交困境,公司基于此构建"社交样本库",通过AI推荐内容主题、降低表达门槛,并打造虚拟达人生态提供情感支持[15][16] 技术壁垒与行业趋势 - 公司核心壁垒在于自研能力、独家公域社交数据及高效应用迭代,多模态端到端大模型已支持文字对话、语音通话、拟人等特性[12][13] - AI深入社交场景可能催生"情价比消费"等新商业模式,扩展新质生产力在数字生活的应用范围[16]