Workflow
全双工语音通话大模型
icon
搜索文档
WAIC 2025 | AI融入社交网络 Soul新技术让虚拟人更具 “活人感”
新华财经· 2025-07-27 22:48
公司技术展示 - Soul App在2025年世界人工智能大会展示了最新升级的自研端到端全双工语音通话大模型,该技术突破了传统"轮次对话"模式,赋予AI自主决策对话节奏的能力[3] - 公司虚拟人技术具备感知能力和口语化表达特征,能自主决定说话时机并参与讨论,显著提升了"活人感"[1] - 同步展示了全双工实时视频通话能力的最新成果,结合语音通话与实时视频生成技术,使用户能直观看到AI形象与场景,塑造更立体的"数字人格"[4] 技术演进路径 - 公司自2020年启动系统AIGC技术研发,在智能对话、语音、3D虚拟人等领域积累前沿成果[4] - 2023年推出自研Soul X后,陆续上线语音生成大模型、语音通话大模型、音乐生成大模型等产品[4] - 2024年将AI大模型能力整体升级为多模态端到端大模型,支持文字对话、语音通话、多语种交互等特性[4] 应用场景规划 - 新技术即将在平台开启内测,后续将落地于虚拟人实时通话、AI匹配等一对一及多对多互动场景[3] - AI在社交中扮演双重角色:作为情感疗愈伙伴动态解析用户社交困境,同时作为真人关系桥梁催化真实友谊萌芽[3] - 全双工语音能力应用于多人互动场景被视为加速AI融入社交关系网络的关键一步[4] 行业趋势判断 - AI融入社交关系网络并重构交互方式已成为行业大势所趋[4] - 新质生产力深入陪伴、社交等场景将扩展新质消费范围,催生"情价比消费"等全新市场机会[5] - 技术革新将推动社交行业诞生新的产品范式与商业化模式[5]
直击WAIC|Soul App亮相WAIC 2025,公布全双工语音通话大模型
新浪科技· 2025-07-27 15:58
公司动态 - Soul App在2025世界人工智能大会(WAIC 2025)上展示最新升级的自研端到端全双工语音通话大模型及其在多人语音互动场景群聊派对AI主持的应用交互效果 [1] - 公司CTO陶明表示AI融入社交关系网络、重构交互方式已成为大势所趋,Soul致力于构建AI与人类共存的社交社区 [3] - 公司在大会现场以"AI社交练习"为主题,重点展示全双工语音/视频通话能力支持的"超类真人"和"深度沉浸"社交体验 [3] 技术突破 - Soul自研的端到端全双工语音通话大模型摒弃传统VAD机制与延迟控制逻辑,打破行业"轮次对话"模式,赋予AI自主决策对话节奏能力 [4] - 全双工通话大模型即将在平台内测,后续将落地于虚拟人实时通话、AI匹配等1V1、多对多互动场景 [4] - 公司展示了基于全双工语音通话能力和实时视频生成能力的最新探索成果,使用户可以看到"AI的形象和世界" [4] 产品应用 - AI在社交中扮演双重角色:情感疗愈伙伴(解析用户社交困境,提供情绪赋能)和真人关系桥梁(捕捉共鸣信号催化真实友谊) [3] - 公司通过全双工实时视频通话能力,使用户能多维度塑造"数字人格",促进关系深度链接 [4] - 此前Soul团队实时人像视频生成研究成果已被国际学术顶会CVPR2025接收 [4]
Soul App携全双工语音通话大模型亮相WAIC 2025,重新定义AI社交边界
IPO早知道· 2025-07-26 20:58
技术创新驱动AI社交升级 - 公司Soul App在WAIC 2025展览中展示了AI社交创新解决方案,重点呈现自研端到端全双工语音通话大模型,应用于多人语音互动场景的群聊派对AI主持,提升交互智能性和沉浸感[2] - 公司CTO陶明提出AI融入社交关系网络是大势所趋,致力于构建AI与人类共存的社交社区,通过AI赋能提升用户体验和归属感[2] 全双工音视频通话技术突破 - 公司最新升级的全双工语音通话大模型摒弃传统VAD机制和延迟控制逻辑,赋予AI自主决策对话节奏能力,打破行业"轮次对话"模式[4] - 该技术即将内测,计划应用于虚拟人实时通话、AI匹配等1V1及多对多互动场景,现场展示中AI主持人可自然互动并提升群聊参与度[5][6] - 公司探索多模态交互,结合全双工语音和实时视频生成能力,使用户能感知"AI形象和世界",相关研究成果已被CVPR2025收录[8] AI社交场景应用与社区构建 - 公司以"AI辅助社交"和"人机互动"为方向,通过虚拟人与真人社交融合推动"情感共生",例如灵犀引擎和Soul X大模型系列(含语音生成、音乐生成等)[12][16] - 平台广场18%新发帖反映用户真实社交困境,公司基于此构建"社交样本库",通过AI推荐内容主题、降低表达门槛,并打造虚拟达人生态提供情感支持[15][16] 技术壁垒与行业趋势 - 公司核心壁垒在于自研能力、独家公域社交数据及高效应用迭代,多模态端到端大模型已支持文字对话、语音通话、拟人等特性[12][13] - AI深入社交场景可能催生"情价比消费"等新商业模式,扩展新质生产力在数字生活的应用范围[16]
Soul App全双工语音大模型升级 让AI在交互中拥有“主动性”
证券日报网· 2025-07-04 17:46
公司技术升级 - 公司自研端到端全双工语音通话大模型全面升级 重新定义"全双工"交互范式 新模型摒弃传统VAD机制与延迟控制逻辑 打破"轮次对话"模式 赋予AI自主决策对话节奏能力 [1] - 新模型具备多维度感知能力 包括时间感知 环境感知 事件感知 支持口语化表达 音色复刻 让AI更具"真人感" [1] - 该模型即将开启站内内测 将落地于虚拟人实时通话 AI匹配等1V1互动场景 同时探索应用于多人互动场景 [1] 公司AI战略布局 - 公司自2016年上线后便积极拥抱AI 重塑关系的发现 建立 沉淀环节 2020年启动系统AIGC技术研发 在智能对话 语音 3D虚拟人方面有前沿积累 [2] - 2023年推出自研语言大模型SoulX 陆续上线语音生成大模型 语音通话大模型 音乐生成大模型等 2024年AI大模型能力整体升级为多模态端到端大模型 [2] - 公司致力于构建AIBeing和HumanBeing共存的社交社区 让AI作为社交关系网络的重要组成 丰富用户情感支撑体系 [4] 行业趋势与用户需求 - 2025年"AI应用爆发"成为行业共识 社交领域因具备高流量价值 网络效应和交互入口特点 被视为诞生AI时代"KillerApp"重要领域之一 [2] - 公司调研显示 近四成年轻人每天使用AI产品获得情感陪伴 71.1%年轻人愿意和AI做朋友 较去年32.8%比例大幅增长 [3] - 约六成"AI伴侣"活跃用户希望"AI表现更接近真人" 全双工语音通话大模型升级将推动AI社交进入全新阶段 [3] 技术应用场景 - 新模型支持AI实现主动打破沉默 适时打断用户 边听边说 时间语义感知 并行发言讨论等交互功能 [1] - 技术将应用于虚拟人实时通话 AI匹配等1V1互动场景 并探索多人对话场景 让AI精准把握说话时机 延展话题 [1] - 多模态端到端大模型支持文字对话 语音通话 多语种 多模态理解 真实拟人等特性 [2]