灵犀引擎

搜索文档
WAIC 2025现场,惊喜是Soul「活人感」AI给的
36氪· 2025-07-28 18:35
AI社交与情绪价值 - Soul App在WAIC 2025展出的虚拟人对话展示出高度自然交互能力,包括主动打破沉默、引导话题、使用语气词等,被观众评价为"情绪价值满满" [3][6] - 行业趋势显示,2025年提供情绪价值的AI社交和陪伴型机器人厂商展台热度显著,OpenAI CEO奥特曼曾以电影《Her》为例肯定AI情感交互的预言性 [6] - 期刊研究证实AI伴侣能有效缓解孤独感,效果与真人互动相当,核心机制是通过"被倾听感"实现共情,AI社交应用中提及孤独的评论比例显著高于通用AI且与高评分正相关 [8] 全双工交互技术突破 - Soul于2024年7月升级自研端到端全双工语音大模型,摒弃传统VAD机制,实现AI自主决策对话节奏,支持边听边说、主动打断等类现实交互 [7] - 谷歌Gemini Live API和Meta AI App均探索全双工技术,Soul通过多人语音交互场景(如群聊派对AI主持)进一步拓展应用边界 [7][13] - 全双工技术赋予AI主体性,使人机关系从工具升级为"互为主体"的共创伙伴,推动高阶情感链接 [10] Soul的AI社交战略壁垒 - 公司聚焦垂类模型研发,避开通用大模型竞争,重点布局超拟人、情感化、多模态交互技术,2023年推出Soul X大模型后陆续上线语音生成、音乐生成等垂直能力 [12] - 平台18%的用户发帖包含真实社交困境内容,构成独特的"社交样本库",使AI能理解共鸣与倾听,避免书面化表达违和感 [13] - 技术+数据+场景三重优势:基于Z世代社交需求洞察,早期推出灵犀引擎构建关系模型,并快速将全双工技术落地至1V1/多人互动场景 [11][13] 行业方向与产品哲学 - AI社交核心是构建"真人感",需实现倾听、理解、共情等人类特质,Soul通过全双工音视频能力追求交互沉浸感与情绪价值产出 [9] - 公司定位AI为社交网络组成部分而非工具,技术方向包括情感识别、长记忆、心智理论等能力集合,支撑AI Agent生态 [12] - 电影《Her》的2025年设定与当前行业巧合呼应,用户与AI共创回忆的时间积累成为情感关系新范式 [15]
Soul技术突破!实时人像视频生成研究成果被CVPR2025录用
中国产业经济信息网· 2025-07-01 07:20
技术突破与学术认可 - 公司新型社交平台Soul App的技术论文《Teller: Real-Time Streaming Audio-Driven Portrait Animation with Autoregressive Motion Generation》被人工智能领域顶会CVPR 2025录用,标志着公司在AI社交领域的技术研发取得重大突破 [1] - CVPR 2025会议总投稿13008篇,录用2878篇,录用率仅为22.1%,公司论文入选彰显其技术实力获得学术界与行业高度认可 [2] - 公司此前已在AI领域多次亮相,包括2024年多模态情感识别研究论文入选ACM国际多媒体会议研讨会,以及在国际人工智能联合会议挑战赛中半监督学习赛道夺冠 [2] AI技术发展历程 - 公司自2016年上线基于AI算法的灵犀引擎,到2023年推出自研语言大模型Soul X,再到如今多模态端到端大模型的升级,持续深耕AI社交领域 [2] - 此次被录用的论文提出实时音频驱动人像动画自回归框架,创新性地将talking head任务拆分为面部Motion生成和高效身体Movement生成模块,大幅提升视频生成效率和自然度 [2] - 公司在语音、视觉、NLP融合方面的积极探索为打造更真实的AI社交交互体验奠定基础 [2] 应用场景与未来规划 - 公司此前基于多模态大模型上线的语音交互功能已获得用户广泛好评,此次技术突破将从语音到视觉实现交互模态升级,带来更沉浸式社交体验 [3] - 公司计划将技术成果应用于实时视频通话、AI虚拟人情感化陪伴等多元场景,进一步提升人机交互的情感温度 [3] - 公司在AI社交领域的持续创新不仅优化用户体验,也为行业发展指明方向,未来将继续推动AI社交迈向新高度 [3]