Workflow
Soul技术突破!实时人像视频生成研究成果被CVPR2025录用
中国产业经济信息网·2025-07-01 07:20

技术突破与学术认可 - 公司新型社交平台Soul App的技术论文《Teller: Real-Time Streaming Audio-Driven Portrait Animation with Autoregressive Motion Generation》被人工智能领域顶会CVPR 2025录用,标志着公司在AI社交领域的技术研发取得重大突破 [1] - CVPR 2025会议总投稿13008篇,录用2878篇,录用率仅为22.1%,公司论文入选彰显其技术实力获得学术界与行业高度认可 [2] - 公司此前已在AI领域多次亮相,包括2024年多模态情感识别研究论文入选ACM国际多媒体会议研讨会,以及在国际人工智能联合会议挑战赛中半监督学习赛道夺冠 [2] AI技术发展历程 - 公司自2016年上线基于AI算法的灵犀引擎,到2023年推出自研语言大模型Soul X,再到如今多模态端到端大模型的升级,持续深耕AI社交领域 [2] - 此次被录用的论文提出实时音频驱动人像动画自回归框架,创新性地将talking head任务拆分为面部Motion生成和高效身体Movement生成模块,大幅提升视频生成效率和自然度 [2] - 公司在语音、视觉、NLP融合方面的积极探索为打造更真实的AI社交交互体验奠定基础 [2] 应用场景与未来规划 - 公司此前基于多模态大模型上线的语音交互功能已获得用户广泛好评,此次技术突破将从语音到视觉实现交互模态升级,带来更沉浸式社交体验 [3] - 公司计划将技术成果应用于实时视频通话、AI虚拟人情感化陪伴等多元场景,进一步提升人机交互的情感温度 [3] - 公司在AI社交领域的持续创新不仅优化用户体验,也为行业发展指明方向,未来将继续推动AI社交迈向新高度 [3]