值得买与中国人民大学高瓴人工智能学院联合取得AIGC研究成果

会议与研究成果 - 2025国际计算机视觉与模式识别会议（CVPR2025）于6月11日至6月15日召开 [2] - 公司与中国人民大学高瓴人工智能学院的联合研究成果《图像转有声视频》入选会议 [2] - 研究首次提出从静态图像生成同步音视频内容的框架JointDiT（Joint Diffusion Transformer） [2] 技术创新与突破 - 成果定义了图像到有声视频生成（I2SV）新任务使静态图像动态化并生成匹配音频 [2] - JointDiT框架利用视频生成器和音频生成器两个单模态预训练扩散模型实现多模态协同生成 [2] - 技术为AIGC领域提供创新突破推动AI多模态高质量发展 [2] 未来研究方向 - 研究团队计划将JointDiT扩展至图像文本音频视频四模态联合建模 [3] - 目标是为构建更通用更智能的多模态生成系统奠定基础 [3]