Workflow
值得买与中国人民大学高瓴人工智能学院联合取得AIGC研究成果

会议与研究成果 - 2025国际计算机视觉与模式识别会议(CVPR2025)于6月11日至6月15日召开 [2] - 公司与中国人民大学高瓴人工智能学院的联合研究成果《图像转有声视频》入选会议 [2] - 研究首次提出从静态图像生成同步音视频内容的框架JointDiT(Joint Diffusion Transformer) [2] 技术创新与突破 - 成果定义了图像到有声视频生成(I2SV)新任务 使静态图像动态化并生成匹配音频 [2] - JointDiT框架利用视频生成器和音频生成器两个单模态预训练扩散模型 实现多模态协同生成 [2] - 技术为AIGC领域提供创新突破 推动AI多模态高质量发展 [2] 未来研究方向 - 研究团队计划将JointDiT扩展至图像 文本 音频 视频四模态联合建模 [3] - 目标是为构建更通用 更智能的多模态生成系统奠定基础 [3]