可灵VS即梦:初探“多模态”
钛媒体APP·2025-09-11 13:33
文 | 硅基星芒 目前国内两个最火的AI生成视频平台,非可灵和即梦莫属。 作为影视外行人和AI爱好者,我准备组建一个纯AI的"影视团队",看看效果如何。 在正式开始之前,还有一个问题:文生图+图生视频or文生视频? 两个平台都具备上述功能,那么两条路应该走哪条? AI给出的答案是:使用"文生图+图生视频"的方法具备更高的可控性;而"文生视频"的方法能够让视频 更有"动态感"。 考虑了一下成本和效率,我还是选择了可控性优先。 01 第一步:AI编剧,编写剧本 想拍一部电影出来,首先肯定得有编剧来写剧本。 我把先前公众号上发布过的一篇文章,以PDF形式丢给了目前公认性能强大的Gemini 2.5 Pro。 尤其是图生视频指令,涵盖了场景、动作、运镜、风格这些专业化的东西,解决了大麻烦。 02 第二步:AI画师,绘制"分镜图" 前面已经说过,采用"文生图+图生视频"的方式可以提高可控性。 剧本既然已经有了,接下来的任务就是绘制"分镜"。 我把AI编剧写好的这些首帧图片指令,统统交给了腾讯混元这个AI文生图模型。 相比文字,AI在图片领域的能力显然有所下降。 不得不承认,文字方面,AI当编剧确实是绰绰有余。 分镜头脚 ...