刚刚，阿里「欢乐马」正式上线，抢先实测这匹「黑马」

公司产品发布与核心能力 - 阿里巴巴ATH团队于2024年4月27日正式上线视频生成模型HappyHorse 1.0 [2] - 该模型基于原生多模态架构，能够同时生成音视频，并集创作与编辑功能于一体，无需跨平台操作 [3] - 模型在知名AI评测平台Artificial Analysis的文字生视频和图像生视频榜单中均位列第一，将Seedance 2.0挤至第二 [5] - 在Arena榜单上，该模型在视频编辑类别排名第一，在图生视频和文生视频类别均排名第二 [5] - 具体得分显示，在文生视频类别得1444分，领先第三名Veo-3.1（带音频）69分；在图生视频类别同样得1444分，领先第三名Grok-Imagine-Video-720p达23分 [6] 产品定价与市场策略 - 产品定价具有高性价比，720P视频生成价格为每秒0.9元，1080P为每秒1.6元 [11] - 专业会员可享受包月折扣价，叠加限时折扣后，720P和1080P视频生成价格分别降至每秒0.44元和0.78元 [11] - 模型已开放体验，全球专业创作者和企业客户可通过HappyHorse官网及阿里云百炼平台注册使用，大众用户则可在千问App体验 [12] 视频生成功能详解 - 模型支持文生视频、图生视频及多图参考生视频三种模式，覆盖从零创作到素材延展的需求 [16] - 在文生视频方面，模型展现出强大的场景理解与内容自编能力，例如能根据简单提示词自动构建喜剧俱乐部场景、编写笑话并同步口型与对白 [18] - 模型能够生成具有专业广告质感的视频，例如篮球广告片中运动员运球、起跳、投篮动作流畅，并能自动加入慢动作处理 [19] - 模型擅长处理复杂场景，如仅凭一段提示词即可生成五人女团MV，准确完成统一造型、舞蹈表演及复杂的镜头调度（如广角推进、成员近景wink） [20] - 在多主体协同场景（如人类与机器人踢足球）中，模型能保证不同主体的动作衔接丝滑、协同运动自然，没有出现割裂感 [22] - 模型支持3至15秒的任意时长视频生成，并能根据设定时长自动搭配合适的镜头语言 [23] - 模型能够准确理解并执行复杂的镜头语言指令，例如在生成F1赛车视频时，对直升机视角、胶片质感等要求有较好呈现 [24][25][26] - 在图生视频方面，模型能基于单张或多张图片生成动态内容，例如将九宫格照片串联成连贯的旅行Vlog，并保留原始照片的人物、构图等细节 [31][33] - 参考图生视频模式支持上传最多9张图片，模型能理解每张图对应的情节节点并串联成一段有起承转合的小动画，尽管在动态流畅度上仍有提升空间 [36][38] 视频编辑功能详解 - 模型实现了精准的视频编辑功能，用户可通过一句话指令替换视频主体、添加新元素或改变整体风格，同时保证画面其他部分不被错误修改 [43] - 在主体替换测试中（如将猫咪替换为金毛犬），模型能完美保留原视频中摇尾巴的动作、沙发背景、镜头切换及戴墨镜等细节，无明显贴片感 [44] - 模型具备凭空添加新元素的能力，例如在赛车经过便利店的视频中添加一位推门走出的金发美女，新元素与原素材在空间逻辑、镜头角度和光线条件上融合自然 [45][46][47] - 模型支持跨风格转换，例如将动漫风格改为写实风格，过程中未出现风格过渡失真或人物、动作形变等问题 [48] 行业竞争地位与产品优势 - 在竞争激烈的AI视频生成领域，HappyHorse 1.0的核心优势在于其扎实的基本功，包括画面质感、人物真实感、运镜流畅度等，这些是内容生产者的核心需求 [50] - 该产品的一大突破在于将视频生成与视频编辑功能整合于同一平台，顺应了内容生产需要反复修改和持续迭代的工作流程 [51] - 尽管是首次亮相，但模型在画面质感、镜头运动、人物真实感与内容可控性等方面均表现出色，具备较强的市场竞争力 [11][50]