阿里发布通义万相2.6系列模型上线国内首个角色扮演功能

公司产品发布与升级 - 阿里于12月16日发布新一代万相2.6系列模型，该模型面向专业影视制作和图像创作场景进行了全面升级 [1] - 万相2.6是国内首个支持角色扮演功能的视频模型，同时支持音画同步、多镜头生成及声音驱动等功能，被描述为全球功能最全的视频生成模型 [1] - 该模型已同步上线阿里云百炼平台及万相官网，企业用户可通过阿里云百炼调用模型API，千问APP也将于近期上线该模型并提供更丰富的玩法 [1][2] 产品性能与技术细节 - 万相2.6在画质、音效、指令遵循等能力上较前代有所提升，单次视频时长达到国内最高的15秒 [1] - 模型新增了角色扮演和分镜控制功能，能一键完成单人、多人、人与物合拍的视频，并自动实现多镜头切换等专业任务 [1] - 在分镜控制上，模型通过高层语义理解，能将原始输入构建为具备完整故事线与叙事张力的专业级多镜头段落，并在切换中保持核心主体、场景布局和环境氛围的统一 [2] - 通义万相在模型结构上集成了多项创新技术，可对输入参考视频进行多模态联合建模与学习，提取时序信息的主体情绪、姿态、多角度视觉特征以及音色、语速等声学特征，以实现从画面到声音的全感官一致性保持与迁移 [1] 产品应用与市场地位 - 万相2.6的角色扮演功能让普通用户也能生成影视级画面，例如用户上传个人视频并输入风格提示词后，模型能在几分钟内完成分镜设计、角色演绎、画面配音等工作，生成电影级短片 [2] - 今年9月，阿里在国内率先发布的万相2.5模型（支持音画同步）已在权威大模型评测集LMArena上，使公司的图生视频能力位居国内第一 [1] - 目前，万相模型家族已支持文生图、图像编辑、文生视频、图生视频、人声生视频、动作生成、角色扮演及通用视频编辑等10多种视觉创作能力 [2] - 该系列模型已广泛应用于AI漫剧、广告设计和短视频创作等领域 [2]