Workflow
通义万相2.6系列模型
icon
搜索文档
何小鹏:当前没有AI泡沫|首席AI资讯周报
新浪财经· 2025-12-23 12:52
腾讯混元世界模型1.5发布 - 腾讯正式发布混元世界模型1.5(Tencent HY WorldPlay)[1][10] - 该模型支持通过输入文字描述或图片创建专属互动世界[1][10] - 用户可通过键盘、鼠标或手柄实时控制虚拟相机的移动和转向[1][10] 小鹏汽车董事长何小鹏对AI观点 - 小鹏汽车董事长何小鹏认为当前没有AI泡沫,任何科技时代都是阶段或局部有泡沫[2][11] - 他认为市场从混沌到有序的竞争过程是必然的,AI将推动整个社会巨大变革[2][11] 小米自研大模型开源 - 小米集团总裁卢伟冰宣布自研AI大模型Xiaomi MiMo-V2-Flash正式开源上线[2][12] - 该模型被定位为迈向Agent时代的全新语言基座[2][12] OpenAI与苹果合作及人事变动 - OpenAI应用业务CEO宣布Apple Music将加入与ChatGPT集成的合作伙伴阵营[3][12] - OpenAI任命谷歌企业发展主管Albert Lee为公司企业发展副总裁[4][12] 阿里巴巴通义万相模型升级 - 阿里巴巴发布新一代通义万相2.6系列模型[5][12] - 该系列模型面向专业影视制作和图像创作场景进行全面升级,并上线首个角色扮演功能[5][12] xAI组建企业销售团队 - xAI公司已组建企业级人工智能销售团队[6][13] - 该销售团队规模已达十余人[6][13] 商汤科技模型适配与进展 - 商汤科技发布Seko2.0——行业首个多剧集生成智能体[7][14] - 该产品依托商汤自研的日日新Seko系列模型,并已与寒武纪成功适配[7][14] OpenAI前高管创业动态 - 前OpenAI首席技术官Mira Murati离职后创办Thinking Machines Lab[8][14] - 其新产品Tinker宣布接入Kimi K2 Thinking[8][14] - 据多家媒体报道,该公司最新估值将达500亿美元[8][14] 抖音推出AI教育计划 - 抖音正式启动“AI时代前沿学科共建计划”[9][14] - 该计划将联合抖音精选集中上线100门名校公开课[9][14]
何小鹏:当前没有AI泡沫|首席AI资讯周报
首席商业评论· 2025-12-23 12:07
行业动态:AI大模型与生成式AI应用持续迭代与开源 - 腾讯发布混元世界模型1.5,支持通过文字或图片创建可实时控制的互动世界[2] - 小米宣布其自研大模型MiMo-V2-Flash正式开源上线,定位为迈向Agent时代的语言基座[4] - 阿里巴巴发布通义万相2.6系列模型,针对专业影视制作和图像创作场景进行全面升级[7] - 商汤科技发布行业首个多剧集生成智能体Seko2.0,其背后依托自研的日日新Seko系列模型[8] 公司战略:科技巨头加速AI生态布局与人才竞争 - OpenAI宣布Apple Music即将与ChatGPT集成,并聘请谷歌前高管Albert Lee担任企业发展副总裁[5][6] - xAI已组建规模达十余人的企业级AI销售团队,拓展商业化[7] - 前OpenAI首席技术官Mira Murati离职创业,其新公司Thinking Machines Lab最新估值据报达500亿美元[9] 行业观点与生态建设:看好AI长期价值与推动知识普及 - 小鹏汽车董事长何小鹏认为当前没有AI泡沫,AI将推动社会巨大变革[3] - 抖音推出“AI时代前沿学科共建计划”,联合上线100门名校公开课以助推知识普惠[9]
【数智周报】MiniMax和智谱通过港交所聆讯;OpenAI据悉计划以8300亿美元估值筹资至多1000亿美元;寒武纪:拟使用27.78亿元资本公积金弥补亏损
钛媒体APP· 2025-12-21 12:23
行业观点与战略动向 - 埃隆·马斯克公开质疑核聚变发电的经济性,认为建造小型反应堆是浪费,并计划每年部署规模堪比美国全国电力四分之一的100GW太阳能AI卫星 [2] - 腾讯升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,任命前OpenAI研究员姚顺雨为首席AI科学家并兼任AI Infra部、大语言模型部负责人 [6][7] - TikTok CEO周受资发布内部信,更新美国业务方案:将成立由甲骨文、银湖及MGX等投资者持股45%的新合资公司负责数据安全,字节跳动保留19.9%股份并继续控制电商、广告等商业活动,相关事宜计划在2026年1月22日前完成 [28][29] 国内大模型与AI应用进展 - MiniMax(稀宇科技)已通过港交所聆讯,计划于2026年1月挂牌上市,若成功将成为全球从成立到IPO最快的AI公司,目前服务超200个国家2.12亿用户及超10万企业客户 [5][6] - 智谱华章已通过港交所上市聆讯 [6] - 字节跳动正推进与联想合作,为其AI手机预装AIGC插件 [8] - 豆包大模型1.8发布,面向多模态Agent场景优化,工具调用与复杂指令遵循能力增强 [9] - 千问APP开始接入阿里生态,首站接入高德地图,可调用导航、打车等底层服务 [10] - 阿里发布通义万相2.6系列模型,是国内首个支持角色扮演功能的视频模型,支持音画同步、多镜头生成 [11] - 生数科技推出可商用的一站式AI视频Agent解决方案Vidu Agent,能自动产出15秒/30秒完整广告片 [12] - 百度发布文心健康管家,定位“全能家庭医生”,覆盖全周期健康服务,并推出“原子计划”向行业免费开放100+AI能力 [13][14] - 美团发布并开源SOTA级虚拟人视频生成模型LongCat-Video-Avatar,支持音频、文本、图像生成视频等多种功能 [18] 芯片、算力与基础设施 - 中科曙光发布并真机展出了国产万卡级AI集群系统scaleX万卡超集群 [3] - 紫光国微成立中央研究院,主要研究方向包括面向具身机器人等应用的端侧AI芯片新架构 [3] - 沐曦股份在科创板挂牌上市,发行价104.66元/股,募集资金41.97亿元,开盘后股价大涨,收盘报829.90元/股,涨幅692.95%,总市值突破3300亿元 [17][20] - 壁仞科技通过港交所上市聆讯 [21] - 寒武纪公告拟使用27.78亿元资本公积金弥补亏损 [4] - 商汤日日新Seko系列模型已完成对国产AI芯片寒武纪的适配 [20] - 百度旗下昆仑芯即将完成股改,加速推进冲刺上市步伐 [20] - 小米开源总参数309B(激活15B)的MoE模型MiMo-V2-Flash,其API定价为输入0.7元/百万tokens,输出2.1元/百万tokens,推理价格仅为Claude Sonnet 4.5的2.5% [16] - 上海交通大学科研团队在《科学》杂志发表成果,实现新一代光计算芯片LightGen,实测算力和能效相比顶尖数字芯片提升2个数量级 [19][20] - 日本印刷株式会社(DNP)成功开发出相当于1.4纳米等级的NIL纳米压印技术,计划2027年量产 [29] 海外巨头动态 - 英伟达CEO黄仁勋透露,作为向OpenAI投资1000亿美元计划的一部分,目前尚未支付任何款项 [22] - 英伟达发布采用混合型Mamba-Transformer专家混合架构的Nemotron 3开源模型系列,其Nano版本吞吐量较前代提升4倍 [23] - OpenAI计划以高达8300亿美元估值筹资至多1000亿美元,最早于2025年第一季度末完成 [24] - OpenAI发布新一代图像模型GPT-image-1.5,性能提升最多4倍,成本便宜约20%,并全面接管ChatGPT中的图像生成功能 [25] - 前OpenAI首席技术官Mira Murati创办的Thinking Machines Lab估值达500亿美元,其产品Tinker新增接入万亿参数级推理模型Kimi K2 Thinking [26][27] - 谷歌推出最新人工智能模型双子座3 Flash,性能超越双子座2.5 Pro,速度提升约3倍,运行成本更低 [28] - 甲骨文一个价值100亿美元的密歇根数据中心项目因融资谈判陷入僵局而停滞 [27] - 苹果据称计划到2027年秋季将其iPhone产品线从五款扩展至七款,包括首款可折叠iPhone和20周年纪念版“全屏”iPhone [27] - OpenAI正洽谈从亚马逊融资至少100亿美元,并使用其人工智能芯片 [29] - 英特尔计划以约16亿美元收购AI芯片初创公司SambaNova [30] 融资与并购 - 多模态AI企业智象未来完成A+轮融资,京东集团等参投,已启动B轮融资筹备 [31] - 银河通用机器人完成3亿美元新一轮融资,创具身智能领域单轮融资纪录,由中国移动链长基金领投 [32] - 格蓝若机器人完成数千万元A+轮融资,由湖北省人形机器人产业投资基金领投 [33] - 首形科技完成新一轮融资,由中国互联网投资基金与蚂蚁集团联合领投 [34] - 星源智机器人完成超亿元天使+轮融资,由赛富基金与凯联资本领投 [35] - 云深处科技完成超5亿元C轮融资,由招银国际和华夏基金联合领投 [36] - 众擎机器人完成10亿元A1+及A2轮融资,由黄浦江资本等领投 [37] 合作与生态 - 爱诗科技与阿里云达成全栈AI合作,阿里云将为爱诗科技旗下用户破亿的PixVerse视频生成大模型提供全球化算力及模型服务支持 [15]
全球功能最全的视频生成模型来了
量子位· 2025-12-17 18:00
公司产品发布 - 阿里发布了新一代通义万相2.6系列模型,该模型一次性覆盖文生视频、图生视频、参考生视频、图像生成和文生图,是目前全球功能最全的视频生成模型 [1] - 该模型在视频创作上推出了Sora2目前还没有的多音频驱动生视频能力,并同步引入了音画同步、多镜头叙事等能力 [2] 视频生成核心能力升级 - **视频参考生成**:支持视频参考,模型能提取其中主体的外观与音色,并结合提示词生成新视频内容,可用于单人表演或双人合拍等场景 [12] - **多镜头叙事**:支持多镜头生成,保持镜头间关键信息一致,可通过简单提示词完成分镜 [12] - **自然声画同步**:在多人对话等复杂场景中,语音与动作匹配更稳定 [12] - **长视频生成**:单条视频最长15秒(参考生视频最长10秒) [12] - **基础能力提升**:在指令理解与执行、画面真实度及整体美学表现等方面均有加强 [12] 视频生成能力实测表现 - **视频参考生成效果**:在主体一致性和提示词理解上做得比较扎实,能实现1:1还原,口型匹配较为准确,动作、表情与台词语义能够对应,但生成结果中的声线并未完全沿用原视频 [11] - **声画同步效果**:在双人剧情对话等复杂场景中,动作与语言能形成完整互动,模型能补全台词并添加与动作匹配的拟声细节,能区分不同角色的情感变化,但在多角色台词绑定上仍有提升空间,偶尔会出现角色说错台词或字幕语音未完全对齐的情况 [13] - **画面质感与美学**:在画面质感和美学呈现方面有提升,能准确呈现如“第一人称赛博城市飞行视角”等复杂提示词,生成具有电影级画面质感、节奏紧凑、科幻感强烈的视频 [13][14] - **多镜头叙事效果**:对多镜头叙事的理解较为到位,镜头中的主要动作和转场均能得到完整呈现,镜头衔接自然,但对于提示词中描述不够充分的抽象动作(如“探头观察”)仍存在理解难度 [15][17][18] 图像生成能力升级 - 图片生成功能在美学理解、人像生成、文字处理、历史文化及知识IP语义理解上带来新升级 [18] - **风格化能力**:能及时掌握并生成新的美学风格,如生成具有高饱和色块拼接、像素风处理的“星露谷风格”插画 [19][20][22] - **人像生成能力**:在人像光影方面的处理更好,能生成具有清晰明暗分区、面部结构立体、肤质细节自然、具有电影感和空间层次感的半身人像 [22][24] - **中英文处理与排版能力**:能生成中英文对照排版的美食宣传海报,在构图排版上判断靠谱,主体突出,文字层级分明,达到成品水准 [25][27] 整体评价与可用性 - 模型在音视频参考、声画同步、风格理解方面表现不错,但在个别场景下仍会出现画面逻辑偏差、多角色台词对不上、复杂动作理解不到位等小问题 [7][28] - 对于日常短视频创作和二创而言,模型已经是可用且好用的水平,用户敢多跑几次而不用每次都碰运气 [7][28][29] - 模型还在多图融合、美学要素迁移、历史知识语义理解上做了提升 [30]
阿里发布通义万相2.6系列模型,上线首个角色扮演功能;xAI已组建企业级AI销售团队丨AIGC日报
创业邦· 2025-12-17 08:08
行业动态与公司人事变动 - OpenAI任命谷歌企业发展主管Albert Lee担任公司企业发展副总裁 该职位向首席财务官Sarah Friar汇报 [2] - 韦氏词典将“slop”评选为2025年度热词 该词被定义为通常由人工智能批量生成的低质量数字内容 包括荒谬视频、失真广告图像、庸俗宣传内容、以假乱真假新闻、AI创作低劣书籍及低效工作报告等 [2] 大模型产品与技术进展 - 阿里巴巴发布通义万相2.6系列模型 面向专业影视制作和图像创作场景进行全面升级 [2] - 万相2.6提升了画质、音效、指令遵循等能力 单次视频时长达到国内最高的15秒 [2] - 万相2.6新增角色扮演和分镜控制功能 可一键完成单人、多人、人与物合拍视频 并自动实现多镜头切换等专业任务 [2] - 万相模型家族已支持文生图、图像编辑、文生视频、图生视频、人声生视频、动作生成、角色扮演及通用视频编辑等10多种视觉创作能力 广泛应用于AI漫剧、广告设计和短视频创作等领域 [2] 企业级AI市场拓展 - xAI已组建企业级人工智能销售团队 团队规模达十余人 [2] - xAI在面向大型企业销售方面经验不足 正阻碍潜在客户的决策进程 [2] - xAI已签约摩根士丹利和Palantir等大客户 但这些客户目前主要进行小规模技术测试 每项测试带来的收入仅为数十万至数百万美元 [2]
周鸿祎回应“前高管称帮做假账几十亿”;“蚂蚁阿福”冲上苹果应用总榜第三位;全球五大PC厂商都将涨价;蜜雪冰城进军北美市场丨邦早报
创业邦· 2025-12-17 08:08
360集团与前高管纠纷 - 前高管玉红在社交平台指控360集团创始人周鸿祎,称曾帮助其做假账至少几十亿元,并称360的游戏项目全部财务造假 [1] - 360集团发布严正声明,称玉红言论完全背离事实,公司始终坚持合规经营,财务公开透明,并将依法追究其法律责任 [1][3] - 360集团披露,玉红曾负责被其美股上市主体收购的Gamewave公司,于2014年入职集团下属公司,2015年离职,在职期间从未担任核心管理层职务 [3] 科技与AI应用动态 - 蚂蚁集团旗下AI健康应用“蚂蚁阿福”发布后下载量猛增,冲上苹果应用总榜第三位,月活用户超1500万,每天回答用户500多万个健康提问 [5] - 阿里发布通义万相2.6系列模型,新增角色扮演功能,单次视频时长可达15秒,支持10多种视觉创作能力 [21] - 字节跳动发布新一代音视频创作模型Seedance 1.5 pro,支持音视频联合生成 [23] - 生产力软件公司Notion以110亿美元估值启动3亿美元员工售股计划,为潜在IPO铺路,其年度经常性收入已突破6亿美元,其中半数来自AI产品 [17] - xAI已组建十余人的企业级AI销售团队,但经验不足阻碍客户决策,已签约摩根士丹利等大客户进行小规模测试,每项测试收入为数十万至数百万美元 [17] 消费与零售市场 - 蜜雪冰城疑似进军北美市场,在美国洛杉矶外卖平台上架预售套餐,定价3.99美元(约合人民币28元),套餐糖度可选最高200% [6] - 名创优品要求消费者必须注册会员才能购买盲盒、搪胶毛绒等潮玩类产品,并对数量进行限购,其他品类商品则无需注册 [14] - 好特卖在全国多地关店,涉及广州、长沙、杭州、北京等城市热门商圈,关店原因包括租金问题、租约到期及部分门店经营不善亏损 [14] 汽车与自动驾驶 - 小鹏汽车在广州市获得L3级自动驾驶道路测试牌照,并启动常态化的L3道路测试 [17] - 长城汽车欧拉5正式上市,定位紧凑型纯电SUV,官方指导价9.98万元起,限时换新价9.18万元起 [25] - 美国激光雷达制造商Luminar申请第11章破产重整,计划出售激光雷达业务,破产前已达成协议以1.1亿美元现金出售子公司LSI股权 [18] 消费电子与半导体 - 全球五大PC厂商宏碁、华硕、联想、戴尔、惠普均计划或已开始涨价,戴尔商用电脑涨价幅度在10%至30%之间 [16] - 机构报告指出,受内存芯片短缺影响,明年全球智能手机出货量或将下滑2.1%,平均售价将上涨6.9%,电子元器件整体成本上涨10%至25% [28] - 昂瑞微成功登陆科创板,发行价83.06元/股,开盘价240元/股,大涨189%,总市值达238.9亿元,其5G射频模组跻身国产第一梯队 [20] 企业融资与上市 - 苏州易缆微半导体技术有限公司完成近亿元人民币战略融资 [20] - 安领科生物完成近5000万美元A轮追加融资 [20] - 哲源科技完成亿元A1轮融资 [21] - 格蓝若机器人完成数千万元A+轮融资 [21] 企业战略与人事变动 - 华为终端有限公司发生工商变更,余承东接任董事长,孟晚舟、徐直军等卸任董事,公司注册资本6.06亿人民币 [13][14] - 本田宣布将收购日立持有的Astemo公司21%股份,使其成为合并子公司,收购后本田持股61%,并计划继续推进Astemo的IPO事宜 [20] - 英特尔任命首席执行官首席助理普什卡·拉纳德为临时首席技术官 [18] - OpenAI首席传播官Hannah Wong将于明年1月离职 [18] 行业趋势与数据 - 德勤中国报告显示,2025年中国50强企业三年累计营收增长率平均值为490%,23%的50强企业和66%的明日之星企业AI研发投入占营收50%以上 [28][29] - 苹果计划大幅扩展智能手机产品线,目标到2027年秋季从五款扩展至七款,包括2026年秋季发布首款可折叠iPhone,以及2027年发布20周年纪念版iPhone 20 [16] 其他公司动态 - 消费类机器人公司iRobot申请第11章破产保护,并同意被合约制造商Picea Robotics收购 [18] - 韩国电商巨头Coupang发生大规模数据泄露,事件影响了约3400万个用户账户,占韩国劳动年龄人口90%以上 [17][18] - 华纳兄弟探索董事会可能拒绝派拉蒙Skydance 1084亿美元的收购要约,并决定重新接受Netflix的收购要约 [17] - 马斯克身家达到6770亿美元,成为历史上首位身家达到或超过6000亿美元的人 [11]
阿里电影级视频模型万相2.6系列上线,功能比Sora2还全,人人都能当导演
AI前线· 2025-12-16 14:39
通义万相2.6系列模型发布 - 阿里巴巴于12月16日发布了新一代通义万相2.6系列模型,此次更新并非单点升级,而是同时上线了5款新模型,覆盖文生视频、图生视频、参考生视频、图像生成和文生图等多个关键环节 [2] - 通义万相是阿里“通义大模型家族”的一员,初代于2023年7月上线,以图像生成能力为主并率先面向企业用户开放测试,经过2年多发展,于今年9月在国内率先发布音画同步的视频生成模型万相2.5 [2] - 万相2.6已成为国内首个支持角色扮演功能的视频模型,画质、音效、指令遵循等能力进一步提升,单次视频时长达到国内最高的15秒,并新增了角色扮演和分镜控制功能 [2] - 万相2.6也是全球功能最全的视频生成模型,比Sora2还多了一项“多音频驱动生视频”功能,该功能能让多路音频作为驱动信号影响人物动作、口型和镜头节奏,实现更自然的音画同步 [4] - 目前,万相2.6已同步上线阿里云百炼平台和万相官网,所有人可直接在官网体验,企业用户可通过阿里云百炼调用模型API,千问APP也将于近期上线该模型 [5][12] 模型技术能力与创新 - 在模型结构上,通义万相集成了多项创新技术,可对输入参考视频进行多模态联合建模与学习,提取时序信息的主体情绪、姿态、多角度视觉特征以及音色、语速等声学特征,在生成阶段作为参考条件控制,实现从画面到声音的全感官全维度一致性保持与迁移 [7] - 模型支持单人和多人的表演 [7] - 在分镜控制上,通义万相能通过高层语义理解,将原始输入构建为具备完整故事线与叙事张力的专业级多镜头段落,并在多镜头切换过程中保持核心主体、场景布局和环境氛围的统一建模,确保全片在内容、节奏和氛围上的高一致性 [9] - 万相2.6可将用户简单的提示词转换为多分镜脚本,生成包含多个镜头的连贯叙事视频,并保持多镜头间的主体、场景等关键信息的一致性 [9] 应用场景与用户体验 - 万相2.6的角色扮演功能让普通用户也能在影视级画面里表现精湛演技,用户上传一段个人视频并输入提示词,模型能快速完成分镜设计、角色演绎、画面配音等工作,生成镜头叙事完整、电影级运镜的短片,仅需几分钟即可完成 [9] - 面向广告设计、短剧制作等专业场景,通过输入连续提示词,万相能生成一段完整叙事的短片,例如输入广告创意提示词,可生成包含人物角色和商品的广告视频,并在多镜头切换下保持主体、场景等关键信息的一致性 [11] - 万相模型家族已支持文生图、图像编辑、文生视频、图生视频、人声生视频、动作生成、角色扮演及通用视频编辑等10多种视觉创作能力,已广泛应用于AI漫剧、广告设计和短视频创作等领域 [12] 图像生成能力升级 - 在图像生成层面,万相2.6的变化不仅体现在画面质量提升,更集中在风格控制与表达稳定性上,模型对艺术风格关键词的理解更加细致,能在保持整体风格统一的前提下处理不同风格之间的融合与过渡,使色彩、肌理、笔触细节具备可控性和完整性 [13] - 在人像生成方面,万相2.6进一步压低了常见的“AI感”,写实人像的肤质、神态和光影关系更加自然,构图与视角也更接近真实拍摄逻辑,使生成结果更容易直接进入设计或传播场景 [13] - 模型对中英文长文本的理解能力被引入到图像生成中,可以根据较长、结构化的文字内容生成图文协调的海报、插画或信息图表,让“内容—视觉”之间的对应关系更加清晰 [15] - 对于历史文化题材和知名IP,万相2.6也表现出更强的还原能力,能在尊重原有语境的基础上进行生成,为创意表达提供更大发挥空间 [19] 行业背景与活动 - 文章提及AI重塑组织的浪潮已至,Agentic企业时代正式开启,AI正深度融入业务核心、驱动组织形态与运作逻辑全面革新 [21] - 12月19日至20日,AICon全球人工智能开发与应用大会(北京站)即将举行,大会将聚焦大模型训练与推理、AI Agent、研发新范式与组织革新等前沿议题 [21]
新一代万相2.6系列模型发布:支持角色扮演、多镜头生成功能
凤凰网· 2025-12-16 14:22
公司产品发布 - 阿里巴巴旗下通义万相团队发布新一代万相2.6系列模型 [1] - 该版本被定义为国内首个支持角色扮演功能的视频生成模型 [1] - 模型集成了音画同步、多镜头生成及声音驱动等能力 [1] 技术能力与升级 - 模型通过多模态联合建模,可对输入视频的时序信息、主体特征及声学要素进行学习,旨在实现生成视频在画面与声音上的整体一致性 [1] - 分镜控制功能可依据语义理解,将原始素材构建为包含多镜头切换的专业叙事段落 [1] - 此次升级重点提升了画质、音效与指令遵循能力 [1] - 单次生成视频时长最高支持15秒 [1] - 新增的角色扮演功能允许用户上传个人视频并结合提示词,模型可自动完成分镜设计、角色演绎与配音,生成具备电影感运镜的短片 [1] 应用场景与市场定位 - 角色扮演功能主要面向广告设计、短剧制作等专业场景 [1] - 目前,万相模型家族已具备文生图、图像编辑、文生视频等十余种视觉创作能力 [1] 产品获取与商业化 - 用户可通过官网体验万相2.6 [1] - 企业用户可通过阿里云百炼平台调用模型API [1]
阿里发布通义万相2.6系列模型,上线角色扮演功能
新浪财经· 2025-12-16 13:50
公司产品发布 - 阿里于12月16日发布了新一代万相2.6系列模型 [1] - 该系列模型面向专业影视制作和图像创作场景进行了升级 [1] - 万相2.6是国内首个支持角色扮演功能的视频模型 [1] - 万相2.6同时支持音画同步、多镜头生成及声音驱动等功能 [1] 产品迭代与功能 - 今年9月,阿里在国内发布了音画同步的视频生成模型万相2.5 [1] - 新发布的万相2.6在万相2.5的基础上,功能得到进一步扩展 [1]