AI视频创作
搜索文档
字节跳动最新音视频模型Seedance 1.5 Pro上线豆包App 一键生成有声视频
证券时报网· 2025-12-19 17:39
记者19日从字节跳动获悉,豆包App视频生成能力升级,支持Seedance1.5Pro模型,可一键生成声音和 画面相匹配的有声视频。 记者发现,打开豆包App对话框,选择"照片动起来",上传图片并输入提示词,选择"1.5Pro"模型,已 经可以体验到该功能。 2025年6月,视频生成模型Seedance1.0Pro正式发布,支持文字与图片输入,可生成多镜头无缝切换的高 品质视频,主体运动稳定性与画面自然度较高。 同时,即梦AI也上新Seedance1.5pro,支持声音、画面同步生成。 具体来看,即梦AI网页版官宣全面升级,打造一站式"AI片场"。本次更新涵盖了核心模型能力、交互方 式及创作流程等,旨在为用户提供从灵感到成品的全流程创作支持,让创意海报、专业视频乃至AI漫 剧、AI短片的制作变得更加高效便捷。 此次升级的核心亮点之一,是即梦AI最新视频生成能力"视频3.5Pro"。该模型基于字节自研模型 Seedance1.5pro,在即梦AI全球首发上线。视频3.5Pro支持视频与音频同时生成,人物口型、乐器演 奏、环境音效等元素无需再后期配音,大幅提升了视频的真实感与沉浸感。该模型在遵循复杂指令方面 表现 ...
实测字节Seedance 1.5 Pro,能直出方言的AI视频也来了。
数字生命卡兹克· 2025-12-18 12:33
今天是火山Force原动力大会,我在现场。 这次他们也掏了很多有意思的新货出来,但我觉得最炸的,还是他们的新视频模型,Seedance 1.5 Pro。 因为这次的更新,真的做到了影视级别的音画同步,而且中文能力和方言能力是目前所有模型里的独一档。 语音生成能力这点在他们的技术报告里也有体现。 左边是视频生成能力,右边是语音生成能力。绿色的就是Seedance新模型,在语音生成这一块可以说是遥遥领先。。。 模型昨天已经上线了,可以直接在豆包,即梦或者火山方舟上玩起来。 豆包是在视频生成或者照片动起来这一栏里选1.5 Pro模型。 即梦是在生成视频里选3.5 Pro,也是基于Seedance 1.5 Pro的能力。 目前3.5 Pro支持文生图,单参考和首尾帧,智能多帧和主体参考还要再等等,不过现在这些其实已经很够用了。 还有火山方舟,网址在此:https://exp.volcengine.com/ark/vision?launch=seedance 京剧玩法,名画玩法什么的都可以在方舟上体验。 API也在路上了,现在就可以预约。 Seedance 1.5 Pro的能力维度呢,我觉得可以分成这么几大块,复杂场景 ...
Sora的AI TikTok梦迅速破产了
投中网· 2025-12-10 11:06
以下文章来源于硅星人Pro ,作者李楠 硅星人Pro . 硅(Si)是创造未来的基础,欢迎来到这个星球。 将投中网设为"星标⭐",第一时间收获最新推送 Sora这款产品怎么了? 作者丨 李楠 来源丨 硅星人Pro 说" Sora的60日留存率是0"有点夸张,毕竟这个说法诞生时,Sora App上线还不满60天。不过这 款明星产品的发展的确不怎么乐观。 根据a16z合伙人前段时间贴出的一组对比,Sora留存率远不如TikTok,首日留存率只有10%,30 天留存率只有1%。对比来看,TikTok对应的留存率分别是50%和32%,差距明显。 他们仿佛看到了一个AI版TikTok。短短五天实现100万下载,以及全网的热烈讨论,似乎都验证了 这种期待。可惜一切又快速翻转。尽管其下载量仍在增长,但看起来很难成为TikTok了。 于是问题来了,这究竟是Sora这款产品的失误,还是AI TikTok本身就是一个伪命题? Sora作为一款大众产品是不合格的 基础能力决定了Sora的产品体验还是不够好。 尽管Sora 2的宣传片堪称完美:奥林匹克级的体操动作、精准的物理模拟、好莱坞级别的视觉效 果。但当用户带着一键生成大片的幻 ...
可灵2.6模型推出“音画同出”能力 重构AI视频创作工作流
央广网· 2025-12-05 14:47
可灵2.6模型核心升级 - 公司推出视频生成2.6模型 提供里程碑式的“音画同出”能力 能够在单次生成中输出包含自然语言、动作音效以及环境氛围音的完整视频 彻底改变了传统“先无声画面、后人工配音”的工作流程 [1] - 该模型升级了文生音画、图生音画两大功能 输入文本或图片结合提示词文本均可直接生成带语音、音效及环境音的视频 生成视频长度最长支持10秒 语音当前支持生成中文以及英文 [4] 技术性能与优势 - 通过对物理世界声音与动态画面的深度语义对齐 模型在音画协同、音频质量和语义理解上表现亮眼 [6] - 音画协同方面 生成的视频在语音节奏、环境音与画面动作上紧密呼应 实现了对画面动态与声音节奏的深度对齐 避免了音画割裂体验 [6] - 音频质量方面 在支持人声、音效、环境声等多类型声音生成的基础上 生成的音频音质更干净、层次更丰富 整体听感更接近真实的混音效果 [6] - 语义理解方面 模型对多种场景下的文本描述、口语表达和复杂剧情有较强的语义理解能力 能够更准确地把握创作者意图 输出逻辑更严密的内容 同时 在中文语音生成效果上保持全球领先 [6] 应用场景与行业影响 - 模型支持的声音类型包括说话、对话、旁白、唱歌、Rap、环境音效、混合音效等多种声音的单独或混合生成 能够广泛应用于广告营销、自媒体、电商等行业视频内容创作 [7] - 在广告营销行业 模型可一键生成含有旁白介绍、演员对白、商品展示音效等综合声音效果的广告短片 极大降低广告片拍摄成本并提升效率 [7] - 在自媒体领域 通过多人对白能力 创作者可以创作访谈节目、剧情演绎、搞笑短剧等内容 借助音乐表演能力可进行唱歌、说唱表演、乐器演奏等类型的内容创作 大幅度降低创作成本与难度 [7] - 在电商领域 通过单人独白、旁白解说等能力 能够完成商品展示、产品讲解等视频内容创作 提升商家的经营效率 [8] - 模型的推出进一步降低了内容创意行业视频创作的成本与难度 [8]
千问APP升级视频创作能力,“照片唱跳”走红
搜狐财经· 2025-12-02 23:55
公司产品与技术升级 - 千问APP于12月2日接入万相系列最新模型Wan2.5,视频创作能力升级,动作精度和肢体协调性全面提升,并成为首个支持音视频同时输出的移动端AI助手 [1] - 阿里万相2.5是业界少数具备音画同步能力的视频模型之一,支持文本、图像、视频、音频多种模态的输入和输出,在权威大模型评测LMArena上,其图生视频能力位居全球第三,稳居国内第一 [1] - 在千问APP上,用户只需一张照片和一段文字,无需模板,即可生成一段肢体动作自然、口型匹配准确的1080P高清唱跳视频,最长支持10秒 [1] - 该功能支持真人照片、萌宠、二次元角色、文物、卡通形象等多种素材 [1] 市场表现与用户反馈 - 千问App公测仅一周,下载量就突破1000万次,超越ChatGPT、Sora、DeepSeek成为史上增长最快的AI应用 [3] - 该能力上线后再次激发了网友的创作热情,社交平台上涌现出一批更具创意的“照片唱跳”内容 [3] - 去年年初,阿里推出的照片跳舞功能迅速火爆国内外,激发了网友的创作热情,兵马俑、萌娃、萌宠跳舞视频在全网流传 [2] 功能应用与创新 - 接入万相2.5后,不仅全面提升视频创作效果,还进一步降低视频创作门槛,支持用户自定义上传照片和输入文字 [2] - 用户可通过千问APP将两张图片融合,生成特定风格合照,再输入指令即可实现合唱、群舞的视频效果,且能够保持高质量的动感表现和极强的主体一致性 [3] - 例如,用户仅需输入一张图片和一段“小猫一边唱歌,一边跳舞”的文字,千问APP便能精准生成视频,让静态形象瞬间“活”起来 [2]
千问App迎来更新:上线Wan2.5视频模型
新华财经· 2025-12-02 14:29
公司产品更新 - 千问APP于12月2日接入了万相系列最新模型Wan2.5,视频创作能力再度升级 [1] - 该模型是首个支持音视频同时输出的移动端AI助手 [1] - 在千问APP上,用户只需一张照片和一段文字,无需模板,即可生成一段1080P高清唱跳视频,最长支持10秒 [1] - 生成的视频具备肢体动作自然、口型匹配准确的特点,支持真人照片、萌宠、二次元角色、文物、卡通形象等多种素材 [1] 技术能力与行业地位 - 阿里万相2.5模型是目前业界少数具备音视频同步能力的视频模型之一 [1] - 该模型支持理解和生成等多种任务,支持文本、图像、视频、音频多种模态的输入和输出 [1] - 在权威大模型评测LMArena上,万相的图生视频能力位居全球第三,稳居国内第一 [1] - 新模型的动作精度和肢体协调性得到全面提升 [1]
万兴科技发布万兴喵影2026 推进视频创作迈入AI驱动的专业剪辑新时代
证券日报网· 2025-11-20 21:13
公司产品发布与战略 - 公司于11月20日面向国内市场发布视频创意软件万兴喵影2026桌面端(海外版Wondershare Filmora V15)[1] - 新产品打造AI深度赋能的新一代通用型专业视频创意平台,一次性上线及迭代数十项强大功能[1] - 产品以AI大模型为基础,聚焦智能生成与创作流程管理,实现AI全链路提效,首次在通用型视频创意软件中提供从AI素材生成、续写到精细剪辑的一站式专业体验[1] - 该产品旨在满足专业及通用创作场景的各类需求,推进视频创作迈入AI驱动的专业剪辑新时代[1] - 公司持续加码AI视频创作“平权”,此次产品升级是公司推进全球AI视频创作普及的重要举措[1][2] 公司业务与市场地位 - 公司是中国数字创意软件领域产品覆盖面广、营收体量大、全球化程度高的A股上市公司,业务覆盖200多个国家和地区,被视为“中国版Adobe”[2] - 公司近年来加速AI大模型技术及相关产品布局,旗下已推出国内首个音视频大模型万兴天幕[2] - 公司产品矩阵包括万兴喵影、万兴脑图、万兴图示等AIGC创意软件明星产品,以及万兴天幕AI、万兴超媒Agent等大模型原生应用[2] 行业背景与市场机遇 - 据Market.us数据,2024年全球创作者经济规模已达到1430亿美元,预计未来将达到更大规模,产业发展前景巨大[2] - 新产品为有变现和涨粉需求的各类创作用户,提供AI时代的全新创意与生产力解决方案[1] - 公司通过构建从AI生成、智能编辑到专业操作的一体化平台,为全球数亿创作者提供拥抱专业化剪辑的可行路径[2]
万兴科技(300624.SZ)海外重磅发布Wondershare Filmora V15 率先实现一站式AI专业视频创作流
智通财经网· 2025-11-18 09:38
产品发布与核心功能 - 公司面向海外市场发布视频创意软件Wondershare Filmora V15桌面端,打造AI深度赋能的新一代通用型专业视频创意平台 [1] - 新产品以AI大模型为基础,聚焦智能生成与创作流管理,首次在通用型视频创意软件中提供从AI素材生成、续写到精细剪辑的一站式专业体验 [1] - 产品全新上线数据化模板、钢笔工具等复杂编辑功能,并推出双时间线编辑、多工程编辑等专业功能,整体创作流更AI化、复杂编辑更智能 [1] AI技术整合与创作流程革新 - Filmora V15实现AIGC全面融入时间线剪辑,用户可串联使用文生视频/图生视频、灵感成片、AI续写、AI视频擦除、智能抠像等功能,构建完整的AI灵感生成工作流 [2] - 产品结合动感字幕、人声克隆、TTS等功能,构建从构思到输出的“AI智能生产线”,旨在显著提升创作效率,让创意不被剪辑打断 [2] - AI时代下,Filmora V15正从视频剪辑应用向深度理解用户创作意图的“智能协作者”进化,降低创作门槛 [2] 公司市场地位与全球化布局 - 公司业务覆盖200多个国家和地区,累计活跃用户突破20亿,被视为“中国版Adobe” [3] - 公司海外收入占比持续超过90%,旗下明星产品Wondershare Filmora全球累计活跃用户超过4亿 [4] - 在G2 2025秋季评选中,Wondershare Filmora获评“视频剪辑软件领导者”,并在“2025年8月海外AI应用总榜TOP50”中,其APP与WEB端双端位列AI视频编辑类别TOP2 [4] 行业背景与市场机遇 - 2024年全球创作者经济规模已达到1430亿美元,预计2034年市场规模将达到14870亿美元,前景巨大 [5] - 伴随社媒平台崛起,“AIGC+视频剪辑”已成为新的流量密码,千万级AI视频爆款加速涌现 [2] - 公司通过新产品为全球数亿创作者提供拥抱专业化剪辑的可行路径,是推进全球AI视频创作普及的重要举措 [5]
迪士尼(DIS.US)4Q25FY电话会:预计2026财年EPS将继续实现两位数增长
智通财经网· 2025-11-17 07:22
流媒体业务表现 - 四季度Disney+净增用户400万人,Hulu净增用户860万人,均超出市场预期 [1] - 新增用户中80%选择了Disney+、Hulu和ESPN的三合一套餐 [1] - 流媒体业务第四季度营业收入同比增长39%,全年营业收入达到13亿美元,较去年增加12亿美元 [2] - 公司正将国内所有娱乐内容整合到一个APP中,并推进Hulu品牌全球化 [2] - 捆绑套餐用户质量更高,流失率明显低于单一订阅用户 [8] 财务业绩与股东回报 - 2025财年经调整每股收益同比增长19%,过去三年实现19%的复合增长 [2] - 管理层预计2026财年每股收益将继续实现两位数增长 [2] - 公司宣布将2026财年股票回购规模提升至70亿美元,相比2025财年翻倍 [2] - 公司将股息提高50%至每股1.50美元,相比2025财年的1美元/股增长50% [2] - 若剔除现金税款时点差异,基础自由现金流同比增速约为28% [4] 内容与影视部门前景 - 四季度内容销售收入下滑26%,主要由于去年同期高基数影响 [1] - 2026财年片单丰富,包括《疯狂动物城2》、《阿凡达:火与烬》、《玩具总动员5》等多个IP续作 [1][4] - 过去一年有两部影片全球票房突破20亿美元,《星际宝贝》成为年度票房冠军 [5] - 管理层对未来片单极为乐观,认为2026年上映阵容是近年来最强 [4] - 2027-2028年的片单竞争力可与2026年相当 [4] ESPN直接面向消费者业务 - ESPN新应用清晰吸引两类核心用户:原有订阅用户和从未订阅有线电视的新用户 [3] - 用户对体育中心和垂直精彩集锦等新功能使用度较高 [3] - 该产品被视为巩固ESPN未来发展方向的重要一步 [3] - 由于NBA版权成本的计提时点,全年利润可能波动,但NBA被视为极具战略价值的顶级体育资产 [7] Disney+超级应用与DTC战略 - Disney+正在进行自2019年上线以来最大规模的产品与技术升级,目标是与Hulu深度整合 [5] - 未来Disney+有望成为连接迪士尼所有业务的核心入口,包括主题公园、酒店、邮轮和游戏生态 [5] - 公司正通过与Epic Games的合作探索更多游戏化功能,并利用AI支持沉浸式体验 [5] - DTC业务目标是在未来实现两位数营收增长,并在2026年后显著提升利润率 [6] 广告业务与行业竞争 - 公司去年整体广告收入增长约5%,体育相关广告表现突出 [6] - 过去两个季度迪士尼的CPM已出现提升,显示趋势向好 [6] - 公司预计2026年广告业务仍将增长,整体态势保持积极 [6] - 公司对参与行业并购浪潮持“静观其变”态度,对自身IP布局十分满意 [6] 体验业务与主题乐园 - 体验业务在2026年的主要增长动力来自邮轮业务,新船投入带来的前期成本将逐步消化 [7] - 价格提升与客流增长仍是关键驱动,电影片单推动的消费品业务也将贡献增量 [7] - 主题乐园第一季度预订量同比增长约3%,全年预订量趋势向好 [8] - 国内主题公园需求并不疲软,整体表现符合预期 [9] - 邮轮业务需求非常强劲,新增运力被迅速消化,客座率维持在历史高位 [9] 成本管理与运营效率 - DTC业务将在2026年继续保持可观的收入增速,目标是实现两位数营收增长 [9] - 公司预期通过运营杠杆实现“收入增速快于费用增速”,从而推动利润率提升 [9] - 生成式AI被认为在改进内容生产流程和优化公司整体运营方面具有巨大潜力 [10] - 公司已与多家AI公司展开深入磋商,以探索提升互动体验的机会并保护IP权益 [10]
昆仑万维:全新SkyReels正式上线
证券时报网· 2025-11-04 11:09
公司产品发布与更新 - 昆仑万维旗下AI视频创作平台SkyReels于11月4日正式焕新上线,Web端与移动端APP已全面登陆[1] - 平台在模型侧聚合了Google Veo 3.1、Sora 2、Runway、Nano Banana、GPT Image、Seedream 4.0等国内外主流AI多模态模型[1] - 平台功能侧一站式提供图片生成、视频生成、数字人、音乐生成等多种AI创作方式[1] - 公司自研的SkyReels V3模型代表一系列多模态视频生成模型,包括基于图片、音频和视频参考的视频生成[2] - 产品五大核心功能重大更新包括无限画布、数字人、模板功能、专家Agent、视频延长和风格化[2] 公司战略与市场定位 - SkyReels是昆仑万维"All in AGI与AIGC"战略的重要组成部分[2] - 平台致力于通过自研大模型、极致用户体验和强大工作流整合能力,推动AI视频创作迈向"零门槛创意生成时代"[2] - 公司旨在为全球用户打造一个简单但能实现无限可能的综合AI创意平台[2] 行业需求与产品价值 - 全球媒体、市场营销、电商推广、教育宣传等领域对创意需求高、体量大,但缺乏一站式AI创意工具且效率低下是用户主要障碍[1] - SkyReels旨在解决上述问题,为用户带来更多能力选择、更低使用门槛、更优质创作体验[1] 行业技术展望 - 预计视觉/音频等生成模型将保持高速迭代与更新,模态间融合创作将进一步加速[2] - 模型效果与可控性将进一步提升,内容生成成本将持续降低[2]