Workflow
AI视频生成技术
icon
搜索文档
AI穿越直播视频为啥这么火(有事说事)
人民日报海外版· 2025-06-30 10:06
AI视频生成技术在文化传播领域的应用 - AI视频生成技术通过"第一人称Vlog视角+历史名场面"的叙事方式,营造强烈在场感,使历史事件以动态形式重现[4] - 该技术有效弥合时空隔阂,让观众能够"亲历"历史场景,将静态知识转化为可感知的沉浸式体验[4] - 动态重现的历史事件如"玄武门之变"显著提升青少年学习兴趣,多语种AI短片成为海外观众了解中国文化的窗口[5] 技术普及带来的创作变革 - 数字技术大幅降低历史题材创作门槛,使普通网友能够使用AI工具参与历史文化内容创作[5] - 技术解放创造力后,涌现出更多元的历史视角和叙事方式,为文化发展注入新活力[5] - 典型案例包括网友创作的"穿越直播"系列,涵盖赤壁之战、玄武门之变等历史场景[4][5] 行业监管与教育应对 - 《生成式人工智能服务管理暂行办法》明确要求对合成内容进行标识[7] - 广电部门已开展专项整治行动,打击歪曲历史的"AI魔改"视频[7] - 北京中小学自2025年秋季起将AI素养纳入课程体系,培养批判性技术观[7] 技术创新在文博领域的实践 - 浙江温州运用AI技术复原宋元古港"千帆竞发"场景[7] - 苏州博物馆通过AI"复活"唐伯虎并推出互动视频系列[7] - 各地博物馆综合应用AI/VR/裸眼3D技术实现文物数字化展示[7]
腾讯混元推出AI数字人技术:一张照片配音频即可生成唱歌视频
凤凰网· 2025-05-28 17:23
腾讯发布开源语音数字人模型HunyuanVideo-Avatar - 公司正式发布并开源语音数字人模型HunyuanVideo-Avatar 该技术仅需用户提供一张人物图像和一段音频文件即可自动生成包含自然表情、精准唇形同步以及全身动作的动态视频内容 [1] - 该模型基于腾讯混元视频大模型与MuseV技术深度融合开发 具备强大的多模态理解能力 能够自动识别输入图像中的人物环境信息以及音频所承载的情感内容 [1] - 模型突破了传统数字人技术仅支持头部驱动的局限性 全面支持头肩、半身与全身三种景别模式 同时覆盖多种艺术风格和多物种角色驱动 并具备双人或多人互动场景的处理能力 [1] 技术架构与应用场景 - 模型采用多模态扩散Transformer(MM-DiT)作为核心架构 通过角色图像注入模块确保视频中人物的一致性表现 音频情感模块能够从声音和图像中提取情感特征 [2] - 针对多人场景 模型配备面部感知音频适配器 利用人脸掩码技术实现多角色的独立精准驱动 [2] - 该模型已在腾讯音乐娱乐集团多个核心产品中实现落地应用 包括QQ音乐的AI虚拟形象同步演唱 酷狗音乐的AI虚拟人讲故事 以及全民K歌的用户专属MV生成功能 [2] 技术优势与开放计划 - 在主体一致性和音画同步准确度方面已达到业内领先水平 超越现有开源和闭源解决方案 在画面动态性和肢体自然度表现上与其他主流闭源方案处于同等技术水准 [2] - 单主体功能已在腾讯混元官方网站开放体验 用户可通过"模型广场-混元生视频-数字人-语音驱动"路径访问相关功能 当前支持不超过14秒的音频文件上传 [3] - 公司将逐步开源更多高级功能模块 此次开源举措将推动AI视频生成技术的普及应用 为短视频创作、电商营销、广告制作等垂直领域提供低成本的技术解决方案 [3]
国产AI技术加速重构行业格局 快手可灵系列大模型市场份额超30%
证券日报· 2025-05-17 00:39
公司表现 - 快手可灵系列市场份额超30% 彰显技术实力与商业化落地能力 [1] - 可灵大模型基于DiT架构 提供文生视频和图生视频双模式 支持最长3分钟、1080p、30fps高质量视频输出 [1] - 可灵AI全球用户规模突破2200万 月活用户量增长25倍 累计生成1.68亿个视频及3.44亿张图片 [1] - 可灵2.0大师版发布3周后在Poe平台拿下20.9%份额 [1] - 可灵AI累计营业收入超1亿元 前3个月营收超2024年总和 [1] 行业竞争 - 视频生成大模型市场呈多极竞争 腾讯混元上线130亿参数视频模块 阿里巴巴开源万相2.1 字节跳动推出即梦AI [2] - Poe平台数据显示 可灵占据视频生成模型30%以上份额 美国Runway以23.6%份额位列单个模型第一 [4] - 国产视频大模型在生成时长、分辨率等性能持续提升 已展现竞争力 [2] 技术应用 - 可灵帮助客户短视频营销制作成本下降60%-70% 释放更多广告预算 [2] - 长期看好可灵在视频内容制作产业链渗透 包括电视剧、电影、短剧、UGC内容、动画等 [2] - AI视频生成技术将拓展至医疗、建筑、设计等领域 例如医疗领域可生成虚拟手术场景视频 [3] 战略定位 - 快手通过深耕技术深水区 加速构建从工具到生态的完整闭环 [5] - AI不仅是效率提升工具 更是驱动平台流量增长与商业生态价值创造的核心引擎 [5]
爱诗科技完成近3亿元A+轮融资,核心AI视频生成产品PixVerse全球用户数超1200万
IPO早知道· 2024-12-18 11:14
融资情况 - 爱诗科技完成A2至A4轮融资,总金额近3亿元人民币,A2轮由蚂蚁集团投资,A3、A4轮由北京市人工智能产业投资基金、国科投资及光源资本投资 [3] - 光源资本继续担任独家财务顾问,融资将用于提升技术研发能力、扩展算力资源及建设人才团队 [3] 产品与用户数据 - 核心产品PixVerse全球用户数超1200万,月活跃用户数近600万 [4] - 2024年10月发布的PixVerse V3版本因"毒液变身"等创意特效功能在海内外社交媒体走红 [4] - 2024年12月PixVerse移动App在海外上线,同时面向企业用户开放技术合作服务 [4] 技术进展 - PixVerse V3.5版本进入内测阶段,生成耗时缩短至30秒以内,提示词响应及运动控制能力提升 [5] - 公司拥有Character2Video(人物一致性)模型技术,通过ID精准约束保持视频人物形象与背景一致性 [5] - 新一代模型融合生成数据与渲染数据,具备卓越的视觉文本特征对齐能力和上下文理解能力 [5] - 在SuperCLUE中文大模型测评中,PixVerse V3综合能力超越Sora,位列全球第一 [5] 行业与战略定位 - 公司创始人认为视频大模型需注重产品化价值,目标打造全球领先的AI视频生成技术 [5] - 光源资本判断AI视频生成大模型将革新内容产业生产力,中国团队有望全球领先 [5] - PixVerse已成为全球用户量最大的国产AI视频生成工具,并实现商业化闭环 [5] 其他行业动态 - 智谱完成30亿元融资,商业化收入增长超100% [9] - 全灵SEELE完成千万美元Pre-A轮融资,由前网易云音乐创始人创办 [9] - 潞晨科技完成数亿元A++轮融资,专注DataBricks平台及视频生成大模型 [9]