Workflow
AI视频
icon
搜索文档
Vidu Q2的参考生视频,是AI视频多参党的胜利。
数字生命卡兹克· 2025-10-22 09:33
核心观点 - Vidu Q2多图参考生视频功能代表了AI视频生成工作流的新范式,在多主体一致性、情绪表演能力和多风格表现力方面实现显著进化[1][2][9][10][11][84] - 该技术相比传统的文生视频-图生视频工作流更具效率优势,操作更便捷,有望成为行业未来发展方向[2][4][9][84] 技术能力与性能提升 - 一致性方面实现大幅进化,能够稳定处理超多主体同框的复杂场景,例如成功生成六位画家同框的视频,而Q1版本在该场景下会出现人物缺失或异常出现的问题[12][14][15] - 操作便捷性提升,通过@键可简单调用任何人物、物品或场景,比Sora2仅能@人物的功能更丝滑[17] - 支持创新玩法,如通过多主体实现主人公变身,或保持人物不变而场景变化,镜内外变化同步性表现完美[26][28][29] 情绪表演能力 - 真人表演细腻度显著提升,能够通过眼神等细节展现复杂情绪如脆弱感,而Q1版本仅能完成基础眼部转动且情绪表达不明确[37][38] - 在二次元领域表现尤为突出,能够生成富有故事感的片段,精准捕捉悲伤、无奈、克制、恨意等复杂情绪[44][45] - 擅长处理动漫特有情绪表现手法,如通过眉眼线条抽动、瞳孔缩小、眼白红血丝等细节展现极致恐惧,且能在简单提示词框架内自主完善细节[53][54] - 小表情生成自然逼真,如情侣吵架场景的表情和动作具有活人感[49][51] 多风格表现力 - 在动漫风格生成方面表现卓越,无愧于AI视频动漫之王的称号,能够生成泡面番、热血战斗番等多种动画风格[58][60][64] - 运镜和特效能力突出,特别适合生成中二动漫场面,如舞剑场景的镜头拉近拉远和狂风特效,打斗场景的刀光剑影和飞檐走壁[70][71][72][74][75] - 所有风格化视频均通过多参考生视频生成,同时保证了角色一致性和风格一致性[70] 产品定价与可及性 - 定价具有竞争力,标准版月度会员59元获得800积分,20积分可生成一条8秒视频,折合每条视频成本1.475元,每秒约0.184元,是当前最便宜的AI视频模型之一[79][80] - 已推出手机APP,提供类似Sora2的交互体验和合拍功能,基于多参技术实现[82]
爱诗科技完成B+轮1亿元融资
北京商报· 2025-10-19 21:01
融资信息 - 爱诗科技完成1亿元B+轮融资 [1] - 投资方包括复星锐正、同创伟业、顺禧基金等 [1] 产品与用户 - 公司旗下产品包括PixVerse与拍我AI [1] - 产品服务于C端大众与专业创作者 [1] - 用户规模已突破1亿 [1] - 产品月活跃用户超过1600万 [1] 财务表现 - 公司年度经常性收入超过4000万美元 [1]
小确幸悦己消费避险属性,芒果超媒《声鸣远扬》将播出
申万宏源证券· 2025-10-19 17:44
行业投资评级 - 看好互联网传媒行业 [1] 核心观点 - 避险情绪上升背景下,小确幸悦己消费领域具备相对收益潜力 [2] - 芒果超媒面临长视频政策环境与产品拐点,经营拐点值得期待 [2] - 游戏板块经历调整,关税摩擦影响短期风险偏好但不改基本面,产品力是应对市场变化核心 [2] - Sora2发布推动AI视频发展,数据积累成为竞争关键要素 [2] - 恒生科技指数调整后,悲观盈利预期逐步消化,AI重估逻辑持续 [2] 细分领域与公司分析 小确幸悦己消费 - 泡泡玛特产能爬坡,扩品类与出海高速推进,爆款IP星星人有望接力Labubu [2] - 泡泡玛特内地外门店数量已达197家,持续扩充零售渠道 [2] - 泡泡玛特万圣节新品搪胶毛绒国内海外同步上线,抖音预约超50万人,天猫销量1万+快速售罄 [2] - 大麦娱乐核心IP Chiikawa内地首店9月27日落址上海外滩,引发抢购热潮 [2] - 大麦娱乐旗下三丽鸥中国地区增长验证阿里鱼运营IP能力 [2] - 国内演唱会市场需求强劲但供给受限,新品类与出海、内容投资驱动增长 [2] - 网易云音乐深度报告强调其付费用户高增长、年轻用户占比高、格局向好、对上游内容议价力强 [2] 长视频平台 - 芒果超媒受益于广电21条优化剧集审核,利于内容百花齐放并加快周转 [2] - 芒果超媒综艺《声鸣远扬》定档10月28日首播,首季重在影响力建设 [2] - 芒果超媒经营改善需时间,期待爆款剧拉动会员收入或宏观改善带动广告复苏 [2] 游戏板块 - 游戏行业不受中美关税摩擦及美限制关键软件出口影响,调整主因风险偏好回落 [2] - 经历国庆前后调整,游戏板块过高预期已消化,主流公司2026年PE回落至16-17倍 [2] - A股游戏权重标的华通有望年底摘除ST,资金配置限制解除 [2] - 核心推荐包括腾讯控股(《三角洲行动》9月DAU突破3000万,《和平精英》绿洲启元DAU达3300万)、世纪华通(点点互动旗下《Whiteout Survival》和《Kingshot》包揽9月中国出海手游收入榜冠亚军)、巨人网络(《超自然行动》国庆小红书粉丝数快速增长)等 [2] AI视频与科技 - OpenAI于9月30日发布Sora2,AI视频定位从工具转向社区,推动变现 [2] - AI视频竞争核心要素除模型能力外,还包括IP数据积累 [2] - 重点标的包括哔哩哔哩(张迪加盟强化AI视频播客、广告推荐应用)、快手(可灵2.5 Turbo发布且降价30%)、美图公司(C端修图壁垒高)、阅文集团(小说IP储备丰富,布局AI短剧) [2] - 恒生科技指数自10月2日以来调整幅度达14%,关税摩擦与即时零售竞争影响悲观预期逐步消化 [2] - 港股科技AI重估逻辑未结束,国产模型与芯片进步提供支撑,关注腾讯控股、阿里巴巴、百度等 [2] 重点公司财务与估值 - 腾讯控股总市值50,823亿人民币,2025年预计营收7,464亿人民币(同比增长13%),2026年预计营收8,280亿人民币(同比增长11%),2025年预计归母净利润2,556亿人民币(同比增长15%),2026年预计2,980亿人民币(同比增长17%),2025年PE为20倍,2026年为17倍 [4] - 泡泡玛特总市值3,377亿人民币,2025年预计营收310亿人民币(同比增长138%),2026年预计424亿人民币(同比增长37%),2025年预计归母净利润103亿人民币(同比增长223%),2026年预计144亿人民币(同比增长39%),2025年PE为33倍,2026年为24倍 [4] - 芒果超媒总市值551亿人民币,2025年预计营收128亿人民币(同比下滑9%),2026年预计138亿人民币(同比增长8%),2025年预计归母净利润14亿人民币(同比增长4%),2026年预计19亿人民币(同比增长34%),2025年PE为39倍,2026年为29倍 [4] - 哔哩哔哩总市值786亿人民币,2025年预计营收300亿人民币(同比增长12%),2026年预计329亿人民币(同比增长10%),2025年预计归母净利润25亿人民币(扭亏为盈),2026年预计33亿人民币(同比增长34%),2026年PE为24倍 [4]
爱诗科技完成1亿元人民币B+轮融资
每日经济新闻· 2025-10-17 12:01
融资信息 - 爱诗科技完成1亿元人民币B+轮融资 [1] - 投资方包括复星锐正、同创伟业、顺禧基金等 [1] 经营数据 - 旗下产品PixVerse与拍我AI用户规模突破1亿 [1] - 年度经常性收入超过4000万美元 [1] - 公司于2024年11月正式商业化 [1]
社媒霸权要易主?16万下载引爆科技股,新的万亿行业赛道出现了
搜狐财经· 2025-10-16 20:05
Sora 2产品分析 - OpenAI推出Sora 2,不仅具备强大的AI视频生成功能,还配备全套社交平台设施,用户可制作并分享AI短视频,形似一款全新社交媒体软件[1] - 与第一代Sora相比,Sora 2技术进步显著,支持复杂场景、叙事连贯性达到新高度,并能支持同步音效包括背景声、对白和多语种配音[3] - Sora 2在AI对物理世界的理解上有明显改善,多数动作看上去自然,人物动作、口型模仿已接近真人水平,大部分场景符合真实世界物理规律[3] - Sora应用带有名为CAMUS的功能,用户扫描面部即可生成仿真虚拟人物,输入短语就能用虚拟人物生成短视频,进一步扩大社交媒体边界[6] - 现阶段Sora 2存在生成视频通常仅10秒、时长较短、生成速度慢、画质不够清晰等问题[6] 对Meta的潜在影响评估 - Sora 2的野心直指社交媒体平台,OpenAI明确表示要构建全新社交应用场景,其势头被比作当年TikTok入驻北美,而TikTok大火时Meta股价曾大跌70%[1] - 短期来看,Sora对Meta的冲击几乎为零,因其视频娱乐性和观看体验与真人视频仍有差距,10秒视频易引发审美疲劳,算力不足、成本高企限制其视频质量、数量和时长[6][7] - Meta拥有数十亿用户基础、十余年打磨的算法、成熟的内容分发体系和创作者生态、完善的广告业务和激励机制,这些是OpenAI短期内无法超越的优势[9] - 长期威胁并非来自AI短视频内容本身,而是AI带来的全新使用场景和体验,这可能像过去的技术革命一样重塑行业格局[12][14] - 综合来看,Meta被颠覆的概率较低,当前的威胁反而可能是其投资机会,如果Meta持续投入AI而非放弃,则能应对挑战[18][19] 行业格局与技术趋势 - AI内容本质上是内容制作成本的又一次降低,按历史趋势,这将进一步扩大内容产业规模并重塑行业格局[12] - 当前AI视频应用竞争被比作生物进化史上的"寒武纪大爆发",预示混战后可能出现最终胜利者[20][21] - OpenAI自身面临激烈竞争,其首要任务是维持大语言模型的领先地位,将资源投入社交媒体运营可能影响技术研发,对其威胁大于对Meta的威胁[16][17]
社交,才是 AI视频ToC 的终局
36氪· 2025-10-15 19:12
行业核心观点 - 社交是ToC领域的终极应用,技术浪潮最终都在改写人与人之间的关系[1] - AI视频是新一轮社交革命,其核心在于重新定义“存在”,使身份可以被算力组合和创造[15] - 从移动互联网到AI时代,社交的演进路径为:从“连接”到“分发”,再到系统化的“存在”[22][24] 技术演进与社交形态变迁 - 移动互联网时代,社交的本质是“关系连接”,微信通过功能设计让关系流动,将社交从沟通工具升级为社会结构[2][4] - 算法分发时代,社交的主语从“人”转换为“内容”,兴趣图谱取代社交图谱,内容成为新的社交载体[5][6][8] - 中国短视频用户规模从2018年底的6.48亿(渗透率78.2%)增长至2019年中的7.59亿(渗透率88.8%),算法彻底接管用户注意力[7] - 情绪被货币化,用户行为数据(点赞、停留、转发)成为算法精算和推送的依据,关系变得更轻、更散,从熟人稠密转向陌生人规模庞大[9][10] AI视频驱动的社交革命 - AI视频的核心是“存在”,它首次使得身份可以像程序一样被编写,用户能从“展示自己”变为“创造自己”[15] - 情绪被“格式化”,成为可被AI理解、存储和调用的计算资源,AI开始帮助用户运营关系,维持“存在感”[16][18][19] - AI视频生成量已达到千万级别,表明“上传头像生成视频”已从个别尝试变为大众行为,“存在”成为一种可量产的生产力[27][28][29] - 未来社交竞争的关键在于谁“出现”得更多、更快、更持久,AI作为关系网络的调度中心,将情绪变为输入数据,关系变为可计算资源[21][23][29] 主要公司与产品角色 - 微信作为移动互联网时代的分水岭产品,通过朋友圈、群聊、公众号等功能重组了人际关系[3][4] - 今日头条通过算法逻辑改写信息流,推动社交从“连接”转向“分发”[5] - 抖音、快手、小红书、B站等平台将关系链置于后台,将个体内容推向前台,用推荐流取代时间线[6] - Pika、Runway、快手“可灵”等AI视频工具的增长表明行业已进入规模化生成阶段[27]
即梦VS可灵,谁能「对标」Sora2?
36氪· 2025-10-15 07:20
Sora2的技术突破与产品定位 - 核心突破在于音画同步和物理一致性实现质变,AI首次具备编导级综合叙事能力[10][12] - 产品形态从API模型升级为社交平台级应用Sora App,集成创作、分发、互动、推荐功能[3][13] - Cameo功能支持用户上传人像或音频实现自我投射,将创作门槛降至零并激活用户参与感[15] - 首周下载量显示其具备吸引数亿用户日活的潜力,对Meta和Tiktok构成结构性威胁[16][18] 中国市场竞争格局:即梦与可灵对比 - 字节跳动即梦依托抖音生态优势,主打产品闭环和流量分发,但生成质量与Sora2存在差距[20][22] - 快手可灵侧重技术突破,支持数分钟长视频和复杂镜头语言,更接近Sora2技术对标[24] - 可灵2025年第二季度营收达2.5亿元,但客户仍以专业机构和自媒体为主,未形成大众消费市场[26] - 两者均面临商业模式困境,AI短剧等应用依赖补贴,用户付费意愿未经验证[26][28] 行业生态重构与平台战略挑战 - Sora2重塑内容分发逻辑,将"生成+分发"一体化体验作为平台竞争新核心[13][16] - 独立AIGC视频平台可能成为行业成熟必要条件,避免与主平台功能混杂引发的伦理风险[28] - 国内厂商需平衡AI产品与原有内容平台竞争关系,战略推进速度低于预期[31] - 视频生成能力被视为AI内容领域的"皇冠明珠",直接影响公司AI战略完整性[31]
Sora2颠覆抖音?新的万亿行业赛道出现了
首席商业评论· 2025-10-14 11:43
AI视频生成行业竞争格局 - 2024年OpenAI的Sora横空出世,国内可灵独树一帜,真正开启了AI视频赛道竞争 [3] - 截至2024年底,国内已出现20多款视频大模型产品,阿里、腾讯、字节等巨头参与其中 [3] - 海外市场Google、Meta等巨头,以及Runway、Luma AI、Midjourney等创业公司纷纷加入战局 [3] Sora 2的技术升级与性能优势 - Sora 2相比初代实现重大升级:首次实现音频与画面同步生成,大幅提升物理精确性,增强画面分辨率和细节真实感 [7] - 该模型在物理一致性、多镜头叙事与音画同步三大关键维度得分领先行业平均水平40%以上 [7] - 原本生成5秒视频可能只有0.5秒能用,现在可直接生成复杂镜头构成的桥段 [6] AI视频商业化挑战 - 目前尚未实现视频模型商业化正常落地,存在"一致性和稳定性"等技术问题 [5] - 商业上并未出现AI视频成本低的情况,为得到满意动态镜头可能耗费十几美元积分 [5] - 百度创始人李彦宏指出Sora类AI视频大模型投入周期太长,10-20年都可能拿不到业务收益,存在高成本和商业化前景不明问题 [5] - 2023-2024年尝试性AI影视作品如《上海奇境》和《三星堆:未来启示录》在票房收益上表现平平 [5] 版权与伦理风险 - Sora 2主打"客串"功能可生成数字分身并授权其他用户使用,但采取"选择退出"版权策略,默认使用版权内容 [8] - 当前状态下很可能在不知情情况下侵权知名IP,甚至被追偿 [8] - 默认授权其他用户使用本人形象难以避免被恶搞或生成不雅视频,真实性和临场感几乎可以假乱真 [8] OpenAI的版权合规改进 - OpenAI宣布两项重大调整:IP版权方可掌握生杀大权,明确规定角色能否及如何被Sora生成 [10][12] - 公司计划尝试商业化,并与选择加入的版权方进行收入分成 [12] - IP所有者可设定具体规则,如角色可出现在特定场景但不能出现在其他场景,或直接禁止使用大尺度内容 [12] Sora 2的产品战略与市场影响 - Sora 2最大动作是让免费用户体验"一键创作视频",实现从网页端到移动端战略下沉 [14] - OpenAI 2025年战略方向是为超过95%的免费用户找到变现路径 [14] - 应用允许用户轻松创建10秒以内短视频,并可插入自己或朋友形象,具备高度个性化和社交化设计 [14] - Sora 2发布后Meta股价在隔夜交易中下跌2.3%,市场担忧其音视频生成能力可能催生全新社交媒体生态系统 [16] 行业局限性分析 - 99.99%的AI生成角色不会成为IP,真正IP需要人格魅力、持续内容输出和粉丝情感连接 [16] - 目前看到的大部分AI视频内容可疑且高度同质化模板化 [17] - 抖音本质是内容消费,核心是视频消费价值,由上亿创作者贡献内容与平台分享价值 [17] - Meta拥有数十亿社交用户基础,成熟广告内容生态,Sora 2要追上Meta差距很大 [17] - OpenAI的Sora 2尚未展现低成本一面,相反有不少高成本难以为继的传闻 [17]
AI系列跟踪(78):Sora出圈带动AI视频迎来变革,腾讯生图模型、视觉模型表现亮眼
长江证券· 2025-10-10 18:42
投资评级 - 行业投资评级为“看好”,并予以“维持” [6] 核心观点 - AI视频领域迎来新变革,Sora2模型及App的发布验证了该领域的用户需求和市场空间 [1][3][8] - 腾讯混元系列多模态模型在多项评测中表现领先,多模态正成为其核心竞争力 [1][3][8] - 报告看好四个AI细分赛道:AI交互赛道、具备优势的互联网大厂、商业模式可复制的垂直赛道以及AI+游戏厂商 [1][8] 事件描述与评论 - **Sora2模型与App发布**:10月1日,Sora发布Sora2模型及Sora App [1][3][8] - Sora2已升级为音视频同步生成模型,在遵循物理定律、可控性和逻辑一致性方面能力显著提升 [8] - Sora App定位为“AI版抖音”短视频社交应用,发布仅三天即登顶美国App Store榜首 [8] - **腾讯多模态模型进展**:9月28日,腾讯混元发布混元图像3.0模型 [8] - 混元图像3.0是首个工业级原生多模态生图模型,参数规模达80B,为测评效果最好、参数量最大的开源生图模型 [8] - 10月5日,该模型在LMArena文生图榜单的26个全球大模型中位居第一 [8] - 混元视觉理解模型Hunyuan-Vision-1.5-Thinking在LMArena Vision赛道排行榜中位居全球Top3,国内第1 [8] - 在3D生成领域,混元3D模型在图生3D和文生3D任务中均位列第一,其社区下载量超过260万 [8] 建议关注的细分赛道 - **AI交互赛道**:看好AI玩具、工具等交互赛道,以及具备强IP储备和运营能力的公司,关注工具型实力领先的快手等 [1][8] - **互联网大厂**:看好具备流量分发、模型、数据等优势的大厂,聚焦to C AI Agent打造商业闭环,关注腾讯控股等 [1][8] - **垂直赛道**:看好海外已跑通商业模式,国内有望复制的广告、电商、教育等垂直赛道 [1][8] - **AI+游戏**:看好AI+游戏陆续落地,关注AI布局积极的巨人网络、恺英网络等游戏厂商 [1][8]
集成电路ETF(159546)回调超6.5%,OpenAI 重磅发布 Sora 2,回调或可布局
每日经济新闻· 2025-10-10 14:55
Sora 2模型技术突破 - OpenAI发布Sora 2模型,AI视频有望走向GPT-3.5时刻,首次支持与画面匹配的AI音频生成[1] - 模型在物理模拟、真实感和可控性方面能力显著提升,能处理复杂动作场景并遵循物理规则,支持多镜头叙事,视频生成质量大幅提升[1] - 相较于上一版本,Sora 2实现了更精准的物理引擎、更逼真的画面表现、同步音频、更强操控性及更丰富风格表现,能以高保真度精准捕捉用户指令[1] - 海内外视频生成第一梯队玩家基本能实现物理规则优化及二次修改创作,视频分辨率从700+P逐步提升至1080P,快手可灵高品质模式可生成1080P[1] Sora App与商业模式创新 - OpenAI发布全新iOS社交应用Sora App,被称为"AI版TikTok",具备Cameo客串、Remix二次创作等独特功能[1] - Sora App有望创新性带来短视频社交媒体新的交互逻辑与社区互动方式[1] - 通过Sora App可进一步提升用户AI普及率及探索用户对AI内容接受程度,有望整体推进AI视频除创作消耗收费外的包括流量变现等新商业模式[2] 集成电路行业概况 - 集成电路ETF(159546)跟踪集成电路指数(932087),该指数选取涉及设计、制造、封装测试及相关材料设备等业务的上市公司证券作为指数样本[2] - 指数成分股具有高技术含量和成长性特征,代表中国集成电路产业发展水平与趋势,行业配置主要集中于电子、信息技术等领域[2]