Workflow
AI视频
icon
搜索文档
国产之光Vidu Q3加冕新王!全球首个16秒音视频直出模型,超越Sora领跑AI视频下半场
搜狐网· 2026-02-02 10:57
行业演进与拐点 - AI视频行业正从“生成玩具”演进为真正的“内容生产力工具”,创作门槛持续降低 [1] - 2025年,行业迎来关键拐点,AI视频首次可作为“可直接使用的叙事内容单元”进入内容生产全链条 [2] - 生数科技Vidu系列模型持续推动行业能力边界前移,从视频生成、演技生成到打通完整工作流 [1] Vidu Q3模型核心能力与突破 - Vidu Q3是全球首个支持16秒音视频直出的AI视频模型,以“为剧而生”为核心理念 [1] - 模型实现16秒声画同出,音频与画面一体生成,口型精准对齐,具备电影级视听张力 [6] - 模型具备“导演思维”,可根据剧情自动切换不同镜头,实现多镜头自由切换 [6] - 模型支持中、英、日等多语种文字自然嵌入视频画面,无需后期逐帧跟踪与拼贴 [6] - 模型将传统后期流程系统性前置至生成端,实现“一镜到底”的工业化突破 [6] 技术里程碑与行业意义 - Vidu Q3的发布标志着AI视频首次能作为“可直接使用的叙事内容单元”进入生产全链条 [2] - 16秒时长跨过叙事阈值,足以完成情绪起承转合,可作为独立叙事段落被直接使用 [4] - 声音与画面实现端到端直出,AI开始理解多模态影视语言,而不仅是视觉语言 [4] - 生成结果具备可直接使用的稳定性,可不经复杂加工直接进入分发与商业使用链路 [5] - 这终结了AI能否成为内容生产链条中叙事参与者的长期核心问题 [4] 市场地位与竞争格局 - 在国际权威AI基准测试机构Artificial Analysis最新榜单中,Vidu Q3排名中国第一,全球第二 [1] - Vidu Q3的ELO评分为1,241,超越Runway Gen-4.5 (1,235)、Google Veo 3.1 Fast Preview (1,225)和OpenAI Sora 2 Pro (1,209) [2] - Vidu Q3 Pro的API定价为每分钟9.60美元 [2] 对内容产业的影响 - 对短剧、漫剧行业,创作模式从“堆人力”转向“提效率”,内容更新周期从“月更”压缩至“日更”级 [7] - 对广告营销行业,实现了营销素材与产品迭代、市场热点的实时同步,提升营销敏捷性与创意测试效率 [7] - 大幅降低了高质量内容的量产门槛,为短剧、漫剧、影视剧行业的AI应用按下快捷键 [7]
AI视频迎来了它的DeepSeek时刻
经济观察网· 2026-01-21 14:39
产品技术突破 - 爱诗科技发布全球首个通用实时世界模型PixVerse R1,支持HD画质,改变了视频生成逻辑,用户无需输入提示词也可自动生成视频,实现“言出法随”的实时交互效果[1] - 模型采用Omni原生多模态架构,将文字、图片、音频、视频在同一架构内训练,并采用自回归流式生成与“长期记忆”技术,能记住此前输入的信息[3][4] - 模型采用瞬时响应引擎,将传统扩散模型所需的50+采样步数压缩至1-4步,计算效率提升数百倍,实现人眼可感知的“即时”响应,是真实时生成,而非“先渲染、后播放”的伪实时[4] - 该产品可将视频生成转变为无限、连续和互动的视觉流,标志着视听媒体创建、体验和共享的重大演变[4] - 目前每个模板体验限制为5分钟,主要受限于算力消耗,若无算力困扰理论上可无限生成视频[3] 战略合作与投资 - 产品上线6天后,中国儒意对爱诗科技进行1420万美元的战略投资,双方宣布进行版权共享,并建立涵盖影视、游戏、流媒体等多方面的战略合作伙伴关系[2][5] - 中国儒意是港股上市公司,旗下儒意影业出品电影累计票房超400亿元,并拥有多部著名电视剧版权[6] - 双方将共同创建针对专业影视领域的人工智能工具,推动影视创作方式变革[6] 市场地位与公司表现 - 爱诗科技成立于2023年,已在全球AI视频赛道位居前列,其PixVerse模型在两年内迭代五个大版本[9][10] - 截至2025年第三季度,公司全球用户已突破1亿,月活用户超1600万,产品入选a16z“全球Top50生成式AI消费级移动应用”榜单[9] - 2024年11月启动商业化后,不到一年时间月收入增长超过10倍,年度经常性收入达到4000万美元[9] - 公司在2023年10月(成立仅6个月后)推出PixVerse V1,率先发布业内可生成4K质量视频的AI视频模型,时间早于Sora模型发布[10] 行业影响与应用前景 - PixVerse R1实现了“正在发生的现在”的实时生成,与传统“记录过去的成品”视频有根本区别,用户从旁观者变为可随时干预内容走向的参与者,实现“共创”[6] - 该技术使视频的生产与消费边界消融,用户在观看的同时也能即时生成、编辑和再创作内容[7] - 实时生成能力与世界模型能力的结合,是当前国内外巨头角逐但尚未出现成熟产品的领域,爱诗科技是全球领先者[7] - 该技术能使AI原生游戏和互动电影成为可能,故事线可由AI与玩家共同即兴创作,虚拟社区的角色和环境可根据用户互动持续演化[7] - 产品发布后,已有多家游戏公司联系爱诗科技探讨合作可能性,其潜力还覆盖互动媒体、实时VR/XR、创意教育、模拟培训等多个新领域[8] - 有知名AI创作者认为,该产品对长镜头和长片意义重大,虽当前画质和可控性尚未达到正式创作要求,但未来迭代版本将是里程碑式产品[6] 创始人与愿景 - 爱诗科技创始人兼CEO王长虎有20年计算机视觉与AI领域经验,曾是字节跳动视觉技术负责人,主导过抖音、TikTok等技术研发[11] - 王长虎表示,PixVerse R1开创了“正在发生的现在”的实时生成新纪元,使叙事能“所想即所现”,智能化媒体应实时响应用户意图,让每个人成为动态叙事的创作者[11]
爱诗科技获中国儒意亿元战略投资,达成深度战略合作
新浪财经· 2026-01-19 18:56
战略合作核心 - AI视频企业爱诗科技与港股上市公司中国儒意建立战略合作伙伴关系 双方将依托人工智能技术在影视视觉设计 视效制作 宣传素材智能生成 流媒体内容资产高效利用与优化 用户体验提升 以及游戏内容创作 传播与互动体验等环节展开深度探索 推动AI技术深度融入中国儒意各业务板块[1][2] - 合作旨在共同打造AI驱动的下一代文娱生态 中国儒意将为爱诗科技提供涵盖创意开发、制作执行及发行推广等环节的丰富资源与行业经验 并开放优质版权内容共享[1][2] 合作具体内容 - 爱诗科技获得中国儒意1420万美元(约1亿元人民币)战略投资[1][2] - 在遵循版权保护与内容合规前提下 爱诗科技将获得中国儒意旗下优质版权内容授权 以激发用户参与共创活力 释放IP的多元创作潜能[1][2] 爱诗科技公司信息 - 公司创立于2023年4月 已推出全球首个支持1080P的通用实时世界模型PixVerse R1 在生成内容时长(无限流)和实时交互能力上实现了突破 标志着视听媒体迈入“实时交互”新阶段[1][3] - 公司创始人兼CEO王长虎认为 此次合作打开了影视和游戏产业全新想象力 视频生产与消费边界正在消融 用户可即时生成 编辑甚至再创作内容 新的AI技术将带来视频行业新范式与新物种 未来智能媒体需能实时理解并响应用户意图[1][3] 中国儒意公司信息 - 公司系国内知名内容制作公司 旗下儒意影业近年主导出品电影累计票房超过400亿元人民币 代表电影作品包括《唐探1900》《第二十条》《你好,李焕英》《热烈》《送你一朵小红花》等[2][3] - 公司同时打造了《我的阿勒泰》《追风者》《老酒馆》《琅琊榜》《芈月传》等电视剧作品[2][3]
AI视频创业公司挣到钱了
经济观察网· 2025-12-07 08:09
行业商业化进程 - AI视频行业已从技术炫技阶段进入规模化商业变现阶段,头部公司年收入规模已从去年的“少到可以忽略不计”跨入亿元俱乐部,少则1.4亿元,多则逼近10亿元大关 [1] - 多家公司已推出会员订阅模式,月度会员费最低59元,最高1399元 [1] - 与大语言模型赛道不同,AI视频公司已率先找到可行的商业化路径 [2] 收入结构与用户 - C端用户付费订阅成为AI视频公司收入增长的主要驱动力,以爱诗科技为例,其收入近80%来自C端用户付费订阅,且绝大部分是海外用户,欧美用户贡献了超过一半收入,巴西紧随其后 [3] - 快手可灵2025年预计收入达10亿元,其中70%来自会员订阅,主要面向专业影视创作者 [4] - B端企业客户收入开始起量,例如小米、亚马逊云科技、蓝色光标等2万多家企业客户已调用可灵的API服务,爱诗科技也有近20%的收入来自API [4] - 海外普通用户通过AI视频产品获得流量与收入,例如巴西用户制作的视频播放量破2.1亿,两月涨粉30万,促使他们愿意支付每月几十美元的订阅费 [3] 技术进步与产品迭代 - AI视频技术已跨越“可用性”临界点,生成时间从两天缩短至5到30秒,画质从780P飞跃至1080P以上,并支持自然语言交互、一键转风格、局部修改和动作捕捉 [5][6] - 技术进步源于厂商高频迭代,例如爱诗科技核心模型平均3个月迭代一次,可灵一年内完成了5个大版本升级 [6] - 技术进步使AI视频从尝鲜玩具转变为能稳定产出商业素材的生产力工具 [6] 资本市场表现 - AI视频成为2025年一级市场投资热点,爱诗科技、生数科技、LiblibAI等公司接连获得数亿元乃至上亿美元融资,海外公司Runway和Luma AI也在寻求巨额融资 [7] - 爱诗科技B轮和B+轮融资共获得超过7000万美元及1亿元人民币,投资意向金是融资额的数倍,显示投资人热情高涨 [7] - 巨人网络战略投资部负责人表示,AI视频发展速度超预期,爱诗科技的明确To C战略、月活涨至1400万以及API被广泛调用,改变了市场认知 [8] 用户增长与商业化触发 - 爱诗科技的用户增长超出预期,商业化并非提前规划,转折点发生在2024年11月其PixVerse上线的“变身特效”模板,该功能击中了TikTok用户需求,视频累计播放量数十亿,并登顶30多个国家的应用商店榜首 [9] - PixVerse用户两个月内暴涨1000万,突如其来的流量倒逼公司加速商业化进程,以避免被暴涨的算力成本拖垮 [9] 当前产品局限与用户反馈 - AI视频产品存在连续创作功能缺失、团队协作困难以及精细控制不足(如复杂动作错误率较高)等瓶颈 [10][11] - 不同产品各有优劣:拍我AI生成速度快,适合紧急项目;海螺AI呈现大动作能力较强;Vidu多参数功能好、一致性较强,但画质一般 [11] - 用户理想中的产品是能整合各家长处、支持连续创作的“超级工具” [11][12] 未来发展趋势 - 行业判断AI视频目前仍处早期,产品效果已达短视频平台内容消费水准,并已出现健康可持续的商业循环,未来商业收入提高是必然趋势 [12] - 预计2026年AI视频在电商、教育、短剧、漫剧等领域将看到更好的商业收益,下一步的决胜点在于能否开发出电影级画质的AI视频产品,届时可能出现平台级入口或交互式视频 [12]
实测可灵O1,AI视频界的Banana也来了。
数字生命卡兹克· 2025-12-02 09:45
产品发布与定位 - 可灵推出全新多模态视频大模型可灵 O1,首次在AI视频领域将参考生视频、文生视频、首尾帧生视频、视频内容修改、风格重绘、镜头延展等多种能力融合进大一统模型[2][3] - 模型名称中的O代表Omni,意为"所有、一切",表明这是一个多模态大一统的基座模型[4][5] - 该产品被描述为AI视频领域的Nona Banana,目前已正式上线并向所有用户开放[3] 核心功能特点 - 支持视频内容增删功能,可任意增加或删除视频中的物体,如给企鹅添加西装和墨镜、为歌剧女郎添加面罩、从画面中移除人物等[10][11][15][16][17][22][27] - 具备视频特定内容修改能力,可单独改变衣服颜色、季节场景、物体类型等,如将夏天变为冬天、篮球变为足球[30][31][32][34] - 提供视频绿幕抠像功能,可自动将视频主体与背景分离,生成绿幕素材用于后期合成[36][37][41][42][44] - 支持视频动作迁移,能用现有视频驱动其他角色的动作,实现角色替换和表演迁移[48][49][51][54][55] - 拥有视频风格转换能力,可在不改变内容的前提下整体改变视觉风格,如转为手绘动画或像素风格[59][60][61] 技术参数与性能 - 视频生成时长支持3-10秒自由设定[19] - 通过多模态模型大幅降低传统视频修改的人力成本,将需要后期师一天工作的修改流程简化为语音指令操作[12][13][14] - 虽然在某些电影级场景中精细控制尚有不足,但对于短视频等应用场景已足够实用[35] 行业意义与发展前景 - 可灵 O1 被视为AI视频领域第一个真正意义上的大一统模型,开启了用语音修改视频的新时代[85][95][96] - 尽管在初期存在多主体识别和画面质量等方面的局限性,但被认为是通向更强大多模态模型的必经之路[86][87] - 该产品可能代表AI视频技术发展的一个重要节点,类似于从Nano Banana一代向Pro版本的进化过程[88][90]
“100个国产Sora2已经在路上”
投中网· 2025-11-01 15:03
行业融资动态 - LiblibAI完成1.3亿美元B轮融资,为2025年至今国内AI应用领域最大规模单笔融资,由红杉中国、CMC资本及某战略投资方联合领投[3] - 爱诗科技完成1亿元人民币B+轮融资,由复星锐正、同创伟业、顺禧基金等共同投资,距离上一轮6000万美元B轮融资仅隔40天,两轮累计融资超5.2亿元[3] - 爱诗科技旗下产品PixVerse与拍我AI用户规模突破一亿,年度经常性收入超过4000万美元[3] - 生数科技宣布完成数亿元人民币规模的A轮融资,由博华资本领投,百度战投等老股东持续跟投[10] 技术突破与产品进展 - OpenAI发布Sora2视频生成模型,实现物理模拟精确度、画面逼真度、生成可控性的质的飞跃,支持语音、音效与人物口型精准同步[4][7] - Sora2首次实现通用视频与音频生成系统,能生成高真实感视觉内容并合成环境声、语音与音效[7] - 同步推出社交应用SoraApp,支持用户一键生成视频、Remix他人作品、上传人像Cameo客串,首周iOS下载量达62.7万次,高于ChatGPT首周的60.6万次[4][7][8] - Sand.ai上线音画同步视频模型GAGA-1,生成视频自带声音、音效和情绪,质感与电视剧片段相似[8] - 爱诗科技产品MAU超过1600万,商业化不到一年收入增长超过10倍[9] - 生数科技平台累计生成视频数量超过3亿条,商业化8个月ARR突破2000万美元[10] 市场竞争格局 - 中国AI视频领域出现多家竞争者,包括生数科技、Minimax、快手的可灵、字节的Seed等[10] - 字节跳动被视为中国AI视频创业者的主要竞争对手,爱诗科技和Liblib两家头部公司创始人均出自字节[10] - 谷歌推出Veo3.1与Veo3.1Fast正面迎战OpenAI,百度宣布视频生成模型百度蒸汽机升级支持AI长视频实时交互生成[8] 行业趋势与认知 - Sora2被定义为视频领域的"GPT-3.5时刻",展示模型能讲故事的能力,语言模型的智能正向多模态模型扩散[6][7][13] - 模型能力被视为核心竞争优势,应用公司摸索的有效功能可能只是帮助模型公司明确优化方向[13] - AI视频从工具向社区演进,可能出现新的社区物种,内容供给侧爆发和UGC文化变化带来机会[16][17] - 企业需将业务理解内化进模型,模型本身成为价值交付者,对团队科研、产品与商业化能力要求极高[14]
万兴科技旗下万兴天幕AI App等上新“参考生视频”
中证网· 2025-10-30 21:40
公司动态 - 万兴科技加速推进“创意平权”进程,旗下AIGC视频创作平台推出“参考生视频”新功能 [1] - 新功能依托多模态理解与生成能力,通过上传主体、风格、场景三类参考图像实现对视频生成过程的精细控制 [1] - 用户最少只需上传一张主体图即可一键生成视频,并可灵活叠加风格图与场景图,满足多样化创作需求,大幅提升视频创作效率 [1] 行业前景 - AI视频赛道正迎来高速发展,中研普华预测2025年中国AI视频行业市场规模将突破1200亿元 [1] - 预计到2030年行业市场规模将达5800亿元,年复合增长率超过35% [1] - AI视频正在经历从“工具辅助”到“内容主体”的质变,并迈入“实用性”与“落地性”并重的阶段 [1] 技术趋势 - 用户对AI视频的标准持续提升,更可控、更快速、更真实的AI视频创作能力愈发重要 [1] - 万兴科技正持续推动AI技术创新与场景落地 [1]
爱诗科技宣布获B+轮1亿元融资,ARR突破4000万美金
新浪科技· 2025-10-20 15:09
融资信息 - 爱诗科技完成1亿元人民币B+轮融资 [1] - 投资方包括复星锐正、同创伟业、顺禧基金等 [1] - 融资将用于技术研发和市场拓展,推动AI视频生成技术普惠 [1] 业务与产品表现 - 公司旗下产品PixVerse与拍我AI用户规模突破1亿 [1] - 产品月度活跃用户超过1600万 [1] - 公司于2024年11月正式商业化,不到一年时间收入增长超过10倍 [1] 财务指标 - 公司年度经常性收入超过4000万美元 [1]
AI视频巨头获亿元融资,散户却错过什么?
搜狐财经· 2025-10-20 07:18
爱诗科技融资与增长 - AI视频企业爱诗科技完成1亿元B+轮融资,为一个多月内第二次获得资本加持 [1] - 公司成立仅一年用户破亿,商业化后收入增长10倍 [2] - 公司拥有1600万月活跃用户和4000万美元年度经常性收入 [2] - 复星锐正、同创伟业等顶级机构连续加码投资 [2] 市场表现与轮动规律 - 2025年4月后指数上涨900点,但广聚能源等个股下跌60% [5] - 2025年前9个月几乎没有板块能连续两个月领涨,电子板块表现最佳但也有四个月下跌 [6] - 市场呈现轮动特征,没有永恒的赢家 [6] 机构资金行为分析 - 2025年5月限酒令事件前,通过跟踪白酒板块机构资金动向发现“聪明钱”早在年初反弹后已悄然离场 [8] - 决定股价的关键并非消息本身,而是机构对消息的定价能力 [10] - 当市场反弹缺乏机构参与时,“利空出尽”可能仅是散户的一厢情愿 [10] 个股案例与数据价值 - 诺泰生物被ST后股价反而大涨25%,关键在于提前捕捉到机构建仓痕迹 [12] - 机构投资行为常有数据指标先行异动,如爱诗科技获得融资前 [12] - 在信息过载时代,数据能穿透迷雾展现市场本质 [12]
爱诗科技完成B+轮1亿元融资
北京商报· 2025-10-19 21:01
融资信息 - 爱诗科技完成1亿元B+轮融资 [1] - 投资方包括复星锐正、同创伟业、顺禧基金等 [1] 产品与用户 - 公司旗下产品包括PixVerse与拍我AI [1] - 产品服务于C端大众与专业创作者 [1] - 用户规模已突破1亿 [1] - 产品月活跃用户超过1600万 [1] 财务表现 - 公司年度经常性收入超过4000万美元 [1]