Workflow
AI视频生成
icon
搜索文档
股市面面观|快手可灵AI引爆海外市场 2026年以来股价累计涨超18%
新华财经· 2026-01-06 17:45
多位接受新华财经采访的分析师均表示,快手近期股价上行的核心驱动力来自其AI 产品可灵在海外市 场的强劲表现以及主业基本面的稳健预期。招银国际预计,到2027年,全球创意应用市场规模有望达到 546亿美元,其中AI创意应用渗透率有望达到11%。在长期视角下,具备底层模型能力的厂商将掌握定 价权,并伴随规模化应用与架构优化,推动毛利率持续改善,视频生成行业有望从"技术验证期"迈 入"商业化加速期"。 快手可灵或迎关键一跃 2026 年伊始,韩国社交平台上一场"静态图片动起来"的挑战赛悄然走红。用户只需上传一张照片,便 可生成流畅的动态视频,如"宠物跳街舞"等创意内容在三天内获得超过5亿次播放量。支撑这一玩法快 速传播的,正是快手旗下视频生成工具可灵AI。 据了解,可灵AI在2025年12月推出全球首个全模态视频模型可灵O1及首个"音画同出"的模型可灵2.6版 本,能够在一次生成中输出包含自然语言、动作音效及环境音的完整10秒视频,改变了传统AI视频生 成需要后期配音的繁琐流程。 可灵是由快手在2024年初推出的AI视频生成模型,推出后在海外引起较好的反响,网页端80%以上的访 问量都来自海外。摩根大通分析师陈祺称 ...
AI视频生成,如何撕开创作边界?
36氪· 2025-12-18 17:30
AI视频生成行业趋势与驱动力 - 2025年下半年AI视频生成成为全球AI行业最受关注的方向之一,热度以“病毒式”速率扩散[1] - 过去两年视频生成技术在画面质量、时序建模与可用性上持续进步,全球AI视频相关能力迭代节奏显著加快[1] - 当生成效果从“能看”跨越到“可用”、“好用”,并覆盖叙事能力、人物一致性、音画同步等工业化生产关键要素时,AI视频真正进入大众视野,成为极具想象空间的赛道[2] 内容产业的结构性难题与AI的变革作用 - 视频行业是全球增长最快、资本最密集、创新最活跃的领域之一,但内容生产被推向极限,更新周期被压缩至小时甚至分钟级[2] - 传统制作链路依赖的人力规模与制作周期,与高频、碎片化的内容需求形成明显错位,压力体现在影视广告、MCN电商、短剧及出海内容等多个领域[3] - AI视频生成显著拉低创作门槛,使个人与小团队具备接近工业化的生产能力,并催生了从创作工具到垂直解决方案的新中间层[3] - 内容生产从一次性创作转向可反复生成、快速验证、持续优化的过程性资产,成为可规模化运行的系统工程[3] - 技术突破与国内规模化需求汇合,使行业形成清晰判断:AI视频生成已成为下一代内容基础设施的重要组成部分[4] 主要参与者的差异化发展路径 - OpenAI的Sora策略偏向通用能力展示,通过高质量视频打开公众认知,推动AI视频进入大众文化与社交传播场景[5] - Google的Veo强调模型在长时序理解与复杂场景中的表达能力,体现为技术能力的前沿探索[5] - 国内公司更多从平台生态出发,将视频生成能力与内容分发、创作者体系结合,或赋能视频生产全流程以提升效率[5] - 路径差异本质基于对“好用还是好玩”、“B端还是C端”的认知不同:C端优先娱乐与表达,B端则要求确定性、一致性及规模化稳定输出[6] - 阿里巴巴选择将AI视频生成做成行业级基础设施,其通义万相模型试图回应行业从能生成走向可生产、从尝鲜迈向规模化落地的趋势[6] 通义万相2.6的核心技术突破与产品定位 - 将多镜头叙事能力提升为模型核心能力,强调在生成过程中对时间轴与镜头语言的整体建模,支持通过自然语言分镜指令直接调度多镜头叙事[8] - 将参考对象从图片升级为视频,支持输入约5秒参考视频,复刻主体外观、动作模式、表情变化与音色特征,实现声画一致的生成结果,显著降低商业场景制作门槛[11] - 将可控生成时长稳定在约15秒,支持1080P输出与声画同步,这段时长对广告、电商、短剧等商业场景是“刚好可用”的内容长度[15] - 文生图能力同步升级,引入对叙事结构的理解,支持图文混排输入,从简单提示自动拆解故事并生成分镜,结合多图参考与商业级一致性控制,使其从“灵感草图”走向可直接用于生产的生产工具[15] - 在中文语境与中式美学上持续投入,通过与美院等机构合作及引入大量中式审美素材进行迭代优化,使模型表现更贴近本土创作需求[17] - 模型演进遵循“效果好大于一切”的原则,在真实需求与技术突破的反馈循环中持续迭代[19] AI视频对内容生产流程与效率的重构 - AI视频生成介入创作前端,将编剧、导演、剪辑、美工等跨岗位协作工作压缩进同一界面,显著降低岗位交接成本,使创作者能围绕最终效果进行整体判断[20] - 内容生产从线性流程转向以模型为核心的并行与即时生成,效率提升最先发生在承受高频产出压力、对成本和周期高度敏感的场景,如短剧、电商内容、出海工具等领域[22] - 在广告和电商领域,AI使创意能更早转化为可视化内容用于内部讨论或A/B测试,显著压缩从想法到内容的距离[24] - 稳定、可规模化的视频生成能力催生了新的工具平台与创作社区,创作者置身于不断自我扩展的AI创作生态中[24] - 实践案例表明,稳定型AI视频基础设施显著降低小团队及个体创作者的创作门槛,使有限人力条件下仍能维持稳定叙事质量并持续输出体系化内容[25] - 案例:AI漫剧工具平台巨日禄通过调用通义万相模型,将AI使用门槛大幅降低,其创作智能体使效率提升5-8倍[24] - 案例:出海内容公司乐我无限利用万相的多模态生成能力,使其创作平台Ima Studio能支持海外创作者快速生成高质量AI视频,助力社区冷启动并构建“技术—内容—社区”正向循环[25] 从“好玩”到“好用”:产业级基础设施的关键 - 真正的分水岭在于能否进入稳定、可重复的生产流程,生成结果的可控性、稳定性及减少人工返工成本是关键,稳定性是进入生产流程的前提[26] - 通义万相并非孤立工具,可依托阿里云大模型服务与应用开发平台百炼嵌入企业既有内容生产与业务流程[26] - 能力的稳定可用得益于阿里云作为全球领先全栈人工智能服务商在算力供给、数据治理、模型服务及大规模并发调度等方面积累的成熟工程体系[26] - 阿里巴巴对AI的系统性投入可追溯至十多年前,长期技术积累使其能构建从模型训练、部署到服务化调用的完整链路,推动模型在稳定性、可控性与规模化能力上不断逼近真实生产需求[28] 行业长期展望:创作民主化与价值重塑 - AI视频生成将专业制作能力(如镜头语言、叙事节奏、美术风格)编码进模型,使创作所需技能从具体技法转向判断、创意与取舍本身[28] - 这种变化类似于从专业级影像软件走向大众化创作工具的历史拐点,将一整套专业制作能力压缩为可被普通人调用的基础设施[29] - 在降低门槛的同时,创作本身将具备更大规模与更长生命力[30] - 视频生成的终点并非替代创作者,而是让创作者将精力更多投入到真正有价值的部分——创意、叙事与判断本身[31]
从分钟级等待到20倍超速:LightX2V重写AI视频生成速度上限
机器之心· 2025-12-08 12:27
核心观点 - 开源项目LightX2V通过算法与工程的全栈优化,旨在将高质量视频生成推向消费级硬件上的1:1实时体验,其技术栈在社区中迅速流行,单月下载量超过170万次[2] 技术架构与性能 - 项目目标是在主流硬件上实现视频生成的1:1实时体验,远超现有框架[2][4] - 通过系统级优化,将生成5-10秒视频的时间从几分钟压缩到与视频时长接近的水平,实现接近1:1的实时体验[7] - 在同类开源方案中,相比SGLang Diffusion、FastVideo等框架,在延迟和吞吐上具有明显优势,尤其在8GB-24GB消费级显卡区间能跑满硬件能力[7] 核心算法创新 - **Phased DMD步数蒸馏**:将原本40-50步的视频扩散过程压缩到4步,同时保持时间一致性和运动细节,基于此技术的少步模型在Hugging Face趋势榜长期靠前,累积下载量达百万级[10][11] - **LightVAE轻量级VAE**:针对视频生成场景设计,在保持高清画质和时间一致性的前提下,有效降低编解码开销,为4步推理释放更多预算[12] - 两项核心算法协同,先在算法层面打通路径,再通过工程优化榨干硬件性能[13] 全栈性能工程优化 - 通过一系列关键技术模块,将“能跑”变成“跑得快、跑得省”,并支持从单机单卡扩展到多卡集群[14][15][16] - **显存门槛**:通过步数蒸馏、低比特量化和分级Offloading,将完整工作流的显存需求压至8GB以下,入门级消费卡即可运行[21] - **吞吐与延迟**:综合使用低比特算子、稀疏注意力与特征缓存,在常见5秒视频场景下达到接近1:1的实时生成速度[21] - **低比特算子**:采用MXFP8/MXFP6/NVFP4等技术,在不明显损伤画质的前提下压缩计算与带宽,释放硬件算力[21] - **稀疏注意力算子**:利用视频时空特征的稀疏性,减少冗余计算,提升大分辨率下的吞吐[21] - **特征缓存**:对中间特征进行缓存与复用,降低重复计算,进一步缩短延迟[21] - **三层延迟隐藏Offloading**:通过精细化的显存-内存调度,在8GB显存上完成28B级别MoE模型推理[21] - **FP8通信多卡并行**:结合FP8通信和流水线/序列并行,在多卡环境下提升吞吐,面向5090等消费级新卡实现更高帧率的强实时目标[21] 模型与硬件生态支持 - **模型生态**:已支持Wan2.1/Wan2.2、CogVideo1.5、HunyuanVideo1.5等主流视频生成模型,以及Matrix Game、MagicDrive等世界模型,并提供4步或少步数配置与加速方案[21] - **应用生态**:深度集成ComfyUI,其LightVAE等核心组件已进入社区主干工作流,用户可在图形界面中直接调用加速推理[21] - **硬件生态**:除支持NVIDIA 3060/4090/5090及A100/A800/H100/H800/H200等显卡外,还原生支持寒武纪MLU590、沐曦C500等国产AI芯片,为本地化、大规模部署提供基础[21] 使用与落地场景 - **个人开发者**:只需带独显的笔记本或台式机,即可本地启动带前端界面的视频生成工具,在ComfyUI中完成素材调试、风格迭代和项目输出[21] - **企业用户**:通过服务化部署方案,可一键搭建面向外部的API服务和Web应用,并按需扩展到多机多卡集群,支持批量视频生产和内部工具集成[21] - **普通用户**:可直接访问网页版入口x2v.light-ai.top,在浏览器中体验少步视频生成和实时预览[21] - 应用覆盖从图像转视频、文本转视频,到世界模型和自动驾驶仿真等领域,旨在通过开源方式将高质量、低成本、强实时的视频生成能力普及[19]
5家消费公司拿到新钱;豆包手机陷入无法使用微信争议;蜜雪冰城开始卖早餐了|创投大视野
36氪未来消费· 2025-12-06 19:27
融资事件 - 高端黄金珠宝品牌“寶蘭”完成过亿元人民币A轮融资 资金将用于品牌价值提升、全渠道布局、供应链升级及人才赋能[3] - 智慧配送企业“江苏云闪送”完成3000万元人民币A轮融资 资金将用于智能调度系统升级、全国服务网络拓展及运力生态构建[5][6] - AI视频生成平台Pollo AI完成1400万美元首轮融资 公司注册用户超2000万 月活用户超600万 年化收入超2000万美元 已于今年5月实现盈亏平衡[8] - 具身智能机器人公司优理奇机器人(UniX AI)完成两轮合计3亿元人民币融资 公司在半年内完成五轮交割[9][10] - 具身机器人公司“戴盟机器人”完成亿元人民币战略轮融资 由中国移动链长基金投资 为三个月内完成的第二轮融资[11] 公司动态与产品 - 字节跳动与努比亚合作的豆包手机助手因操作微信导致账号异常 官方已下线相关功能 该事件涉及安卓高危权限及AI Agent的隐私挑战[12][13] - 腾讯总裁刘炽平表示微信将推出自研AI智能体 让用户在微信生态内利用AI完成任务[14] - 林清轩更新港交所上市招股书 2025年上半年营收10.52亿元人民币 同比增长98.3% 净利润1.82亿元人民币 同比增长109.86% 2024年营销费用达3.65亿元 占总营收30.17%[19][21] - 蜜雪冰城在部分城市试点早餐业务 产品包括豆浆、小米粥、三明治等 此前已在部分门店推出“咖啡+烘焙”早餐套餐[23] 行业趋势与市场数据 - 茶百道冬季新品“豆乳黑麒麟”上市首日销量突破20万杯[25] - 奈雪的茶十周年之际官宣高圆圆为品牌代言人 并推出行业首款低GI蔬果茶“瘦瘦小绿瓶”[27][28] - 2025年贺岁档电影总票房突破25亿元人民币 《疯狂动物城2》领跑票房榜[29] - 2025年中国电子竞技产业收入达293.31亿元人民币 同比增长6.40% 其中直播收入占比80.81% 电竞用户规模超4.95亿人 同比增长1.06%[30] - 2025年第三季度全球智能手机生产数量达3.28亿支 同比增长7% 机构预测2025年全年产量同比增长1.6%[31] 政策与监管事件 - 台湾当局以“资讯安全”为由宣布封禁小红书一年 网页版已无法访问 但APP仍可正常使用[15][16] - 此前台湾有关部门曾称小红书、微博、抖音、微信和百度云盘存在“高度资安风险” 国台办回应指出这些应用深受台湾民众喜爱[18]
视频模型战火再燃!Runway超过谷歌登顶,可灵也来了
第一财经资讯· 2025-12-02 15:16
行业竞争格局 - 2025年12月初,视频生成模型领域竞争加剧,海外初创公司Runway与国内公司可灵AI几乎同时发布新一代视频模型,火药味很浓 [1] - 根据Artificial Analysis基准测试榜单,Runway的Gen-4.5以1247分位列文生视频模型第一,超越谷歌的Veo3(1226分)和快手可灵2.5(1225分)[3] - 行业领先者还包括Luma Labs的Ray 3(1211分)、OpenAI的Sora 2 Pro(1205分)以及MiniMax的海螺02(1198分),竞争格局呈现多强并立态势 [4] - 从2024年开始,AI视频生成领域竞争白热化,谷歌Veo系列在2025年逐渐确立行业领先地位,挤压初创公司空间,而国内如快手可灵、MiniMax也形成了竞争力 [12] Runway公司及Gen-4.5模型 - Runway于2025年12月1日正式发布新一代视频模型Gen-4.5,在基准测试中超越谷歌Veo3登顶 [1] - 公司表示Gen-4.5在预训练数据效率和后训练技术方面取得突破,擅长理解和执行复杂的序列指令,能指定镜头调度、场景构图、事件时间及氛围变化 [5] - 该模型在精确遵循提示词、逼真的物理运动效果、风格控制和视觉一致性方面有新的进展 [5] - Runway强调Gen-4.5实现了前所未有的物理精度和视觉精度,物体能以真实的重量和动力移动,液体流动符合动力学,表面细节渲染逼真 [7] - 公司承认模型仍存在局限性,如在因果推理和对象恒存性方面不足,可能出现效果先于原因或物体意外消失的情况 [11] - Runway计划逐步开放Gen-4.5的使用权限,并以与当前订阅套餐相近的价格全面开放,即“加量不加价” [4] - Runway成立于2018年,根据PitchBook数据,公司估值已达到35.5亿美元,其于2023年2月发布第一代视频模型Gen-1,行业布局较早 [11] - Runway CEO表示,公司仅靠一百人的团队就击败了万亿美元规模的公司,认为极度专注和勤奋能触及技术前沿 [11] 可灵AI及行业其他参与者 - 在Runway发布Gen-4.5后约1小时,国内视频生成公司可灵AI在海外平台宣布上线全新视频模型可灵O1,并将其定义为“首个统一多模态视频大模型” [1] - 截至新闻发布时,基准测试榜单上尚未包含可灵O1的评分,但其被视为Gen-4.5潜在的有力竞争对手 [12] - 快手旗下的可灵2.5 Turbo 1080p模型在2025年9月发布,在基准测试中以1225分位列第三,与第二名谷歌Veo3仅一分之差 [3][4] - MiniMax的海螺02 Standard模型于2025年6月发布,在榜单上以1198分排名第八 [4] - 行业也在期待谷歌下一代视频模型Veo4的发布,围绕视频生成模型领先地位的较量预计将持续 [12]
“AI视频商业化元年”,爱诗科技ARR已突破4000万美元
观察者网· 2025-10-21 17:44
融资情况 - 公司近期完成1亿元人民币B+轮融资,投资方包括复星锐正、同创伟业、顺禧基金等 [1] - 此前于9月10日完成B轮融资,总金额超过6000万美元,由阿里巴巴领投,创下国内视频生成领域单次最大融资额 [1] - 融资资金将用于技术研发、市场拓展及团队建设,推动AI视频生成技术普惠化 [1][4] 公司产品与技术 - 公司自研视频生成大模型已完成五次迭代、八个版本更新,提供准实时、高质量、音画同步的视频生成服务 [1] - 旗下产品PixVerse V5于8月27日上线,优化动态效果、超清视觉处理、一致性保持等核心环节,并上线Agent创作助手功能 [2] - 产品PixVerse网页端上线后,通过变身特效带来1000万新用户增长,2025年5月V4.5版本上线后用户规模达6000万 [1] - 公司是国内首个发布DiT架构视频生成模型的创业公司,在极速生成与一致性等关键维度实现全球领先 [1] 用户与收入表现 - 公司用户规模已突破1亿,月度活跃用户超过1600万,年度经常性收入超过4000万美元 [2] - 产品于2024年11月正式商业化,不到一年时间收入增长超过10倍,是全球收入和用户增长最快的AI平台之一 [3] - 截至8月31日,开放平台API生成的视频数量突破1000万个,八月单月API调用量实现翻倍 [4] - 根据数据,PixVerse在9月网站访问量增长超过26.91% [4] 市场拓展与运营策略 - 公司业务布局覆盖C端与B端市场,C端定位低门槛AI视频创作工具,B端聚焦广告、短剧和游戏三大场景 [2] - 增长源于"创作–分享–互动"的社交飞轮与本地化运营,在美国、欧洲、巴西、印度、日本等市场展现出鲜明本地化偏好 [3] - 特效模板功能受热捧,例如在墨西哥和印度,"KissKiss"等模板单日生成使用峰值均超30万 [3] - 公司坚持以产品力驱动"聪明增长",拒绝盲目烧钱扩张,注重模型训练质量与成本平衡 [4] 行业背景与展望 - 2025年被业内视为"AI视频商业化元年",头部企业呈现用户规模与收入同步增长态势 [5] - 阿里巴巴、北京市人工智能产业投资基金等巨头及国资背景资本持续加码该领域 [5] - 业内分析认为,具备多模态能力、垂直场景落地能力及数据闭环能力的企业将在竞争中占据优势 [5]
爱诗科技完成1亿元B+轮融资 ARR超4000万美元
搜狐财经· 2025-10-18 00:28
融资与财务表现 - 公司于10月17日完成1亿元人民币B+轮融资,投资方包括复星锐正、同创伟业、顺禧基金等 [1] - 公司年度经常性收入超过4000万美元,自2024年11月商业化以来不到一年时间收入增长超过10倍 [1] - 产品月活跃用户数超过1600万,用户总规模已突破1亿 [1] 产品与技术进展 - 公司自研视频生成大模型在两年内进行了五次迭代,共八个版本的更新 [1] - 8月27日上线的PixVerse V5模型具备准实时生成能力,优化了动态效果、超清视觉处理、一致性保持等核心环节 [2] - 同步上线的Agent创作助手功能,使用户无需复杂提示词技巧即可一键生成专业级视频 [2] - 平台通过准实时生成与角色驱动视频等核心技术降低创作门槛,是全球最早实现角色驱动视频生成的平台之一 [2][4] 商业化与生态建设 - 公司商业化模式主要基于会员订阅服务,并于今年初开放API生态 [2] - 截至8月31日,过去半年内通过API生成的视频数量突破1000万个,八月单月API调用量实现翻倍 [2] - 产品在影像、广告、游戏制作等领域逐步应用,增强了创作者对故事叙事的掌控力 [2][4] 市场地位与用户增长 - 公司是过去一年全球收入和用户增长最快的AI平台之一,产品成为全球创作者使用AI视频生成的首选平台 [1][2] - 平台凭借“速度快、易上手、创意可控”的产品理念,迅速成为全球普通消费者体验和消费AI视频内容的“第一站” [2][4]
爱诗科技完成1亿元B+轮融资:过去一年收入和用户增长最快的AI平台之一
IPO早知道· 2025-10-17 19:14
公司融资与估值 - 公司完成1亿元人民币B+轮融资,投资方包括复星锐正、同创伟业、顺禧基金等 [2] - 此前于9月10日完成B轮融资,总金额超过6000万美元,由阿里巴巴领投,创下国内视频生成领域单次最大融资额 [2] - 公司年度经常性收入超过4000万美元,商业化不到一年收入增长超过10倍 [4] 技术与产品进展 - 公司是国内首个发布DiT架构视频生成模型的创业公司,在极速生成与一致性等关键维度实现全球领先 [2] - 自研视频生成大模型在两年内进行五次迭代,共八个版本更新,为用户提供准实时、高质量且音画同步的视频生成服务 [2] - PixVerse V5上线,优化动态效果、超清视觉处理、一致性保持等核心环节,并推出Agent创作助手功能,降低用户创作门槛 [4] - 平台通过准实时生成与角色驱动视频等核心技术,在影像、广告、游戏制作等领域逐步应用 [4] 用户与市场表现 - 公司旗下产品PixVerse与拍我AI用户规模突破1亿,月活跃用户超过1600万 [4] - 平台是过去一年全球收入和用户增长最快的AI平台之一 [4] - 开放平台在过去半年通过API生成的视频数量突破1000万个,八月单月API调用量实现翻倍 [6] - 根据AIGCRank数据,PixVerse在9月网站访问量增长超过26.91%,移动和网页端双增长 [6]
Sora 2引爆文生视频赛道,市场年均增速20%,机构建议关注三大方向
36氪· 2025-10-11 19:09
产品技术升级 - OpenAI推出视频生成模型Sora 2的重大升级,新版本在物理准确性、逼真度、可控性方面均有提升,并实现同步生成音频和对话的能力[1] - Sora 2被定义为视频生成领域的GPT-3.5时刻,在物理运动、人物塑造、跨镜头一致性控制及多模态协同能力方面取得突破,支持多镜头切换和人物口型与发音精准对齐[3] - 竞争对手xAI推出Grok Imagine v0.9,支持从静态图像转化为动态视频并集成背景音乐与对话;谷歌Veo 3.1能生成8秒720p含音轨视频,行业竞争加剧[3][4] 市场反应与表现 - Sora 2上线后不到五天下载量突破100万次,增长速度超过ChatGPT[3] - 相关概念股逆势上涨,初灵信息涨12.94%,开普云涨4.52%,视觉中国涨3.11%[1] - 2024年AI视频生成全球市场规模为6.15亿美元,预计2025年达7.17亿美元(同比增长17%),2032年有望达25.63亿美元,2025-2032年复合增长率为20%[6] 产业链与商业应用 - 文生视频行业形成“模型能力-用户场景-商业变现”完整链路,以“数据飞轮+社交网络”构建护城河[6] - AI视频生成技术从辅助创作迈向自主生成,影视、广告、游戏等行业将受益于降本增效,并催生新的商业形态[8] - 机构看好三大投资主线:算力需求爆发与架构多元化、AIoT终端(AR眼镜/人形机器人/AI手机)放量、AI+视频在金融/医疗/教育场景的飞轮效应[8] 国内公司布局 - 汉王科技在多模态识别、文本理解等技术上深耕,形成智能终端产品和行业解决方案[6] - 视觉中国与智谱清影、通义千问合作,将光厂创意平台接入文生视频API,2025年上半年视觉内容与服务营收3.99亿元(同比增长0.05%)[6] - 风语筑在数字人驱动、文生文、文生图等场景引入AIGC技术,并积极探索文生视频、图生视频等生成式3D内容场景[7]
AI视频商业化元年开启 爱诗科技创融资纪录 阿里领投押宝“下一个抖音”?
新浪财经· 2025-09-14 19:29
融资情况 - 爱诗科技完成超过6000万美元B轮融资 由阿里巴巴领投 达晨财智 深创投 北京市人工智能产业投资基金 湖南电广 巨人网络和Antler等跟投 创国内视频生成领域单次最大融资额 [1] - 资金将用于技术研发和市场拓展 推动AI视频生成技术普惠 [1] 公司发展 - 公司创立于2023年4月 致力于打造全球领先的AI视频生成大模型及应用 [2] - 2024年1月推出海外版产品PixVerse 2025年6月推出面向国内市场的"拍我AI" [2] - 全球用户规模突破1亿 4个月前为6000万 增长迅速 [2] - 自研视频生成大模型PixVerse V5位居Artificial Analysis图生视频榜首 [2] - 产品订阅收入已覆盖成本 [2] 业务布局 - C端市场是长期看好方向 产品定位为普通用户提供低门槛AI视频创作工具 [2][3] - 2025年1月开展B端业务 场景集中在广告 短剧和游戏 [3] - 广告场景可快速批量生成商品展示 口播 特定SKU广告素材 [3] - 游戏场景可提升场景资产 角色设计及激励广告的生成效率 [3] 行业竞争 - 国内主要企业包括快手(可灵AI) 抖音(即梦AI) 阿里巴巴(通义万相 绘蛙AI视频) 美图 生数科技 智谱(智谱清影AI) [5] - 国外企业包括OpenAI Meta Pika Labs等 [5] - 2025年被称为"AI视频商业化元年" 行业处于技术爆发 商业落地 资本热捧三重红利期 [5] - 具备多模态能力 垂直场景落地能力 数据闭环能力的企业将脱颖而出 [5] 战略优势 - 坚持视频生成确定性赛道 从自主研发到技术产品化未偏离核心主线 [3] - 拒绝盲目烧钱扩张 依靠产品力实现聪明增长 过去半年用户从6000万增长至1亿 [3] - 不盲目追求模型参数规模 以保证质量为前提降低训练成本 规划精细化迭代方向 [3] 创始人背景 - 创始人王长虎曾任职微软亚洲研究院 字节跳动AI Lab总监 龙湖数字化与智能化转型负责人 [4][5] - 2023年3月离开龙湖创业 4月获得首轮数千万人民币融资 6月核心团队成型 [5] - 创业思路是从视觉和多模态出发 做AIGC时代行业及应用的算法平台 [5] 投资方布局 - 阿里巴巴采取自研和投资并行路径 旗下夸克团队推出AI产品"造点" [6] - 领投爱诗科技有利于完善AI生态布局 填补视频生成领域空白 [6] - 看好AI视频生成领域巨大潜力 可解决短视频 直播行业内容创作效率和质量问题 [6]