AI视频生成 - 财报，业绩电话会，研报，新闻 - Reportify

AI视频生成

搜索文档

爱诗科技完成1亿元B+轮融资：过去一年收入和用户增长最快的AI平台之一

IPO早知道· 2025-10-17 19:14

公司融资与估值 - 公司完成1亿元人民币B+轮融资，投资方包括复星锐正、同创伟业、顺禧基金等 [2] - 此前于9月10日完成B轮融资，总金额超过6000万美元，由阿里巴巴领投，创下国内视频生成领域单次最大融资额 [2] - 公司年度经常性收入超过4000万美元，商业化不到一年收入增长超过10倍 [4] 技术与产品进展 - 公司是国内首个发布DiT架构视频生成模型的创业公司，在极速生成与一致性等关键维度实现全球领先 [2] - 自研视频生成大模型在两年内进行五次迭代，共八个版本更新，为用户提供准实时、高质量且音画同步的视频生成服务 [2] - PixVerse V5上线，优化动态效果、超清视觉处理、一致性保持等核心环节，并推出Agent创作助手功能，降低用户创作门槛 [4] - 平台通过准实时生成与角色驱动视频等核心技术，在影像、广告、游戏制作等领域逐步应用 [4] 用户与市场表现 - 公司旗下产品PixVerse与拍我AI用户规模突破1亿，月活跃用户超过1600万 [4] - 平台是过去一年全球收入和用户增长最快的AI平台之一 [4] - 开放平台在过去半年通过API生成的视频数量突破1000万个，八月单月API调用量实现翻倍 [6] - 根据AIGCRank数据，PixVerse在9月网站访问量增长超过26.91%，移动和网页端双增长 [6]

PixVerse（拍我AI）

Agent创作助手

PixVerse（拍我AI）

Agent创作助手

百度蒸汽机，盯上长视频生成实时交互

21世纪经济报道· 2025-10-17 19:00

多模态AI视频行业竞争格局 - 行业竞争焦灼参与方在技术上均无绝对优势长期优势难以维持[2] - 当前竞争焦点在于执行力与速度[2] - 近期Open AI发布Sora 2模型国内AI视频公司亦频繁更新动态[3] 百度蒸汽机模型技术进展 - 百度蒸汽机模型于10月15日升级重点提升交互体验[3] - 模型实现实时交互生成AI长视频突破传统10秒时长限制[4] - 用户可通过上传图片和提示词启动生成并可实时预览随时暂停或修改提示词以控制视频剧情画面和转场[4] 百度蒸汽机模型技术细节与迭代 - 为延长视频时长行业普遍采用"首尾帧续写"技术但易导致视频缺乏连贯性[4] - 百度团队升级基础架构引入自回归扩散模型并着手消除训推偏差及优化一致性以应对技术挑战[4] - 自7月发布以来模型基本保持每月重大更新的迭代频率[4] - 百度蒸汽机的APP正在规划中[4]

自回归扩散模型

Artificial Intelligence

百度蒸汽机（文心专精）

自回归扩散模型

Artificial Intelligence

百度蒸汽机（文心专精）

爱诗科技完成B+轮1亿元融资 ARR突破4000万美元

证券日报网· 2025-10-17 18:47

融资情况 - 公司于10月17日完成1亿元B+轮融资，投资方包括复星锐正、同创伟业、顺禧基金等 [1] - 此前在9月10日完成B轮融资，总金额超过6000万美元，创下国内视频生成领域单次最大融资额 [1] - 融资资金将用于技术研发和市场拓展 [1] 财务与用户指标 - 公司旗下产品用户规模已突破1亿，月活跃用户（MAU）超过1600万 [1] - 年度经常性收入（ARR）超过4000万美元 [1] - 公司于2024年11月正式商业化，不到一年时间收入增长超过10倍 [1] 产品与技术优势 - 公司是国内首个发布DiT架构视频生成模型的创业公司，在极速生成与一致性等关键维度实现全球领先 [2] - 自研视频生成大模型进行了五次迭代，共八个版本的更新 [2] - PixVerse V5于8月27日上线，具备准实时生成能力，并优化了动态效果、超清视觉处理等核心环节 [2] - 产品理念为“速度快、易上手、创意可控”，大幅降低创作门槛 [2][3] 商业化与生态建设 - 商业化收入主要来源于会员订阅服务 [2] - 开放平台API生态表现突出，过去半年通过API生成的视频数量突破1000万个 [3] - 随着V5大模型等能力更新，八月单月API调用量实现翻倍 [3] 行业地位与市场拓展 - 公司产品是过去一年全球收入和用户增长最快的AI平台之一 [1] - 产品成为全球普通消费者体验和消费AI视频内容的“第一站” [1][3] - 平台在影像、广告、游戏制作等领域逐步应用 [2] - 公司积极参与行业活动，如亮相釜山电影节并发起AI训练营 [3]

PixVerse（拍我AI）

PixVerse（拍我AI）

晚点独家丨爱诗科技完成 1 亿元 B+ 轮新融资，ARR 突破 4000 万美元

晚点LatePost· 2025-10-17 15:29

公司动态：爱诗科技 - 爱诗科技完成1亿元人民币B+轮融资，由复星锐正、同创伟业、顺禧基金共同投资，公司成立于2023年4月，累计融资总额超过1亿美元 [5] - 公司旗下产品PixVerse（海外版）和拍我AI总用户数超过1亿，月活跃用户超1600万，年度经常性收入达4000万美元 [5] - 公司创始人王长虎拥有近20年AI研究经历，曾任职于微软亚洲研究院和字节跳动，联合创始人谢旭璋有6年光源资本工作背景 [9] - 产品PixVerse网页端上线后，通过变身特效实现1000万新用户增长，2025年5月V4.5版本上线后用户规模达6000万，8月V5版本上线并推出Agent创作助手，用户规模达到1亿 [9] 行业竞争格局 - 在图片生成视频模型领域，全球前十名中前三名均为中国公司，分别是快手可灵、爱诗PixVerse和MiniMax海螺，OpenAI的Sora模型排名第31位 [10][11] - 在文字生成视频模型榜单中，OpenAI的Sora 2模型排名第11位 [10][11] - 字节跳动旗下的视频生成模型Seedance和Waver在榜单中分别位列第7和第8位，其产品即梦移动端日活目标为超过500万 [12] - 行业领先的大语言模型主要由美国公司如Google、OpenAI、Anthropic提供，但在视频、语音等多模态领域，中国公司模型已跻身全球顶尖行列 [11] 产品与技术进展 - OpenAI发布视频生成模型Sora 2及社交应用Sora App，新模型在物理模拟、音画同步与场景连贯性上有显著提升，用户可生成带声音的视频并在类TikTok内容流中分享 [7][8] - Sora App上线后迅速登顶美区App Store免费榜并连续7天位居第一，上线不到两周下载量突破100万，增长速度超过当年ChatGPT [8] - 爱诗科技针对移动端产品进行大量优化，包括人物一致性、画质可选项和生成速度，并通过特效模板如“变身”等带来上千万新增用户 [9][11] - OpenAI宣布Sora App和网页端用户可生成最长15秒视频，Pro用户可在网页端生成最长25秒视频，此前标准版为10秒，Pro版为15秒 [13] 市场趋势与潜力 - 视频生成移动App赛道市场容量极大，现有工具和产品短期内无法完全覆盖所有用户，抖音和TikTok月活超过20亿，每个短视频用户都是潜在AI视频创作者 [9] - 快手可灵核心目标聚焦专业创作者而非普通用户，自启动商业化以来截至今年2月累计营收已突破1亿元 [12] - 多模态领域被认为具有巨大的消费和娱乐潜力，尽管不是AGI演进的最主轴，但该领域的竞争烈度正在加剧 [4][13] - 行业公司在技术突破和应用体验两个维度并行推进，Google Veo3、快手可灵等侧重长时一致性和专业工作流，而字节即梦、爱诗等加强产品体验和新奇玩法 [12]

多模态领域

AI Video Generation

多模态领域

AI Video Generation

视频生成赛道竞争白热化百度押注“实时交互”求破局

每日经济新闻· 2025-10-16 20:53

AI视频生成行业发展趋势 - 行业竞争焦点正从技术性能比拼转向降低用户门槛和丰富玩法的竞争[6] - 全球技术竞赛快速推进但底层架构和技术路径日益趋同创新和用户体验成为核心突破口[6] - 行业目标是通过降低门槛和丰富玩法吸引更多用户涌入最终让用户知道怎么玩并愿意玩[6] 百度“蒸汽机”模型技术架构 - 模型采用三层结构中底层是模型层中层是工具层上层是产品层承担着AI内容生态基础设施的角色[4] - 技术架构从窗口式扩散生成升级为自回归流式扩展架构以实现可打断和可修改的实时交互[2][3] - 通过采用历史帧和稳定锚点帧技术等优化手段解决自回归机制带来的累积误差和一致性挑战[3] 实时交互的价值与应用 - 实时交互能提升信息密度将单向内容消费转变为双向互动极大提升娱乐性[3] - 浅层应用可提升广告线索质量深层应用能完成如心理咨询等场景的深度交互服务[3] - 实时交互是AI视频竞争下半场的关键能让更多人低成本参与创作从而在生态中积累势能[1] 百度视频生成业务表现与战略 - 平台视频生成量级已从百万级提升到千万级通过升级流式架构提升了生成效率[6] - 当前最明显收益是C端用户留存和使用时长提升直接带来了原有商业化模式收入增长[7] - 营销相关和内容创作是调用量最大的两大落地场景其中营销相关调用量占到约一半[7] - 公司To B端满足内部技术业务库和外部客户定制化需求To C端侧重于结合百家号等生态做大创作者生态[7]

百度‘蒸汽机’

百度‘蒸汽机’

迎战Sora 2！谷歌上线视频模型Veo 3. 1，赢面几何？

第一财经· 2025-10-16 20:30

文章核心观点 - 谷歌在Sora 2发布半个月后迅速推出视频生成模型Veo 3.1，与OpenAI展开正面竞争，但此次更新仅为小幅迭代，性能提升有限，未达到超越Sora 2的程度 [3][7][19] - 视频生成赛道竞争白热化，谷歌与OpenAI交替领先，但目前尚无一家具备绝对统治力，行业未来变数仍大 [7][19][20] 谷歌Veo 3.1模型更新 - Veo 3.1的核心亮点包括更丰富的原生音频生成、更强的电影风格理解与叙事控制，以及更逼真的质感还原，音频质量更逼真，能模拟紧张背景配乐与人物语言 [11] - 模型在Flow AI电影制作工具中集成多项功能升级，包括首尾帧功能可生成平滑过渡画面，视频延展功能可生成长达一分钟或更长的片段，素材生视频功能可根据参考图像生成完整视频 [13][15] - 用户测试显示Veo 3.1在提示词遵循、视听质量与音频支持方面比Veo 3提升约20%至30%，基础物理模拟有进步但在复杂画面中仍会出错 [18] 与OpenAI Sora 2的竞争对比 - Sora 2在微观写实、光影与物理细节上更受认可，音频更自然，并具备自动分镜功能对视频叙事帮助显著，而Veo 3.1镜头变化保守，对物理世界理解不如Sora 2 [18] - 在视频长度上Sora 2优势明显，普通用户可生成15秒视频，专业用户可达25秒，而Veo 3.1支持输出最长8秒视频 [7][9][18] - Veo 3.1的主要优势在于生成速度比Sora 2快很多，且谷歌在多模态生态上更为成熟，图像与视频模型联动可形成完整创作闭环 [18] - 价格方面Veo 3.1标准版为0.4美元/秒，快速版为0.15美元/秒，对比Sora 2的0.1美元/秒和Sora2-pro的0.3美元/秒，吸引力不足 [19] 视频生成行业竞争格局 - 视频生成大战中谷歌与OpenAI持续加码，国内玩家如可灵、海螺AI、即梦等也具备不小竞争力，AI视频的“GPT-3.5时刻”仍未到来 [20] - 行业竞争格局动态变化，2024年初Sora引发震动，2024年5月谷歌推Veo 1迎战，2024年12月Veo 2被普遍认为更优，2025年5月Veo 3登顶，2025年10月初Sora 2再度改写竞争格局 [19]

迎战Sora 2！谷歌上线视频模型Veo 3. 1，赢面几何？

第一财经· 2025-10-16 18:48

文章核心观点 - 谷歌在Sora 2发布半个月后火速推出视频模型Veo 3.1和Veo 3.1 Fast 正面迎战OpenAI 行业竞争白热化 [1][5] - 此次更新被视为一次小的迭代性能较Veo 3提升不大行业认为Veo 3.1未到超越Sora 2的地步 [5][17][19] - 视频生成赛道竞争激烈两大巨头持续加码尚无一家具备绝对统治力未来行业变数很大 [5][20] 模型功能更新 - Veo 3.1核心亮点包括更丰富的原生音频生成更强的电影风格理解与叙事控制以及更逼真的质感还原 [9] - 模型在视频生成同时自动根据画面内容生成环境音动作声及氛围配乐音频质量更逼真尤其在对话上 [9] - 迭代包括Flow工具的核心功能升级如首尾帧功能可根据起始和结束图像生成平滑过渡画面 [11] - 视频延展功能支持从剪辑最后一秒扩展视频可生成持续一分钟或更长的片段 [13] - 素材生视频功能支持上传多张参考图像生成包含指定角色与场景风格的完整视频并可通过Remove功能移除物体或人物 [13] 模型性能对比 - 用户测试显示Veo 3.1在提示词遵循视听质量与音频支持方面比Veo 3提升约两到三成基础物理模拟有进步但在复杂画面中仍会出错 [17] - 与Sora 2相比 Veo 3.1在光影效果和生成速度上更突出但Sora 2在微观写实物理细节自动分镜及音频自然度上更常被认可 [5][17] - Veo 3.1支持输出最长8秒视频 Sora 2最新更新后普通用户可生成15秒视频专业用户可达25秒 [5][18] - Veo 3.1生成速度比Sora 2快很多 Sora 2需等待数分钟 [18] 市场生态与定价 - 谷歌在多模态生态上更为成熟图像模型与视频模型联动可形成完整创作闭环 [18] - Veo 3.1处于预览阶段用户可在Gemini API Vertex AI Gemini应用及Flow上付费使用 [18] - Veo 3.1标准版定价0.4美元/秒快速版0.15美元/秒对比Sora 2的0.1美元/秒和Sora2-pro的0.3美元/秒价格吸引力不足 [18] - 由Veo驱动的AI电影制作工具Flow 截至目前用户已生成超过2.75亿个视频 [11] 行业发展历程 - 2024年初Sora引发行业震动同年5月谷歌推出Veo 1迎战至12月Veo 2取得突破业界普遍认为Veo 2更优 [19] - 2025年5月Veo 3发布登顶多榜 10月初OpenAI发布Sora 2再度改写竞争格局 [20] - 国内玩家如可灵海螺AI 即梦等也有不小竞争力 [20]

谷歌(US:GOOG)

Sora2，AI帮你赚钱的时候到了

36氪· 2025-10-16 17:06

产品发布与市场反响 - OpenAI发布新一代AI视频模型Sora2，其生成的视频具备10秒出片、高度逼真的物理逻辑和电影运镜般的多镜头切换能力，已无限逼近人类专业创作者 [1] - Sora App上线第四天即登上苹果美国应用商店免费应用榜第一名，超越Gemini和ChatGPT [1] - Sora iOS版上线仅两天，总下载量达16.4万次，首发下载量为5.6万次 [2] 核心功能与技术创新 - Sora App提出两大颠覆性AIGC社交功能：客串（Cameo）功能基于世界模拟模型，允许用户将自身或朋友形象"传送"至任意想象场景并自然交互 [5] - 二次创作（Remix）功能使用户能基于现有视频输入新提示词进行再创作，极大降低了参与热门趋势和AIGC制作的门槛 [5] - Sora2可生成时长25秒（Pro用户）、接近4K细节的短视频，画面锐利且帧间延续性好，支持多语言同步翻译 [11] 商业模式与电商融合 - OpenAI构建了"内容平台激发需求（Sora）—支付渠道保障（Stripe）—电商平台供给商品（Shopify/Etsy）"的商业模式闭环 [8] - OpenAI推出"Instant Checkout"即时结账功能，使ChatGPT实现从商品推荐到直接支付的全链路电商闭环 [8] - 通过"代理商务协议"（ACP），Sora有望开启端到端的新电商模式，形成区别于传统平台的新"人货场"逻辑 [8] 对内容创作行业的影响 - AI深度参与短剧制作各环节，TVB上线了100%AI生成短剧，AI承担了编剧、导演、美术、剪辑、后期等全部职责 [11] - 传统短剧制作需2-3个月周期、50-200万试错成本，而AI短剧已进化到10-15天出片、6-15万低成本试错，单集成本最多可下降90% [12] - Sora App采用对标TikTok的滑动操作模式，形成"浏览-激发-创作-分享"的闭环，具备极强社交属性和用户数据飞轮效应 [13] 新兴变现模式与IP管理 - OpenAI引入"IP分成"收益机制，赋予版权方更细粒度控制权，并探索当用户使用授权角色产生收益时版权方可获得分成的模式 [15] - 该模式将版权方与AI使用者的"敌对"关系转化为"共赢"，有望借鉴YouTube成熟的版权识别和收益共享系统 [16][19] - 全球AI视频市场规模在2023年已达到420亿美元，新变现思路有望连接IP授权方与全球创作者，直通百亿美元市场 [19][20] 对营销广告业的影响 - Sora2等工具的出现将广告视频生产成本大幅降低，使以前不成立的商业模式成为现实 [9] - 在广告主采购价不变的前提下，熟练运用AI者可将视频生产效率提高十倍甚至百倍，获得短期收益红利 [14] - 但从广告营销整体产业链看，Sora2目前仅影响了末端占比不到1%的视频制作环节，对整个百年产业链的冲击有限 [13] 出海业务与品牌价值重塑 - AI技术使依托中国强大供应链的"一个人公司"也能完成出海全套流程，直接打通营销、投流、客服等环节 [9] - AI匹配模式下，渠道价值衰减而品牌价值被放大，企业可通过MCP协议将商品服务散发给AI，由AI根据用户指令精准匹配 [10] - 虚拟偶像与主播市场2023年全球销售额达10.83亿美元，预计2030年达51.29亿美元，消费者决策更侧重于对氛围和品牌信任度而非主播真伪 [22]

电商模式创新

电商模式创新

瞄准 Sora 2，谷歌发布 Veo 3.1，功能大更新，但硬刚还差点儿

Founder Park· 2025-10-16 11:52

产品发布与定位 - 谷歌深夜发布了最新的AI视频生成模型Veo 3.1 [2] - 此次更新是在2025年5月发布的Veo 3基础上进行的升级 [7] 功能与技术升级 - Veo 3.1相比前代版本带来了更丰富的音频、叙事控制以及更逼真的质感还原 [3] - 模型进一步提升了提示词遵循度，并在以图生视频时提供更高的视听质量 [3] - 增强了对对话、环境音效以及其他音频效果的支持，在Flow的多个核心功能中已支持原生音频生成 [7][8] - 引入了对多种输入类型的支持，可接受文本提示、图像以及视频片段作为输入，并支持参考图像（最多三张）、首帧与末帧插值以及场景延展 [13] - 新功能包括插入（向场景中添加物体）和移除（删除元素或角色），但并非所有功能都能通过Gemini API即时使用 [14] - 新功能带来了对主体与环境的更精确控制，企业用户上传产品图片后，模型能在整个视频中保持其外观特征与风格一致性 [19] 性能与输出规格 - 模型支持输出720p或1080p分辨率的视频，帧率为24帧/秒 [16] - 基础生成时长为8秒，但可以延长至30秒甚至1分钟以上，使用Extend功能最长可扩展至148秒（超过两分半） [9][11][22] - 在视频延长时会产生音频不连贯问题，导致延长部分几乎不可用 [4] 市场评价与竞争对比 - 第三方测试显示，Veo 3.1在模型质量上相比前代提升不大，画面感觉更“油腻”和虚假 [4] - 此次更新更多体现在功能的增加上，核心模型质量并无质的飞跃，离竞争对手Sora2还有一段距离 [4] 部署与商业化 - 模型可通过谷歌旗下多项现有AI服务访问，包括Flow、Gemini API和Vertex AI [17] - Veo 3.1模型目前处于预览阶段，仅在Gemini API的付费层级中可用，收费结构与Veo 3保持一致 [15] - 标准模型收费为每秒视频0.40美元，快速模型收费为每秒视频0.15美元 [18] - 目前尚无免费层级，且仅在视频成功生成后才会计费 [15] 行业应用前景 - 原生音频的引入让用户能更好地掌控视频的情绪、节奏与叙事基调，这些能力以往只能通过后期制作实现 [12] - 在企业场景中，这种高层次的控制有望减少独立音频制作流程的需求，便于制作培训内容、营销视频或数字体验作品 [12] - 对品牌一致性的控制能力有助于简化创意生产流程，特别适用于零售、广告以及虚拟内容制作等需要视觉延续性的团队 [19]

刚刚， AI视频王者大更新！硬刚Sora，威尔史密斯吃面更香了

创业邦· 2025-10-16 11:23

核心观点 - Google Veo 3 1视频生成模型迎来重大升级在功能完善和模型进步两个层面均有显著提升特别是在提示词理解和视听质量上取得明显进步 [4][5][8] - 新版本首次为多项核心功能加入音频支持使音频成为创作流程的一部分提升了视频内容的完整性和场景感 [7][11] - 模型在照片级和商业级内容生成上已具备较高可用性但在特定风格如动漫领域的精准还原仍有优化空间 [40][41] 功能升级 - 视频编辑功能得到强化用户可对片段进行更细致调整对最终画面实现更精准掌控 [5] - 为素材转视频帧转视频和延展功能全部加入音频支持目前处于实验阶段将根据用户反馈继续优化 [7][11] - 新增插入新元素和移除对象两项编辑功能前者可随时添加内容并自动处理阴影光线后者可删除不需要元素并自动重建背景使编辑过程更灵活 [20] - 输出格式从仅支持720p横屏扩展至可同时生成横屏和竖屏的16:9视频更符合当前主流内容消费习惯 [19] 模型性能提升 - Veo 3 1在提示词理解和视听质量两个关键指标上明显提升从图像到视频的转化更加自然流畅 [8] - 对细节刻画更精准例如在生成玻璃柠檬的案例中对融化闪粉的细节表现优于前代版本 [28] - 在电商广告场景下其视觉呈现被评价为更高级更有商业感尽管在语音解说方面不如竞争对手Sora 2 [32] 应用场景与市场影响 - 用户已在Flow应用中创作超过2 75亿个视频新功能旨在支持更灵活的迭代编辑 [20] - 模型已通过Gemini API向开发者开放企业用户可在Vertex AI中访问普通用户可在Gemini应用内体验 [22] - 行业观察到视频生成模型迭代速度超出大多数人想象此类工具正从专业工具演变为大众应用未来AI生成内容可能充斥各类社交及新闻平台 [41][42]

Artificial Intelligence

Artificial Intelligence