AI视频生成
搜索文档
千亿豪赌!OpenAI领衔,视频生成上演巨头“终局之战”
搜狐财经· 2026-01-21 11:17
SORA模型的技术原理与局限性 - SORA模型的核心思想是对视频进行高度抽象和压缩,将其映射到一个抽象空间,类似于高级皮影戏,使用来自真实世界的抽象基本视频元素拼接成完整视频,使其“打眼一看”具有真实感 [3][25][48][71] - 该技术与真正“理解物理世界”并基于此仿真虚拟世界仍有不小距离,差距被比喻为手机拍视频与电影制作之间的距离 [3][25][48][71] - 现有AI缺乏对物理世界的理解,甚至无法产生“加速度”概念,因此无法生成物理意义上精确的运动轨迹,更无法处理复杂粒子模型 [7][30][53][76] - 以目前已知技术思路,AI绝对不可能产生与实拍电影完全对等的效果,不仅无法取代实拍电影,连取代动画电影也绝无可能 [7][30][53][76] 公众认知与AI能力现实的差距 - 外行普遍误解在于,看到AI能完成人类看来很难的事(如处理法律文件、智能驾驶),便认为其更能完成人类看来简单的事(如炒菜、端茶送水) [8][31][54][77] - 本质在于计算机擅长处理信息量大但规则简单的事务,而人类擅长处理信息量不大但潜在规则复杂的事务,当前AI并未突破这一点 [8][31][54][77] - 以“端茶送水”为例,其涉及多自由度关节精准控制、水面平衡实时观测、环境预警、运动轨迹规划等,对计算机程序的复杂度远超登月任务 [9][32][55][78] AI视频技术的实际应用与市场炒作 - AI视频生成技术(如SORA)最重大的实际影响可能在于股市,普通人对技术的理解与现实存在巨大差距,这创造了炒股空间 [11][25][34][48][57][71][80] - 在美国以股市为主导的环境下,企业更倾向于推出能激发公众无穷想象力的“颠覆性”技术,通过反复炒作(散户盲目上车后割肉离场)让庄家赚得盆满钵满,技术本身是否有用反而不重要 [11][34][57][80] - 对于AI视频技术,大部分行业难以想出具体应用场景,例如直播带货用AI虚拟主播替代真人主播,其可行性与意义存疑 [11][34][57][80] 务实与炒作两种AI发展路径对比 - 另一条发展路径是从客户实际需求出发,解决具体行业问题(如用AI加速气象云图分析、从雷达波干扰中识别隐形飞机),此类应用商业模式清晰,客户会实际付费 [13][36][59][82] - 但此类专业应用因公众不懂而缺乏炒作话题,不适合股市炒作,例如宣布将某项预测速度提高10倍难以引发公众兴趣 [13][36][59][82] - 以华为为例,其专注于商业模式清晰、客户按月付费的生意(如智能驾驶),不依赖吹嘘和炒作散户,其AI大模型(如盘古)渗透于千千万万具体行业以提升生产效率,大部分应用不为外行所知 [13][15][36][38][59][61][82][84] - 华为不上市,通过发行企业债融资,其一年所交税款超过许多上市公司的市值 [13][36][59][82] OpenAI与华为的商业模式与技术路线差异 - 抛开资本市场融资,单从客户赚钱角度看,OpenAI缺乏正经赚大钱的业务,其主要现金流来自股市炒作而非常规业务,这决定了其研发面向推出所谓的“划时代”技术以服务炒作 [15][38][61][84] - 真正的“AI时代”应由像华为盘古大模型那样,渗透到具体行业并与企业联合开发以提高生产效率的路径带来,而非以让散户激情四射为目的的研发 [17][40][63][86] - OpenAI不断推出刺激公众的产品(聊天、画画、视频),导致受众“敏感度”越来越低,未来若转向务实但不够刺激的行业应用(如AI控制金属探伤仪用于桥梁监测),将难以满足被吊高的公众预期 [18][41][64][87] - OpenAI目前提供的“想象空间”越大,其日后务实落地的空间反而可能越小,这类似于依赖不断寻找更刺激药物的成瘾模式 [20][43][66][89] 中美AI发展轨道与资本环境差异 - 中美AI发展轨道不同,基本不做对方的事情,若以实现通用AI比喻为攀登珠穆朗玛峰,中国主流思路(如华为)是进行基础体能训练(跑步、撸铁),而美国则相当于在小山坡表演攀岩并宣称“遥遥领先” [20][43][66][89] - 在美国以资本市场和“外行领导内行”的体制下,资本偏好能引发公众狂热的话题(如教授与幼女解方程),迫使科学家和研发资源服务于炒作,而非真正有重大价值的产品 [22][45][68][91] - 这种环境导致像OpenAI这样的公司,其科学家虽有操守和梦想,但在资本压力下,研发方向不得不面向股市炒作 [22][45][68][91]
快手20260115
2026-01-16 10:53
纪要涉及的行业或公司 * 公司:快手及其旗下AI业务“可灵AI”[1] * 行业:AI多模态生成工具、短视频平台、在线广告、直播电商[1] 核心观点与论据 **可灵AI的商业化表现与潜力** * 可灵非中国区2025年12月流水接近50万美元,2026年1月首周流水接近100万美元,环比增长近200%,显示巨大商业化潜力[2] * 2025年12月,可灵的年化经常性收入(ARR,SaaS)达到2.4亿美元,商业化能力突出[3] * 产品迭代(如O1发布)显著提升了流水增速,同时优化生成成本,降低价格,扩大了用户群体[2][4][5] **可灵AI的产品与技术进展** * 2025年12月1日发布首个大一统多模态创作工具“可灵O1”,整合文字、视频、图片、主体等多模态输入[2][4] * 推出音画同步功能,大大减少了人工编辑量[4] * 自2025年8月起,高级副总裁盖坤兼任可灵AI技术负责人,理顺技术职责,促进产品与技术结合,推动了OE版本迭代和降价策略[4][10] **可灵AI的竞争优势** * 聚焦于用AI产生视频内容的核心愿景,资源集中[6] * 具备强大的技术领先力和产品打通能力[6] * 依托母公司快手短视频平台的DAU/MAU优势,能更好洞察用户需求并推动技术迭代[2][6] **可灵AI所在的市场前景** * 全球视频制作市场规模约1,400亿美元,AI渗透率预计可达200-300亿美元,占比约1/5[2][7] * 长期来看,AI渗透率有望超过50%,重点渗透自媒体、广告营销、电商素材制作等领域[2][7] **快手主业的经营表现** * 2025年第三季度,快手直播业务收入近100亿元人民币,同比增长2.5%[2][8] * 广告业务收入超200亿元人民币,同比增长14%[2][8] * 电商业务收入近60亿元人民币,同比增长超40%[2][9] * 通过生成式强化学习出价模型及端到端推荐大模型,提升广告匹配效率和客户ROI,全站推广产品占内循环消耗比例提升至65%以上[4][9] **快手未来的增长预期** * 根据Bloomberg和Visible Alpha一致预期,到2026年,快手广告增速预计为15.5%,电商GMV增速预计为11.4%,均显著高于行业平均水平[9] 其他重要内容 * 可灵O1对标Google、NanoBanana Pro和Viola 3等多模态模型[4] * 在专业领域如电影电视剧方面,AI渗透节奏可能较慢[7] * 快手UAX自动解决方案渗透率持续提升[8]
爱诗科技发布实时视频生成模型 PixVerse R1
财经网· 2026-01-14 12:37
公司产品发布与技术突破 - 爱诗科技于1月4日正式发布通用实时世界模型PixVerse R1 [1] - PixVerse R1支持最高1080P分辨率,可实现即时响应,将视频生成从“静态输出、等待成片”推进至“实时交互、持续演化” [1] - 该模型是一种能够对画面、声音等内容进行实时生成和交互建模的人工智能系统,使数字场景能够持续演化并即时响应用户操作 [1] 核心产品能力与用户体验 - PixVerse R1的核心能力在于“实时交互”,视频画面会随着用户指令即时变化 [1] - 用户可以持续调整角色状态、环境变化和镜头走向,系统同步响应并保持画面、角色和场景演化逻辑的一致性 [1] - 视频内容能够连续生成而非反复重启,实现“所想即所见、所说即所现”的交互体验 [1] - 这一变化使AI视频从“生成结果”转变为“生成过程”,用户可像导演一样介入创作节奏 [1] 底层技术架构与优势 - PixVerse R1基于原生多模态基础模型、自回归流式生成机制和瞬时响应引擎构建 [2] - 相关机制使视频成为一条可持续生成、可随时调整的视觉流,而非由孤立片段拼接而成 [2] - 该框架系统性突破了长期困扰AI视频生成的画面突变、逻辑断裂和高延迟问题 [2] 公司背景与市场表现 - 爱诗科技成立于2023年,专注于AI视频生成大模型及应用研发 [2] - 公司海外产品PixVerse及国内产品“拍我AI”目前全球用户规模已超过1亿 [2] - 产品单月月活跃用户超过1600万 [2] - 产品被广泛应用于影视、广告、动漫及内容创作等场景 [2]
爱诗科技发布通用实时世界模型 PixVerse R1
北京商报· 2026-01-14 11:57
公司产品发布 - 爱诗科技于1月14日正式发布通用实时世界模型 PixVerse R1 [1] - 该模型支持最高1080P分辨率,可实现即时响应 [1] - 模型是一种能够对画面、声音等内容进行实时生成和交互建模的人工智能系统 [1] 产品技术特点 - 与传统AI视频生成需要等待数十秒甚至数分钟、一次性输出固定片段不同 [1] - PixVerse R1在生成过程中,视频画面会随着用户指令即时变化 [1] - 用户可以持续调整角色状态、环境变化和镜头走向,系统同步响应并保持画面、角色和场景演化逻辑的一致性 [1] - 实时互动视频生成是其主要应用之一 [1] 公司背景与市场 - 爱诗科技成立于2023年,专注于AI视频生成大模型及应用研发 [1] - 公司投资方包括阿里巴巴、巨人网络等 [1] - 公司海外产品PixVerse及国内产品“拍我AI”目前全球用户规模超1亿 [1]
爱诗科技发布全球首个实时视频生成模型,曾获马云史玉柱团队投资
搜狐财经· 2026-01-14 11:23
公司产品发布与技术突破 - 爱诗科技正式发布全球首个支持最高1080P分辨率的通用实时世界模型 PixVerse R1 [1] - 该模型实现了“实时交互、持续演化”,将视频生成从“静态输出、等待成片”推进至“实时交互、持续演化” [1] - 在生成过程中,视频画面会随着用户指令即时变化,用户可持续调整角色状态、环境变化和镜头走向,系统同步响应并保持一致性 [1] 产品核心能力与用户体验 - PixVerse R1 的核心能力在于“实时交互”,使视频内容能够连续生成而非反复重启,实现“所想即所见、所说即所现”的交互体验 [1] - 用户从“生成结果”的观看者转变为可介入创作节奏的“导演”,创意表达不再被“进度条”打断 [2] - 用户可以在极短时间内连续指示角色做出不同动作或姿态,变化会随着视频进展即时呈现 [2] 技术架构与行业意义 - 模型基于原生多模态基础模型、自回归流式生成机制和瞬时响应引擎构建,生成一条可持续生成、可随时调整的视觉流 [4] - 该框架系统性突破了长期困扰AI视频生成的画面突变、逻辑断裂和高延迟问题 [4] - 该成果标志着实时世界模型从研究探索走向可交互、可部署的产品级阶段 [4] - 实时视频生成技术正在消除内容创作与传播之间的技术隔阂,重塑用户与AI生成内容的互动方式 [4] 行业竞争格局与公司定位 - 全球排名前列的AI视频生成模型多由中国企业推出,相关产品在生成速度、使用成本和并发能力等方面表现突出 [4] - 中国企业在AI视频领域选择了一条不同于高算力、重渲染的技术路线,更强调工程化与系统级能力的突破 [5] - 这种路径使实时视频生成技术更容易走向规模化应用,是中国团队实现“从零到一”产品级突破的重要原因 [5] - 爱诗科技被业内视为OpenAI视频模型Sora的有力挑战者 [6] 应用前景与市场影响 - 实时生成能力有望在AI原生游戏、互动电影、生成式直播电商体验、互动娱乐、影视创作、教育培训、数字仿真等领域释放更大应用潜力 [5] - PixVerse R1开创了“正在发生的现在”的实时生成新纪元,叙事能实现“所想即所现” [5] - 创作与消费的边界逐渐模糊,视频消费者同时也是创作者,能够在观看的同时立即调整和生成新内容 [5] 公司背景与市场表现 - 爱诗科技成立于2023年,专注于AI视频生成大模型及应用研发 [6] - 公司海外产品PixVerse及国内产品“拍我AI”全球用户规模已超过1亿,单月月活跃用户超过1600万 [6] - 产品被广泛应用于影视、广告、动漫及内容创作等场景 [6] - 公司获得了阿里巴巴、巨人网络等企业的投资支持 [6]
AI视频赛道热度升温 Kling AI、万兴科技万兴天幕AI等受关注
中证网· 2026-01-08 21:20
行业趋势 - AI视频生成应用在海外市场的付费表现持续升温 [1] - AIGC音视频创作应用正成为新一代的创意生产力平台,被全球创作者所接受 [2] - “一键生成”功能大幅降低创作门槛 [1] 公司产品与能力 - 万兴科技基于大模型万兴天幕2.0推出万兴天幕AI,是音视频创作全链路赋能的代表 [1] - 万兴天幕AI提供视频、图片、音频生成能力,并支持生成60秒以上连贯视频 [1] - 用户使用万兴科技旗下模型生成5秒1080P视频片段的平均成本是业界最低之一 [1] - 万兴天幕2.0海外版ToMoviee 2.0 AI曾斩获VBench-2.0相关榜单全球前三,跻身全球第一梯队 [1] - 万兴天幕AI产品可与万兴科技旗下Wondershare Filmora、万兴喵影等产品形成强协同,生成素材可通过剪辑产品再创作,形成更具商业价值的视频成片 [2] 市场定位与生态 - Kling AI依托快手系的内容平台与流量营销生态,在平台闭环中快速兑现消费需求 [2] - 万兴天幕AI作为第三方创意工具,面向C端个人创作者和B端企业用户 [2]
小摩报告认为快手被低估:这是全球最便宜的AI股之一
智通财经· 2026-01-06 23:09
摩根大通看好快手科技的核心观点 - 摩根大通认为快手是全球最便宜的AI股之一,重申“增持”评级,目标价89港元,较当前股价有22%上行空间 [1][6] 可灵AI海外市场表现 - 可灵AI在2026年1月初移动平台日均收入较2025年12月激增102%,新推出的动作控制功能引发“宠物跳舞”创作热潮 [2] - 可灵AI在韩国市场表现尤为亮眼,2026年1月日均收入较2025年12月暴涨13倍,韩国市场占其过去3个月总收入的6% [2] - 截至2026年1月初,可灵AI已登顶韩国、土耳其等四个国家/地区的下载榜,跻身十个国家/地区下载榜前十 [2] - 过去90天内,美国、英国、韩国贡献了可灵AI 31%、9%、6%的收入,下载量主要来自印度(52%)、美国(8%)和韩国(6%) [2] - 2025年12月,可灵AI通过产品重大更新和促销活动,推动海外收入环比增长26% [2] 可灵AI增长前景与行业机遇 - 摩根大通预测,可灵AI 2025年四季度收入将实现环比增长,2026年全年收入有望同比大增62%至17亿元 [3] - AI视频生成是全球生成式AI的核心垂直领域,市场规模高达1400亿美元,短期内AI渗透率有望提升至20%-30% [3] - 可灵AI作为头部模型,在企业端(占总收入40%)和消费端均具备广阔变现空间 [2][3] - 可灵AI将于2026年1月7日在CES展召开发布会,后续模型升级或引发新一波热度 [3] 快手估值与核心业务增长驱动力 - 快手当前股价对应2026年预期市盈率仅12倍,而2026-2027年利润复合增长率预计达21%,估值性价比突出 [4] - AI技术是核心增长支柱,将主导2026年公司广告增长,特别是非电商广告(外循环广告)将保持强劲增长 [4] - 大型云服务商AI服务获客预算激增、AI生成漫剧等新娱乐形式兴起,为快手带来增量广告需求 [4] - 广告技术优化已在2025年三季度为广告收入带来4-5%的正向影响,2026年仍有进一步提升空间 [4] - 2026-2027年公司广告与电商佣金收入年复合增长率预计达13% [6] 公司盈利能力与资本支出 - 摩根大通预测,2026年快手调整后净利润将增长20%,净利润率同比提升1.4个百分点,预测利润较市场一致预期高出8% [5] - 公司将2025年资本支出指引从120亿元上调至140亿元(2024年为80亿元),主要用于可灵AI模型研发与广告技术升级 [5] - 资本支出增加对毛利率的影响约1%,AI相关投入对利润率的整体拖累幅度为1-2% [5] - 销售与营销费用率的优化(2025年预计同比下降2.6个百分点)将有效对冲上述投资压力 [5] - 收入结构向高利润率的广告、电商业务倾斜,将推动20261-2027年利润年复合增速达21% [6]
股市面面观|快手可灵AI引爆海外市场 2026年以来股价累计涨超18%
新华财经· 2026-01-06 17:45
公司股价与市场反应 - 2026年开年仅三个交易日,公司港股股价涨幅已超18% [1] - 股价上行的核心驱动力来自AI产品可灵在海外市场的强劲表现以及主业基本面的稳健预期 [1] 产品“可灵”表现与数据 - 可灵AI在韩国社交平台发起的“静态图片动起来”挑战赛,相关创意内容在三天内获得超过5亿次播放量 [2] - 2026年1月,可灵AI持续成为韩国、土耳其等四个国家下载量最高的应用,并在十个国家跻身前十 [3] - 美国市场贡献了可灵AI 46.1%的下载量,其次是泰国(4.6%)和墨西哥(3.4%) [3] - 2026年1月3日,可灵AI的单日流水是2025年12月均值的2.5倍,单月下载量突破50万次 [3] - 在韩国、新加坡等多个海外市场,可灵AI位列图形与设计类应用下载榜单第一 [2] - 可灵AI网页端80%以上的访问量来自海外 [2] 产品技术升级与功能 - 2025年12月推出全球首个全模态视频模型可灵O1及“音画同出”的模型可灵2.6版本 [2] - 可灵O1支持文本、图像、视频等多种指令在同一体系内完成编辑与生成 [3] - 可灵2.6版本能够一次生成中同步输出包含自然语言、动作音效及环境音的完整10秒视频,无需后期配音 [2] - 可灵2.6版本新增“Motion Control”(动态控制)功能,迅速在海外社交媒体走红 [2] - 推出数字人2.0以及主体库、对比模板等工具,强化了专业创作者与企业客户的可用性与稳定性 [3] 商业化进展与财务预测 - 2025年前三季度,可灵营收已超过7亿元人民币 [4] - 公司管理层上调可灵2025年全年收入预期至1.4亿美元(约合人民币10亿元),较年初6000万美元的目标增长超过一倍 [4] - 预计2026年全年,可灵收入将同比增长62%,达到17亿元人民币 [4] - 以可灵2.6模型为例,生成5秒视频收费50个灵感值,较旧版本价格提升,进一步打开了商业化空间 [5] - AI业务正加速重塑公司的增长路径,并成为市场重新定价公司的重要逻辑 [4] 行业市场与竞争格局 - 招银国际预计,到2027年,全球创意应用市场规模有望达到546亿美元,其中AI创意应用渗透率有望达到11% [1] - 2025年视频生成竞争格局较为集中,核心厂商中大多数为中国厂商 [6] - 中金公司研究部数据显示,2024年全球AI视频生成市场规模约6亿美元,中期测算P端与B端生产力工具合计市场规模有望达到百亿美元级别 [8] - 公司可灵当前市占率约20%,处于全球领先位置 [8] - 视频生成大模型行业从“技术验证期”迈入“商业化加速期” [1] 行业技术趋势与发展阶段 - 2025年视频生成大模型行业实现了对物理规律理解增强及音画同步能力成熟两大关键技术突破 [6] - 音视频大模型生成能力已逐渐进入专业影视级别,为AI真人类型视频内容创作提供了更大增长空间 [7] - 通用模型难以满足高要求场景,专业化微调将成为主流 [7] - “实时生成”将成为技术竞争新高地,低延迟、高一致性、可中断编辑的实时工作流将成为企业采购的关键考量 [7] - 视频生成属于“多能力叠加型”赛道,未来更可能呈现多强并存的市场结构 [8] - 在模型进步、算力成本下降、应用不断成熟的情况下,2026年有望迎来AI应用的投资元年 [8]
快手-W盘中涨近5% 可灵AI功能迭代带来商业化空间进一步提升
新浪财经· 2026-01-06 11:29
公司股价表现 - 快手-W(01024)盘中一度上涨近5%,延续前一日大涨超11%的强势表现[1] - 截至发稿时,公司股价上涨3.60%,报76.25港元,成交额达25.11亿港元[1] 产品功能与市场热度 - 公司旗下AI视频生成模型“可灵(Kling)”的“Motion Control”功能成为海外社交媒体热门趋势,用户基于此创作了大量具有传播潜力的视频内容[1] - 知名风投a16z的投资合伙人贾斯汀·摩尔(Justine Moore)将该功能称为“视频界的Nano Banana”,显示出行业的高度关注[1] 模型进展与性能 - 可灵AI模型于2025年12月推出了2.6版本,该版本能够实现单次生成完整的音视频内容[1] - 根据Similar Web数据,截至2025年12月底,可灵AI网站的全球访问量显著增长,并在12月底单日访问量超过了Minimax海螺、Runway与Midjourney等竞争对手[1] 商业化潜力 - 以生成5秒视频为例,公司旧版1.6模型“标准模式”收费20个灵感值,“高品质模式”收费35个灵感值[1] - 新版可灵2.6模型仅支持高品质模式,收费为50个灵感值,价格相比旧版高品质模式提升了约43%[1] - 模型能力的提升带动了定价上涨,进一步打开了公司的商业化空间[1]
快手-W再涨近5% 可灵“Motion Control”海外出圈 机构看好其商业化空间
智通财经· 2026-01-06 11:10
股价表现与市场反应 - 公司股价连续上涨,截至发稿涨4.76%,报77.1港元,成交额达23.31亿港元,前一日股价大涨超11% [1] 核心产品与技术创新 - 公司旗下AI视频生成模型“可灵(Kling)”推出的“Motion Control”功能成为海外社交媒体热门趋势,被a16z投资合伙人称为“视频界的Nano Banana” [1] - 可灵模型于2025年12月推出2.6版本,实现了单次生成完整音视频的能力 [1] 产品市场表现与竞争地位 - 根据Similar Web数据,截至2025年12月底,可灵AI网站全球访问量显著增长,并在12月底单日访问量超过Minimax海螺、Runway与Midjourney等竞争对手 [1] 商业化进展与定价策略 - 以可灵2.6模型为例,生成5秒视频仅支持高品质模式,收费50个灵感值,而公司1.6模型的“标准模式”和“高品质模式”分别收费20和35个灵感值 [1] - 新一代模型价格提升,进一步打开了商业化空间 [1]