AI视频生成
搜索文档
这个真人版《火影忍者》竟然是AI做的,来自中国AI视频新王者Vidu Q3
量子位· 2026-01-30 19:02
生数科技Vidu Q3模型的核心能力 - 模型是全球首个支持一次性生成16秒音视频直出的AI视频生成模型 [2] - 模型在操作上具备“全自动”特性,支持中文、英文和日文等多种语言输入 [3] - 模型在权威AI基准测试机构Artificial Analysis的榜单中排名中国第一,全球第二 [5] - 模型的核心技术特点包括:音视频一次性生成、自由运镜和转场、支持文生和图生、生成清晰度支持1080P并可提升至4K、具备完整的叙事能力和精准的文字渲染 [6] Vidu Q3模型的具体功能与实测表现 - 图生视频功能允许用户上传首帧图片并输入提示词,可生成1至16秒的视频 [8][10] - 实测中,模型能根据单张图片和提示词生成如“主播连麦对话”等场景视频,效果逼真,并能自动识别场景补充细节(如弹幕) [11][12][13][14] - 模型能准确演绎不同情绪和场景的短剧,如愤怒的综艺导师点评、苦情的古装戏,并能自动补充风声、抽泣声等环境音效和动作音效 [16][17][18][19] - 模型具备在单段视频内完成一次性转场和换镜头的能力,并能自行补充符合场景的细节(如背景闪电、仰视角度) [20][21] - 文生音视频功能支持仅用自然语言生成视频,时长1-16秒,并提供16:9、9:16、1:1、4:3、3:4五种宽高比选择 [23][24] - 通过文生视频测试,模型能精准遵循复杂的分镜提示词,生成如3D皮克斯风格、国产修仙动漫等不同风格的连贯动画片段 [25][26][27] - 模型的文字渲染能力出色,能直接在画面中生成并渲染出如“Vidu”字样等复杂图形文字,利于一次性成片,减少后期加工 [29][30][31] AI视频生成行业的发展与趋势 - AI视频生成技术进化速度极快,从Sora引爆视觉震撼到业界实现有声视频直出,仅用了不到9个月,相较于电影史上从默片到有声电影用了32年,呈现历史性压缩 [34][35] - 行业竞争维度已从早期聚焦画面物理一致性、光影质感,升维至“音视频原生的多模态融合”,标志着AI从单纯生成画面进化到了理解声音与画面时序关联的“导戏”阶段 [36][37][38] - Vidu Q3的出现代表了技术能力的延伸,其16秒一镜到底的能力让AI具备了完整的短片叙事雏形,当音视频对齐和多语言表达不再困难时,行业的下一个突破点可能更快到来 [39][40] - 开年第一个月,国产AI视频生成领域的竞争非常激烈 [1]
快手:可灵AI创意生产力平台落地,持续领跑全球视频生成大模型赛道
经济观察网· 2026-01-30 12:31
公司AI战略与技术布局 - 公司以技术创新为核心驱动力,深耕人工智能领域研发,聚焦“AI赋能创意”核心方向 [1] - 公司组建专业大模型团队,通过自研大模型与场景化应用深度融合,打造覆盖视频、图像生成的全链路创意工具 [1] - 截至2025年8月,公司已自研或联合高校发表CCF-A类顶级论文70余篇,相关成果在计算机视觉领域累计被引超30000次,开源项目在GitHub斩获逾15000星标 [1] 可灵AI平台技术突破 - 平台通过四大技术维度创新解决AI视频生成领域动态效果生硬、风格一致性差、复杂指令响应不足等痛点 [2] - 在模型设计上,采用类Sora的DiT结构,以Transformer替代传统U-Net架构,并创新研发计算高效的3D Attention全注意力机制作为时空建模模块 [2] - 在数据保障层面,构建精细化标签体系筛选训练数据,研发专用视频描述模型生成结构化文本,以提升文本指令响应准确度 [2] - 在计算效率上,采用传输路径更短的flow模型作为扩散模型基座,在保证生成质量的同时提升运算速度 [2] - 在能力扩展方面,支持直接处理不同长宽比数据,研发自回归视频时序拓展方案,并可接入相机运镜、帧率等多类控制输入 [2] 可灵AI平台市场表现与成就 - 自2024年6月上线以来,该平台在全球赛道持续领跑 [2] - 2025年3月,其高品质模式以1000分的ELO评分登顶全球图生视频赛道 [2] - 2025年5月,新一代模型以1124分蝉联榜首 [2] - 2025年10月,全新Turbo模型上线10天内,便以1329分和1252分的成绩同时夺得图生视频与文生视频双赛道榜首 [2] 平台价值与未来展望 - 平台通过便捷操作与专业参数组合,显著降低了创意生产门槛 [3] - 其技术突破以“自研大模型+场景化应用”的模式,为行业提供了技术创新、用户价值与产业赋能的完整范式 [3] - 未来,公司将持续迭代模型能力,围绕更长时长、更高分辨率、更多交互形式的创意需求,深化“AI+内容”融合创新 [3] - 公司旨在为全球创作者提供更强大的生产力工具,为AI生成式技术的产业化发展注入新动能,持续巩固在视频生成大模型领域的全球领先地位 [3]
昆仑万维开源的SkyReels-V3,把马斯克请来带货了
机器之心· 2026-01-29 18:26
AI虚拟网红与视频生成行业现状 - AI生成的虚拟网红在社交平台上已获得广泛关注,手握品牌合作并坐拥百万粉丝,许多用户并未意识到其并非真人,依然进行互动、点赞和消费[1] - 有行业观点认为虚拟网红时代已经到来[2] SkyReels-V3模型开源事件与核心能力 - 昆仑万维旗下Skywork AI团队于1月29日宣布开源SkyReels-V3多模态视频生成模型系列[3] - 该模型系列在单一建模架构中集成了三大核心能力:参考图像转视频、视频延长和音频驱动虚拟形象,达到业界领先水平[3] - 模型完全开源,旨在让任何有想法的创作者都能快速搭建自己的虚拟IP,甚至批量生产内容矩阵[9] 参考图像转视频功能详解 - 功能允许用户上传1-4张参考图像,配合文本提示词,生成时间连贯、语义一致的视频,并精准保留身份特征与空间构图[11] - 在电商场景测试中,上传马斯克照片和小象玩偶图,能生成面部特征高度一致、动作自然流畅、商品展示角度恰当的视频[12][15] - 上传手袋商品图和模特照,能生成模特在都市夜景中展示产品细节的视频,人物动作优雅,构图专业[17][19] - 模型能同时处理多张不同参考图,精准还原人物特征并保证风格统一,例如生成《怪奇物语》演员在上海外滩自拍的互动视频[20][22][23][24] 视频延长功能详解 - 功能可将输入视频片段延伸为更长内容,保持运动动态、场景结构和视觉风格一致性,支持单镜头延长和镜头切换延长两种模式[26] - 单镜头延长模式下,能处理如“女孩笑着笑着突然严肃起来”的微表情过渡,保持面部特征、光影效果和视觉风格不走样[27][29] - 镜头切换延长模式支持切入、切出、多角度、正反打、切离五种专业转场,能理解如“Close-up”等专业摄影术语,增强画面张力[31][32] 虚拟形象模型功能详解 - 功能可从单张肖像图和音频片段生成音视频同步的视频,支持分钟级长度和多角色交互[34] - 基础单角色测试中,上传肖像照配音乐片段,能生成唇形与音频完全同步的唱歌MV,并保持画面稳定[35] - 模型泛化能力出色,能处理真实人物、卡通角色等不同风格[36] - 在多人物互动场景测试中,能自动识别图片形象,精准控制每个角色的开口时机,避免口型不同步的问题[37][38] SkyReels-V3核心技术解读 - 参考图像转视频功能建立在三层技术创新之上:数据构建层面从海量高质量视频中筛选动态素材并采用跨帧配对策略;利用图像编辑模型避免“复制粘贴”伪影;采用统一的多参考条件策略,支持最多4张参考图像的灵活组合[41][42] - 训练策略采用图像-视频混合训练方案,通过多分辨率联合优化提升对不同空间尺度和宽高比的鲁棒性[43] - 在涵盖电影电视、电商、广告等场景的200对混合测试集上,模型在参考一致性和视觉质量方面均处于国内领先位置[44] - 视频延长模块核心创新在于双模式延长机制设计,并开发了专门的镜头切换检测器自动分析转场类型[45] - 技术实现采用统一的多分段位置编码方案支持复杂运动建模,并通过分层混合训练实现平滑镜头切换[45] - 该模块支持480p和720p分辨率,单镜头延长可调节5至30秒长度,并支持多种宽高比[46] - 虚拟形象模型采用音视频精准对齐和关键帧约束生成机制,通过区域掩码建模实现语音与面部运动的对应关系[47][48] - 整体架构采用模块化设计,三大功能模块可独立使用或灵活组合,并通过企业级数据处理管线确保质量稳定[49] - 推理端融合了蒸馏、量化及算子优化等技术,打造出低延迟、高吞吐的推理引擎[49] - 训练效率方面采用了极致的显存与计算优化方案,支撑高分辨率长视频的千卡级稳定高效训练[50] 昆仑万维的技术积累与行业竞争 - SkyReels-V3的开源反映了AI视频生成领域的竞争态势,国内团队通过开源策略快速建立生态、获取反馈、迭代优化[51][52] - 昆仑万维在视频生成领域有长期技术积累:2025年2月开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1及SOTA级别表情动作可控算法SkyReels-A1;4月发布全球首个使用扩散强迫框架的无限时长电影生成模型SkyReels-V2;随后推出可控视频生成框架SkyReels-A2和任意时长全模态音频驱动数字人创作模型SkyReels-A3[53] - 迭代速度和技术深度显著[54] - 昆仑天工自研了包括语言大模型、多模态大模型、SWE代码大模型、Agent大模型、视频大模型、3D大模型、音乐大模型、音频大模型在内的8大模型矩阵,并持续开源几十个模型,在多个国际评测中取得开源最优成绩[54] - 视频模型是连接文本、图像、音频等多模态能力的关键节点[55] - 此次开源预示着AI视频生成的竞争正在进入更激烈的阶段,技术壁垒逐渐被打破[56]
万物皆可参考是种什么体验?Vidu Q2参考生Pro:特效、演技、细节全都要
机器之心· 2026-01-28 12:59
AI视频生成行业技术跃迁 - 行业在短短两年内从生成“抽象鬼畜”内容进化到“惟妙惟肖”的真智能水准,实现了翻天覆地的技术跃迁 [2] - 行业竞争焦点正从解决“有没有”转向追求“精不精”,站在追求“可控性”的关键转折点 [2] Vidu Q2参考生Pro产品发布与定位 - 公司于近期正式发布Vidu Q2参考生Pro,其全新Slogan“视频参考,创想无限”标志着对AI视频生产流的底层重构 [3] - 该产品是全球首个“万物可参考”的视频模型,将参考模态从静态图像扩展至动态视频与多维元素 [3][4] - 产品在短短数月内完成了从“生成”到“编辑”的闭环,其“视频参考”功能重新定义了AI的“模仿”与“创造” [3][4] 核心功能亮点:视频参考 - 功能极大丰富了参考类型,涵盖人物、场景、特效、表情、动作、材质纹理等 [4] - 能同时处理多段视频素材,实现百万级电影特效、细腻微表情、复杂流体纹理的一键迁移 [4] - 能精准拿捏细微情绪,让演技自然可信,让特效落地生根 [4] 核心功能亮点:视频编辑 - 支持对视频内元素的精准增、删、改、减,如改变人物站位、调整画幅、更换背景、美颜美发及复合编辑 [5] - 得益于支持2个视频加4张图片的多模态高并发输入能力,即便多次复合编辑,视频核心元素与画面一致性依然稳定 [5] - 让视频编辑告别了不可预测的“抽卡”模式 [5] 技术能力实测:复刻演技与特效 - 能完美复刻《X战警》魔形女的变身过程,实现“百万特效一键白嫖”,将传统需耗时数周、高成本的工业级特效制作边际成本压缩至几近归零 [17] - 能高精度复刻张曼玉在《甜蜜蜜》中的经典哭戏,眉眼间的情绪流转相当传神,实现了高精度的神态捕捉与生成 [22] - 支持多视频参考,能同时结合沈腾的动作与怪盗基德的服饰元素,生成效果丝滑,手部动作完美复刻,镜片高光、遮挡关系及服饰光影处理严丝合缝 [27] - 技术展现了惊人的“表演-特效”同步率,能同时驾驭高难度流体形变与读懂情绪代码 [27] 技术能力实测:材质纹理迁移 - 参考生视频中的材质纹理迁移意味着AI开始习得“质感语言”,理解光线在不同材质上的折射与粗糙度影响,使视频从“看起来像”进化到“感觉是真的” [29] - 能将普通杯子瞬间“烧制”成青花瓷,釉面反光与杯身曲面严丝合缝,毫无“贴图感” [30] - 能切换整体风格,如瞬间变为粘土风 [32] - 基于静态照片生成视频时,能精准构建画面的3D空间关系,完美还原环境并保持毛绒质感稳定 [36] - 在修改物体(如将碗换色)时,AI真正理解了物体的3D结构和光影关系,实现了物理层面的重构而非简单滤镜叠加 [37] 技术能力实测:精准视频编辑 - 视频编辑功能能精准修改细节,如完美删除指定物体(绿色餐具)并在指定位置添加新元素(蓝色碗中放苹果) [38] - 在官方演示中,能完美抹去手机并“脑补”出被遮挡的手指细节和掌纹,类似将Photoshop的“内容识别填充”应用于视频 [41] - 尽管在极度复杂画面下偶有瑕疵,但相比过去的崩溃体验,可用性已实现从0到1的质变 [41] 行业影响与产业应用前景 - 技术的生产力跃迁意味着影视创作将告别“唯预算论”的旧时代,工业级特效不再是昂贵的奢侈品,创作者的想象力成为衡量作品价值的唯一天花板 [17] - 高精度神态生成能力可极大拓展制作流程想象空间,降低短剧市场创意可视化门槛,让好故事不再受限于初期制作条件简陋 [22] - 在影视制作前期,可升级为更直观的Previz(预演)工具,让导演在开机前看到带有情绪色彩的动态分镜 [22] - 在动漫领域,该技术或能成为传统转描工艺的智能化升级,将真人表演韵律转化为特定画风动画,助力跨次元创作高效落地 [22] - 对于创作者而言,技术意味着能同时驱动虚拟角色的皮囊与灵魂,实现“一人就是一支特效剧组”,跳过繁琐后期 [28] - 精准的编辑能力为创作者直接省掉了无数次“重新抽卡”的垃圾时间 [42] 行业发展趋势总结 - AI视频生成正从一场凭运气拆盲盒的“概率游戏”走向“颗粒度掌控”,技术从“野蛮生长”走向精细化 [43] - AI视频的下半场,竞争焦点不是运气,而是控制力,这代表着创作自由的回归 [44]
太平洋证券:可灵MAU创新高 AI助推漫剧高速发展
智通财经网· 2026-01-26 16:27
快手可灵AI用户与收入表现 - 2026年1月,快手可灵AI的月活跃用户突破1200万 [1] - 截至2026年1月20日,其月付费用户环比增长350% [1] - 2025年12月单月收入超2000万美元,2026年1月日均收入环比增长约30% [1] 快手可灵AI增长驱动因素 - 模型能力提升:2025年12月发布了全球首个统一多模态视频模型可灵o1及具备音画同步生成能力的可灵2.6 [2] - 功能创新引发关注:可灵2.6上线动作控制功能,通过上传参考图即可生成人物复刻动作的视频 [2] - 市场表现优异:2026年初,该应用在巴西、俄罗斯等近40个国家和地区的iOS绘图与设计类下载榜位列第一,并成为韩国和俄罗斯iOS端同类应用收入最高者 [2] 漫剧市场前景与AI应用 - 预计2026年漫剧市场规模有望突破220亿元,将贡献短剧行业50%的增量 [3] - 2025年6月至12月,抖音端内漫剧用户规模趋势复合增速达12%,播放量趋势复合增速达24% [3] - 在漫剧制作中,AI在创意、内容制作、剪辑运营环节的应用比例分别为10%-30%、50%-80%、20%-80% [3] - AI应用带来了超70%的降本,超80%的提效,并使生产环节缩短三分之一 [1][3] AI视频内容生成趋势与投资关注 - 快手可灵AI的表现表明国内AI视频模型能力已跻身全球前沿,商业化价值持续兑现 [4] - 2D动画漫部均播放量可达表情包动态漫的3倍,AI仿真人剧部均播放量增速最快、峰值最高,反映出AI生成内容已获观众认可 [3][4] - 随着AI视频生成技术持续迭代及广泛落地,漫剧、短剧等视频内容有望迎来AI规模化生产的新阶段 [1][4] - 建议关注标的包括博纳影业等 [1]
2026年TikTok免费AI视频网站选型指南:从功能适配到效率落地的5款工具深度解析
搜狐财经· 2026-01-25 03:36
行业趋势与核心痛点 - 2026年,AI视频工具已成为跨境商家的核心生产力工具,而不再是尝鲜玩具[1] - 行业普遍痛点在于手动制作内容效率低下,无法跟上平台流量迭代速度,而许多免费AI工具存在免费额度有限、功能不贴合TikTok场景或无法解决带货痛点等问题[1] - 选择免费工具的核心标准在于其能否将AI融入工作流以真正提升带货效率,而非单纯关注免费额度多少[1] 免费AI视频工具选择标准 - 首要标准是“真免费”,即免费额度需能覆盖深度体验,例如能生成3条以上视频,而非仅注册送1条的尝鲜[2] - 功能需具备“TikTok专属”优化,针对带货逻辑设计,如爆款脚本复刻、口播真实感、数字人讲解,而非通用视频生成[2] - 工具应具备“长期价值”,通过用户留存率体现,免费是入门券,能帮助商家赚钱的工具才值得长期投入[3] 重点工具分析:爆款猎人 (CreatOK.ai) - 该工具由服务中国出海商家3年的EchoTik团队打造,核心团队有小米电商背景,于2025年10月上线后成为跨境圈生产力黑马[4] - 其核心功能高度适配TikTok带货场景,包括:输入爆款视频链接可一键复刻生成完整视频;根据商品信息智能创作符合平台用户喜好的口播脚本;提供支持7×24小时多语种、多音色的AI数字人播报以解决达人成本问题;并接入OpenAI新一代视频模型Sora2,生成画面真人感强,能准确呈现金属光泽、布料纹理等细节[5] - 上线3个月,用户平均生成视频量从1条增长至5条,付费转化率比肩成熟产品,表明商家将其作为工作流工具深度使用[5] - 免费权益包括注册送6积分和3个免费视频生成额度,积分可兑换素材扩展等功能,还可获得一对一带货场景指导[5] - 真实案例显示,某饰品商家在2025年12月使用其生成的圣诞帽带货视频,在TikTok上获得超过4900美元GMV、160个订单和9.1万播放量,带货效果比人工剪辑视频高3倍[6] 其他免费工具概览 - **快剪AI**:定位入门级工具,主打快速生成,支持图片或文案转视频,拥有10万+ TikTok热门模板素材库,生成一条15秒视频仅需1分钟,注册送5条免费额度,适合新手测试基础功能[7][8][9] - **抖创小助手**:聚焦跨境电商,提供女装、厨具、家具等10+品类的专属素材库,支持素材拼接与AI生成,适合需要精准场景的商家,注册送4条免费额度[10] - **易视生成**:作为多平台适配的全能工具,支持TikTok、Instagram、YouTube,具备一键转码和全球化素材库功能,适合跨平台运营的商家,注册送3条免费额度[11] - **轻创AI**:侧重脚本优化,支持上传脚本并由AI进行优化以增强吸引力,生成的视频会匹配优化后的脚本调整画面,适合有脚本但不知如何拍摄的商家,注册送3条免费额度[12] 工具价值评估与选择建议 - 真正有价值的免费工具评判标准在于其能否帮助用户将免费额度转化为商品交易总额,例如通过测试爆款复刻、数字人讲解等核心带货功能来验证盈利潜力[13] - 功能不贴合TikTok场景的工具,即使提供更多免费额度,生成的视频也可能缺乏流量和转化,最终导致时间浪费[14] - 对于TikTok卖家,建议从具备已验证流量逻辑功能(如爆款复刻)、能解决成本问题(如数字人)并提升视频真实感(如Sora2技术)的工具开始尝试,这些功能直接影响带货效果[15] - 选择工具的核心理念是让AI为工作服务,而非为AI工具本身耗费精力,免费仅是入门途径,能帮助赚钱的工具才值得长期投入[16][17]
快手20260122
2026-01-23 23:35
涉及的行业与公司 * 行业:AI视频生成应用、短视频/内容平台、互联网科技 * 公司:快手(Kuaishou)及其AI视频产品“可能”(Kling)[1] 核心观点与论据 **1 公司战略与市场定位** * 公司是进攻性明确的标的,出海战略明确,在日韩及东南亚投流动作频繁[2][3] * 利用国内人力成本优势和技术同步发展,在算法和用户体验方面领先[2][7] * 与谷歌View、OpenAI Solo等面向大型电影公司的高价服务形成差异化,通过优化影像级生成质量和合理定价,在全球范围内具有显著竞争优势[3][8] **2 财务表现与估值** * 公司市值约3,000亿人民币(440亿美元)[2][5] * 主业接近盈亏平衡,预计2025和2026年经调整净利润分别为206亿和237亿人民币[2][6] * 港股互联网公司估值偏低,公司主营业务稳健,向下有保底,向上弹性可期[2][6] * 竞争对手Minimax市值160亿美元(1,100亿人民币),其AI视频产品“海螺”2025年前三季度收入不到2000万美元[5] * 公司AI视频产品“可能”2025年12月月收入突破2000万美元,对应年度经常性收入(ARR)为2.4亿美元[2][5] * 若2026年“可能”全年收入达25亿人民币,公司估值弹性将进一步提升[2][5] **3 AI产品与技术进展** * AI视频产品“可能”的收入已超过竞争对手Minimax的“海螺”[2] * 发布的新模型如O one和2.6模型在动作控制功能上取得显著进展[2][3] * “可能”2.5倍模型在视频和图生视频领域均排名前三[2][7] * 产品擅长影像级生成及真实世界摄影风格,技术性和一致性控制表现出色[7][9] * 2025年第三季度和第四季度,AI对广告业务的赋能对收入贡献约4%至5%[13] **4 市场前景与潜力** * AI视频生成市场空间广阔,预计可达1,000-2,000亿美元[3][11] * 测算方法一(自上而下):2025年全球视频多媒体收入预计2,200亿美元,假设AI渗透率10%,技术溢价率1.2,则AI视频市场规模约250亿美元[3][11] * 测算方法二(自下而上):将用户分为B端企业、C端创作者、专业机构,中性情况下总市场空间约221亿美元[11] * To C端内容生成平台有望凭借用户规模效应和场景延伸,实现指数级增长[3][12] * 2026年可能是AI应用行情长期可持续发展的拐点[3] 其他重要内容 * 市场对公司在AI应用领域的表现和前景存在一定分歧,尽管2026年1月初以来股价在十几天内上涨了25%,但市场整体重视程度仍显不足[3] * 国内竞争对手包括德艺、艾斯科科技、微度及阿里的通义万象等[7] * 公司线上宣传优势、海外用户积累为其后续发展提供基础[3][9] * 未来若资金风险偏好提升以及数据拐点出现,将进一步推动公司估值上升[6]
猜想谁是26年“易中天”系列之快手
格隆汇· 2026-01-23 19:11
文章核心观点 - 在AI重塑内容生产的时代,短视频平台的长期价值取决于其降低内容生产成本、提升商业化效率和构建稳定现金流的能力,而快手因其在内容社区、AI视频生成工具“可灵”的商业化进展以及稳健的财务表现,展现出与2025年AI算力基础设施核心资产“易中天”(新易盛、中际旭创、天孚通信)相似的结构性特征,即第二增长曲线清晰但兑现节奏偏慢、产业链位置带来议价能力、以效率提升为主线、估值切换源于确定性提升,因此可能成为2026年的核心资产 [1][2][3] 组织与战略取向 - 公司在组织与战略上保持克制与长期主义,未围绕AI进行激进的组织重构,而是将AI能力嵌入既有业务体系,以业务需求牵引技术投入,避免了资源分散与战略摇摆,为AI持续迭代与商业化落地提供了更高的确定性 [4][5] 基本盘分析 - 公司的核心基本盘和坚固护城河是其内容社区生态,在下沉市场、熟人关系链与高互动内容领域形成差异化优势,更强调情感连接与信任关系,这使得平台在直播、电商等场景具备更高转化效率与更低用户流失率,是穿越周期的重要支撑 [10] - 在AI时代,内容生产成本下降不必然提升内容价值,决定商业化能力的关键在于内容能否被信任、分享和反复消费,而这正是公司长期积累的核心优势 [10] AI视频生成 - AI视频生成模型“可灵”是公司最重要的结构性变量,其2.6版本实现了音视频同步生成,在动作一致性等关键指标上进入全球领先梯队,并迅速与商业化策略协同,通过会员限时促销活动有效拉动用户充值意愿,推动流水快速放量,完成了从“技术可行”到“用户愿意付费”的关键跨越 [14] - “可灵”在海外市场显现爆款效应,以“小狗跳舞”等AI特效为代表的内容在韩国、土耳其、哈萨克斯坦等多个国家持续位列免费应用总榜第一,其轻娱乐、低门槛特性具备跨文化传播能力 [15] - 根据Sensor Tower数据,自12月中旬起,“可灵”流水环比显著攀升,截至2026年1月3日,单日流水已达到12月中旬平均日流水的2.5倍,增长伴随用户规模与使用频率提升同步发生,显示出付费模型的可持续性 [15] - “可灵”通过“Motion Control”等互动玩法在海外社交媒体引发用户自发分享与二次传播,形成了用户自驱式扩散,降低了获客成本并提升了留存效率 [16] - 预计“可灵”2025年收入将突破1.4亿美元,展望2026年,随着版本迭代、功能拓展及B端应用场景落地,其收入规模与应用深度仍具扩展空间 [16] 广告业务 - AI正在成为公司提升广告变现效率的核心工具,第三季度,OneRec推荐系统已为广告收入贡献约4–5%的正向增量,随着OneRec-Think等能力持续优化,广告在用户匹配、素材生成与转化预测方面的效率有望进一步提升 [18] - 公司广告业务的修复逻辑更多来自投资回报率(ROI)改善,而非单纯依赖流量增长,AI的作用在于系统性提升单位流量价值,内容消费与本地生活线索广告仍是外循环广告增长的重要支点 [18] 电商与直播 - 直播业务此前受攻击事件对基本面影响有限,随着安全体系与风控能力持续加强,其长期健康度有望进一步提升 [19] - 电商业务GMV增速有望持续领先行业平均水平,达人抽佣机制与商品结构优化为货币化率提升提供了现实基础,内容与交易的高度融合使公司在电商领域保持差异化竞争力 [20] - 直播与电商这些成熟业务为公司AI投入与新产品孵化提供了稳定的现金流支撑 [21] 财务特征与估值 - 预计公司2025年净利润为206亿元人民币,2026年为238亿元人民币,同比增长16%和15%,对应市盈率约14倍与12倍 [22] - 在AI带来新增收入弹性的同时,公司估值仍处于相对合理区间,这种“稳态盈利 + 技术增量”的组合,对于长期资金而言具备较好的风险回报比 [23]
猜想谁是26年“易中天”系列之快手
格隆汇APP· 2026-01-23 18:09
文章核心观点 - 文章认为,在AI重塑内容生产的时代,短视频平台的价值逻辑正从流量扩张转向降本增效与商业化效率提升,这与2025年A股市场“易中天”(新易盛、中际旭创、天孚通信)的投资逻辑相似[5] - 快手因其AI视频生成能力、稳固的内容社区基本盘及克制的战略,正呈现出与“易中天”相似的结构性特征,其第二增长曲线(AI视频生成)清晰但尚未被完全定价,有望成为2026年的核心资产[11][46][49] 入选核心资产的逻辑与“易中天”特征 - **核心逻辑转变**:行业增长从依赖流量、用户时长和补贴,转向依赖降低内容生产成本、提升商业化效率和构建稳定现金流的能力[5] - **“易中天”共同特征**: - 第二增长曲线清晰但兑现节奏偏慢,AI算力需求伴随资本开支和技术代际逐步释放[6][7] - 深度嵌入全球AI基础设施,需求来自头部客户,产业链位置带来议价能力[8] - 发展主线是降本增效(如更高速率、更高良率),而非粗放式扩张[9] - 估值重估源于订单、客户结构与现金流等确定性提升,而非情绪催化[10] 快手与“易中天”逻辑的相似性 - **AI视频生成带来生产效率跃迁**:快手的AI视频生成工具“可灵”降低内容生产与商业化成本,其长期积累的社区关系与信任成为AI时代稀缺的数据与分发土壤[11] - **平台定位类似基础设施**:快手不追求最快增长,而是作为内容生态的“基础设施提供者”,在降低创作者成本、提升商业转化效率和稳定现金流之间寻找平衡,与光模块降低算力互联成本的逻辑一致[11] - **估值阶段相似**:快手处于第二增长曲线(AI对内容供给和商业化效率的影响)被看到但尚未完全被定价的阶段[11] 组织与战略取向 - **克制扩张与长期主义**:公司未围绕AI进行激进组织重构,而是将AI能力嵌入既有业务体系,技术演进(如OneRec、可灵)始终服务于提升内容生态与商业化效率的长期目标[15] - **业务需求牵引技术投入**:此方式避免了资源分散与战略摇摆,使公司在行业波动中保持执行稳定性,为AI迭代与商业化落地提供更高确定性[16][17] 基本盘分析:内容社区护城河 - **差异化优势**:在下沉市场、熟人关系链与高互动内容领域形成优势,更强调内容与用户间的情感连接与信任关系[22] - **高转化与防御属性**:社区属性使平台在直播、电商等场景具备更高转化效率和更低用户流失率,是穿越周期的重要支撑[22] - **AI时代的价值核心**:内容生产成本下降不必然提升内容价值,商业化能力取决于内容是否被信任、分享和反复消费,这正是快手的核心优势[22] AI视频生成:可灵成为结构性变量 - **核心功能升级与商业化加速**:2025年12月初推出可灵2.6版本,实现音视频同步生成并达到全球领先水平,配合会员促销活动有效拉动用户付费意愿[27][28] - **海外爆款验证全球化潜力**:以“小狗跳舞”等特效为代表的内容在韩国、土耳其、哈萨克斯坦等多国应用总榜位列第一,轻娱乐、低门槛内容具备跨文化传播能力[29] - **流水增长清晰且可持续**:根据Sensor Tower数据,截至2026年1月3日,可灵单日流水已达到12月中旬平均日流水的2.5倍,增长伴随用户规模与使用频率提升[30][31] - **社交传播降低获客成本**:“Motion Control”等互动玩法在海外社交媒体引发用户自发分享与二次传播,形成自然拉新[33][34] - **收入前景广阔**:预计可灵2025年收入将突破1.4亿美元,2026年随着版本迭代、功能拓展及B端应用落地,收入规模与深度仍有扩展空间[35] 广告业务 - **AI提升变现效率**:第三季度,OneRec系统已为广告收入贡献约4–5%的正向增量,OneRec-Think等能力有望进一步提升广告匹配、素材生成与转化预测效率[37] - **修复逻辑来自ROI改善**:广告增长不依赖流量,而是通过AI系统性提升单位流量价值,内容消费与本地生活线索广告是外循环广告增长的重要支点[37] 电商与直播业务 - **直播业务健康度提升**:此前平台受攻击事件对基本面影响有限,随着安全体系与风控能力加强,长期健康度有望进一步提升[40] - **电商保持差异化竞争力**:GMV增速有望持续领先行业,达人抽佣机制与商品结构优化为货币化率提升提供基础,内容与交易高度融合[41] - **成熟业务提供现金流支撑**:电商与直播等稳态业务为AI投入与新产品孵化提供稳定现金流[42] 财务与估值 - **盈利预测**:预计公司2025年净利润为206亿元人民币,2026年为238亿元人民币,同比增长分别为16%和15%[44] - **估值水平**:对应2025/2026年市盈率约14倍与12倍,在AI带来收入弹性的同时,估值处于相对合理区间,“稳态盈利+技术增量”组合具备较好风险回报比[44][45] 短期、中期与长期展望 - **短期**:可灵商业化加速带来收入弹性[47] - **中期**:广告与电商业务在AI赋能下提升效率[47] - **长期**:AI视频生成将持续放大快手内容生态与社区关系的价值,公司正成为不断降低内容生产成本、提升商业转化效率的内容基础设施[47][48]
Sora的对手来了?我们实测了字节新品”随变” | 模力工场
AI前线· 2026-01-23 17:18
字节跳动推出AI视频生成应用“随变” - 字节跳动于2026年初上线AI视频生成应用“随变”,旨在AI视频生成领域打造类似“抖音”的产品,与OpenAI的Sora形成竞争[4][5] 产品定位与核心功能 - “随变”应用界面设计与抖音相似,但功能简化,主要保留“创作”和“合拍”两个核心入口[7] - 用户使用前需创建专属的AI数字形象作为其在应用内的数字分身[7] - 创作功能支持生成图片、动图和视频,内置多种流行风格模板,如蓝调摄影滤镜、渐变色光影、粘土风、治愈日漫风等,功能上与“剪映”存在重叠[11] - “合拍”功能允许用户的AI形象与经典角色(如企鹅、蒙娜丽莎)互动,组成CP,并提供了预设的提示词模板[13] - 当前生成视频的方式较为固定,仅支持“已有模板图+预设提示词”的图生视频模式,不支持完全自由的文本生成或混合多种元素[14] 横向测评:能力维度对比 - 测评将“随变”与Sora、Oiioii在动作流畅性与合理性、指令执行完整度、微表情与情绪刻画、场景与世界观构建、细节逻辑与准确性、生成时间等维度进行对比[21][22] - 动作流畅性与合理性:“随变”表现较弱(★ ★ ☆ ☆ ☆),场景切换生硬,缺乏动作过渡;Sora表现最强(★★★★★),物理逻辑自然;Oiioii基础流畅但细节逻辑易出错(★ ★ ★ ☆ ☆)[22] - 指令执行完整度:“随变”仅能执行部分指令,常简化处理(★ ★ ☆ ☆ ☆);Sora能较好理解并执行复杂指令(★★★★☆);Oiioii能执行大部分指令但细节有偏差(★ ★ ★ ☆ ☆)[22] - 微表情与情绪刻画:“随变”是核心优势,表现非常到位,有“人味”(★★★★★);Sora和Oiioii相对机械,精细度一般(★★★☆☆)[22] - 场景与世界观构建:“随变”场景切换较生硬(★ ★ ☆ ☆ ☆);Sora真实感强,物理合理(★★★★☆);Oiioii是核心优势,场景宏大,镜头语言丰富(★★★★★)[22] - 细节逻辑与准确性:“随变”在简化中能保持基础合理(★ ★ ★ ☆ ☆);Sora和Oiioii均表现较高,一致性较好(★★★★☆)[22] - 生成时间:“随变”生成速度极快,约10-15秒(★★★★★);Sora稳定偏慢,约2-3分钟(★★★☆☆);Oiioii提供两档模式,快速生成极快(约1分钟内),故事短片模式则很慢[22] 各产品综合评估 - “随变”被定位为“情感渲染大师”,优势在于人物微表情与情绪递进表现惊艳,10秒级生成速度重新定义用户预期,契合短视频消费节奏,且零门槛无缝上手,完全继承抖音交互逻辑[23][25] - “随变”的劣势在于多指令执行完整度不够,牺牲了复杂动作合理性与场景连贯性,难以支撑复杂叙事和长片创作,工具属性大于创作平台属性[23] - Sora被定位为专业创作的“预可视化引擎”,优势在于动作流畅性、物体运动轨迹和物理合理性上具有断层式领先,能较好理解并执行包含多步骤、场景转换的长文本指令,输出视频的稳定性、一致性和电影感画质处于行业第一梯队[25] - Sora的劣势在于情感表达略“机械感”,微表情不够细腻,生成耗时较长,无法满足即时分享的冲动,且存在使用门槛[25] - Oiioii被定位为创意快速落地的“快剪导演”,优势在于生成宏大场景、氛围渲染和镜头语言上颇具想象力,能快速搭建出“故事感”画面,独创“快速生成”与“故事短片”双模式,结合分镜编辑与自动音频生成,适合快速脑暴、概念可视化[24][26] - Oiioii的劣势在于细节逻辑有误,在物体互动、手部细节、空间关系上频繁出现明显错误,且生成质量不稳定,复杂视频生成速度慢,质量波动较大[26][28] 总结与适用场景 - “随变”在生成速度与情绪表达上表现突出,适用于需要快速产出情感化短视频的场景[29] - Sora在复杂指令执行与物理模拟方面保持优势,适合对逻辑性与完成度要求较高的创作[29] - Oiioii通过分镜编辑等功能降低了完整短片制作门槛,为创意可视化提供了可行路径[29] - 对于抖音的资深用户,若希望体验AI视频生成的即时效果与社交玩法,“随变”是一个不错的选择[29]