AI视频生成
搜索文档
万物皆可参考是种什么体验?Vidu Q2参考生Pro:特效、演技、细节全都要
机器之心· 2026-01-28 12:59
AI视频生成行业技术跃迁 - 行业在短短两年内从生成“抽象鬼畜”内容进化到“惟妙惟肖”的真智能水准,实现了翻天覆地的技术跃迁 [2] - 行业竞争焦点正从解决“有没有”转向追求“精不精”,站在追求“可控性”的关键转折点 [2] Vidu Q2参考生Pro产品发布与定位 - 公司于近期正式发布Vidu Q2参考生Pro,其全新Slogan“视频参考,创想无限”标志着对AI视频生产流的底层重构 [3] - 该产品是全球首个“万物可参考”的视频模型,将参考模态从静态图像扩展至动态视频与多维元素 [3][4] - 产品在短短数月内完成了从“生成”到“编辑”的闭环,其“视频参考”功能重新定义了AI的“模仿”与“创造” [3][4] 核心功能亮点:视频参考 - 功能极大丰富了参考类型,涵盖人物、场景、特效、表情、动作、材质纹理等 [4] - 能同时处理多段视频素材,实现百万级电影特效、细腻微表情、复杂流体纹理的一键迁移 [4] - 能精准拿捏细微情绪,让演技自然可信,让特效落地生根 [4] 核心功能亮点:视频编辑 - 支持对视频内元素的精准增、删、改、减,如改变人物站位、调整画幅、更换背景、美颜美发及复合编辑 [5] - 得益于支持2个视频加4张图片的多模态高并发输入能力,即便多次复合编辑,视频核心元素与画面一致性依然稳定 [5] - 让视频编辑告别了不可预测的“抽卡”模式 [5] 技术能力实测:复刻演技与特效 - 能完美复刻《X战警》魔形女的变身过程,实现“百万特效一键白嫖”,将传统需耗时数周、高成本的工业级特效制作边际成本压缩至几近归零 [17] - 能高精度复刻张曼玉在《甜蜜蜜》中的经典哭戏,眉眼间的情绪流转相当传神,实现了高精度的神态捕捉与生成 [22] - 支持多视频参考,能同时结合沈腾的动作与怪盗基德的服饰元素,生成效果丝滑,手部动作完美复刻,镜片高光、遮挡关系及服饰光影处理严丝合缝 [27] - 技术展现了惊人的“表演-特效”同步率,能同时驾驭高难度流体形变与读懂情绪代码 [27] 技术能力实测:材质纹理迁移 - 参考生视频中的材质纹理迁移意味着AI开始习得“质感语言”,理解光线在不同材质上的折射与粗糙度影响,使视频从“看起来像”进化到“感觉是真的” [29] - 能将普通杯子瞬间“烧制”成青花瓷,釉面反光与杯身曲面严丝合缝,毫无“贴图感” [30] - 能切换整体风格,如瞬间变为粘土风 [32] - 基于静态照片生成视频时,能精准构建画面的3D空间关系,完美还原环境并保持毛绒质感稳定 [36] - 在修改物体(如将碗换色)时,AI真正理解了物体的3D结构和光影关系,实现了物理层面的重构而非简单滤镜叠加 [37] 技术能力实测:精准视频编辑 - 视频编辑功能能精准修改细节,如完美删除指定物体(绿色餐具)并在指定位置添加新元素(蓝色碗中放苹果) [38] - 在官方演示中,能完美抹去手机并“脑补”出被遮挡的手指细节和掌纹,类似将Photoshop的“内容识别填充”应用于视频 [41] - 尽管在极度复杂画面下偶有瑕疵,但相比过去的崩溃体验,可用性已实现从0到1的质变 [41] 行业影响与产业应用前景 - 技术的生产力跃迁意味着影视创作将告别“唯预算论”的旧时代,工业级特效不再是昂贵的奢侈品,创作者的想象力成为衡量作品价值的唯一天花板 [17] - 高精度神态生成能力可极大拓展制作流程想象空间,降低短剧市场创意可视化门槛,让好故事不再受限于初期制作条件简陋 [22] - 在影视制作前期,可升级为更直观的Previz(预演)工具,让导演在开机前看到带有情绪色彩的动态分镜 [22] - 在动漫领域,该技术或能成为传统转描工艺的智能化升级,将真人表演韵律转化为特定画风动画,助力跨次元创作高效落地 [22] - 对于创作者而言,技术意味着能同时驱动虚拟角色的皮囊与灵魂,实现“一人就是一支特效剧组”,跳过繁琐后期 [28] - 精准的编辑能力为创作者直接省掉了无数次“重新抽卡”的垃圾时间 [42] 行业发展趋势总结 - AI视频生成正从一场凭运气拆盲盒的“概率游戏”走向“颗粒度掌控”,技术从“野蛮生长”走向精细化 [43] - AI视频的下半场,竞争焦点不是运气,而是控制力,这代表着创作自由的回归 [44]
太平洋证券:可灵MAU创新高 AI助推漫剧高速发展
智通财经网· 2026-01-26 16:27
快手可灵AI用户与收入表现 - 2026年1月,快手可灵AI的月活跃用户突破1200万 [1] - 截至2026年1月20日,其月付费用户环比增长350% [1] - 2025年12月单月收入超2000万美元,2026年1月日均收入环比增长约30% [1] 快手可灵AI增长驱动因素 - 模型能力提升:2025年12月发布了全球首个统一多模态视频模型可灵o1及具备音画同步生成能力的可灵2.6 [2] - 功能创新引发关注:可灵2.6上线动作控制功能,通过上传参考图即可生成人物复刻动作的视频 [2] - 市场表现优异:2026年初,该应用在巴西、俄罗斯等近40个国家和地区的iOS绘图与设计类下载榜位列第一,并成为韩国和俄罗斯iOS端同类应用收入最高者 [2] 漫剧市场前景与AI应用 - 预计2026年漫剧市场规模有望突破220亿元,将贡献短剧行业50%的增量 [3] - 2025年6月至12月,抖音端内漫剧用户规模趋势复合增速达12%,播放量趋势复合增速达24% [3] - 在漫剧制作中,AI在创意、内容制作、剪辑运营环节的应用比例分别为10%-30%、50%-80%、20%-80% [3] - AI应用带来了超70%的降本,超80%的提效,并使生产环节缩短三分之一 [1][3] AI视频内容生成趋势与投资关注 - 快手可灵AI的表现表明国内AI视频模型能力已跻身全球前沿,商业化价值持续兑现 [4] - 2D动画漫部均播放量可达表情包动态漫的3倍,AI仿真人剧部均播放量增速最快、峰值最高,反映出AI生成内容已获观众认可 [3][4] - 随着AI视频生成技术持续迭代及广泛落地,漫剧、短剧等视频内容有望迎来AI规模化生产的新阶段 [1][4] - 建议关注标的包括博纳影业等 [1]
2026年TikTok免费AI视频网站选型指南:从功能适配到效率落地的5款工具深度解析
搜狐财经· 2026-01-25 03:36
行业趋势与核心痛点 - 2026年,AI视频工具已成为跨境商家的核心生产力工具,而不再是尝鲜玩具[1] - 行业普遍痛点在于手动制作内容效率低下,无法跟上平台流量迭代速度,而许多免费AI工具存在免费额度有限、功能不贴合TikTok场景或无法解决带货痛点等问题[1] - 选择免费工具的核心标准在于其能否将AI融入工作流以真正提升带货效率,而非单纯关注免费额度多少[1] 免费AI视频工具选择标准 - 首要标准是“真免费”,即免费额度需能覆盖深度体验,例如能生成3条以上视频,而非仅注册送1条的尝鲜[2] - 功能需具备“TikTok专属”优化,针对带货逻辑设计,如爆款脚本复刻、口播真实感、数字人讲解,而非通用视频生成[2] - 工具应具备“长期价值”,通过用户留存率体现,免费是入门券,能帮助商家赚钱的工具才值得长期投入[3] 重点工具分析:爆款猎人 (CreatOK.ai) - 该工具由服务中国出海商家3年的EchoTik团队打造,核心团队有小米电商背景,于2025年10月上线后成为跨境圈生产力黑马[4] - 其核心功能高度适配TikTok带货场景,包括:输入爆款视频链接可一键复刻生成完整视频;根据商品信息智能创作符合平台用户喜好的口播脚本;提供支持7×24小时多语种、多音色的AI数字人播报以解决达人成本问题;并接入OpenAI新一代视频模型Sora2,生成画面真人感强,能准确呈现金属光泽、布料纹理等细节[5] - 上线3个月,用户平均生成视频量从1条增长至5条,付费转化率比肩成熟产品,表明商家将其作为工作流工具深度使用[5] - 免费权益包括注册送6积分和3个免费视频生成额度,积分可兑换素材扩展等功能,还可获得一对一带货场景指导[5] - 真实案例显示,某饰品商家在2025年12月使用其生成的圣诞帽带货视频,在TikTok上获得超过4900美元GMV、160个订单和9.1万播放量,带货效果比人工剪辑视频高3倍[6] 其他免费工具概览 - **快剪AI**:定位入门级工具,主打快速生成,支持图片或文案转视频,拥有10万+ TikTok热门模板素材库,生成一条15秒视频仅需1分钟,注册送5条免费额度,适合新手测试基础功能[7][8][9] - **抖创小助手**:聚焦跨境电商,提供女装、厨具、家具等10+品类的专属素材库,支持素材拼接与AI生成,适合需要精准场景的商家,注册送4条免费额度[10] - **易视生成**:作为多平台适配的全能工具,支持TikTok、Instagram、YouTube,具备一键转码和全球化素材库功能,适合跨平台运营的商家,注册送3条免费额度[11] - **轻创AI**:侧重脚本优化,支持上传脚本并由AI进行优化以增强吸引力,生成的视频会匹配优化后的脚本调整画面,适合有脚本但不知如何拍摄的商家,注册送3条免费额度[12] 工具价值评估与选择建议 - 真正有价值的免费工具评判标准在于其能否帮助用户将免费额度转化为商品交易总额,例如通过测试爆款复刻、数字人讲解等核心带货功能来验证盈利潜力[13] - 功能不贴合TikTok场景的工具,即使提供更多免费额度,生成的视频也可能缺乏流量和转化,最终导致时间浪费[14] - 对于TikTok卖家,建议从具备已验证流量逻辑功能(如爆款复刻)、能解决成本问题(如数字人)并提升视频真实感(如Sora2技术)的工具开始尝试,这些功能直接影响带货效果[15] - 选择工具的核心理念是让AI为工作服务,而非为AI工具本身耗费精力,免费仅是入门途径,能帮助赚钱的工具才值得长期投入[16][17]
快手20260122
2026-01-23 23:35
涉及的行业与公司 * 行业:AI视频生成应用、短视频/内容平台、互联网科技 * 公司:快手(Kuaishou)及其AI视频产品“可能”(Kling)[1] 核心观点与论据 **1 公司战略与市场定位** * 公司是进攻性明确的标的,出海战略明确,在日韩及东南亚投流动作频繁[2][3] * 利用国内人力成本优势和技术同步发展,在算法和用户体验方面领先[2][7] * 与谷歌View、OpenAI Solo等面向大型电影公司的高价服务形成差异化,通过优化影像级生成质量和合理定价,在全球范围内具有显著竞争优势[3][8] **2 财务表现与估值** * 公司市值约3,000亿人民币(440亿美元)[2][5] * 主业接近盈亏平衡,预计2025和2026年经调整净利润分别为206亿和237亿人民币[2][6] * 港股互联网公司估值偏低,公司主营业务稳健,向下有保底,向上弹性可期[2][6] * 竞争对手Minimax市值160亿美元(1,100亿人民币),其AI视频产品“海螺”2025年前三季度收入不到2000万美元[5] * 公司AI视频产品“可能”2025年12月月收入突破2000万美元,对应年度经常性收入(ARR)为2.4亿美元[2][5] * 若2026年“可能”全年收入达25亿人民币,公司估值弹性将进一步提升[2][5] **3 AI产品与技术进展** * AI视频产品“可能”的收入已超过竞争对手Minimax的“海螺”[2] * 发布的新模型如O one和2.6模型在动作控制功能上取得显著进展[2][3] * “可能”2.5倍模型在视频和图生视频领域均排名前三[2][7] * 产品擅长影像级生成及真实世界摄影风格,技术性和一致性控制表现出色[7][9] * 2025年第三季度和第四季度,AI对广告业务的赋能对收入贡献约4%至5%[13] **4 市场前景与潜力** * AI视频生成市场空间广阔,预计可达1,000-2,000亿美元[3][11] * 测算方法一(自上而下):2025年全球视频多媒体收入预计2,200亿美元,假设AI渗透率10%,技术溢价率1.2,则AI视频市场规模约250亿美元[3][11] * 测算方法二(自下而上):将用户分为B端企业、C端创作者、专业机构,中性情况下总市场空间约221亿美元[11] * To C端内容生成平台有望凭借用户规模效应和场景延伸,实现指数级增长[3][12] * 2026年可能是AI应用行情长期可持续发展的拐点[3] 其他重要内容 * 市场对公司在AI应用领域的表现和前景存在一定分歧,尽管2026年1月初以来股价在十几天内上涨了25%,但市场整体重视程度仍显不足[3] * 国内竞争对手包括德艺、艾斯科科技、微度及阿里的通义万象等[7] * 公司线上宣传优势、海外用户积累为其后续发展提供基础[3][9] * 未来若资金风险偏好提升以及数据拐点出现,将进一步推动公司估值上升[6]
猜想谁是26年“易中天”系列之快手
格隆汇· 2026-01-23 19:11
文章核心观点 - 在AI重塑内容生产的时代,短视频平台的长期价值取决于其降低内容生产成本、提升商业化效率和构建稳定现金流的能力,而快手因其在内容社区、AI视频生成工具“可灵”的商业化进展以及稳健的财务表现,展现出与2025年AI算力基础设施核心资产“易中天”(新易盛、中际旭创、天孚通信)相似的结构性特征,即第二增长曲线清晰但兑现节奏偏慢、产业链位置带来议价能力、以效率提升为主线、估值切换源于确定性提升,因此可能成为2026年的核心资产 [1][2][3] 组织与战略取向 - 公司在组织与战略上保持克制与长期主义,未围绕AI进行激进的组织重构,而是将AI能力嵌入既有业务体系,以业务需求牵引技术投入,避免了资源分散与战略摇摆,为AI持续迭代与商业化落地提供了更高的确定性 [4][5] 基本盘分析 - 公司的核心基本盘和坚固护城河是其内容社区生态,在下沉市场、熟人关系链与高互动内容领域形成差异化优势,更强调情感连接与信任关系,这使得平台在直播、电商等场景具备更高转化效率与更低用户流失率,是穿越周期的重要支撑 [10] - 在AI时代,内容生产成本下降不必然提升内容价值,决定商业化能力的关键在于内容能否被信任、分享和反复消费,而这正是公司长期积累的核心优势 [10] AI视频生成 - AI视频生成模型“可灵”是公司最重要的结构性变量,其2.6版本实现了音视频同步生成,在动作一致性等关键指标上进入全球领先梯队,并迅速与商业化策略协同,通过会员限时促销活动有效拉动用户充值意愿,推动流水快速放量,完成了从“技术可行”到“用户愿意付费”的关键跨越 [14] - “可灵”在海外市场显现爆款效应,以“小狗跳舞”等AI特效为代表的内容在韩国、土耳其、哈萨克斯坦等多个国家持续位列免费应用总榜第一,其轻娱乐、低门槛特性具备跨文化传播能力 [15] - 根据Sensor Tower数据,自12月中旬起,“可灵”流水环比显著攀升,截至2026年1月3日,单日流水已达到12月中旬平均日流水的2.5倍,增长伴随用户规模与使用频率提升同步发生,显示出付费模型的可持续性 [15] - “可灵”通过“Motion Control”等互动玩法在海外社交媒体引发用户自发分享与二次传播,形成了用户自驱式扩散,降低了获客成本并提升了留存效率 [16] - 预计“可灵”2025年收入将突破1.4亿美元,展望2026年,随着版本迭代、功能拓展及B端应用场景落地,其收入规模与应用深度仍具扩展空间 [16] 广告业务 - AI正在成为公司提升广告变现效率的核心工具,第三季度,OneRec推荐系统已为广告收入贡献约4–5%的正向增量,随着OneRec-Think等能力持续优化,广告在用户匹配、素材生成与转化预测方面的效率有望进一步提升 [18] - 公司广告业务的修复逻辑更多来自投资回报率(ROI)改善,而非单纯依赖流量增长,AI的作用在于系统性提升单位流量价值,内容消费与本地生活线索广告仍是外循环广告增长的重要支点 [18] 电商与直播 - 直播业务此前受攻击事件对基本面影响有限,随着安全体系与风控能力持续加强,其长期健康度有望进一步提升 [19] - 电商业务GMV增速有望持续领先行业平均水平,达人抽佣机制与商品结构优化为货币化率提升提供了现实基础,内容与交易的高度融合使公司在电商领域保持差异化竞争力 [20] - 直播与电商这些成熟业务为公司AI投入与新产品孵化提供了稳定的现金流支撑 [21] 财务特征与估值 - 预计公司2025年净利润为206亿元人民币,2026年为238亿元人民币,同比增长16%和15%,对应市盈率约14倍与12倍 [22] - 在AI带来新增收入弹性的同时,公司估值仍处于相对合理区间,这种“稳态盈利 + 技术增量”的组合,对于长期资金而言具备较好的风险回报比 [23]
猜想谁是26年“易中天”系列之快手
格隆汇APP· 2026-01-23 18:09
文章核心观点 - 文章认为,在AI重塑内容生产的时代,短视频平台的价值逻辑正从流量扩张转向降本增效与商业化效率提升,这与2025年A股市场“易中天”(新易盛、中际旭创、天孚通信)的投资逻辑相似[5] - 快手因其AI视频生成能力、稳固的内容社区基本盘及克制的战略,正呈现出与“易中天”相似的结构性特征,其第二增长曲线(AI视频生成)清晰但尚未被完全定价,有望成为2026年的核心资产[11][46][49] 入选核心资产的逻辑与“易中天”特征 - **核心逻辑转变**:行业增长从依赖流量、用户时长和补贴,转向依赖降低内容生产成本、提升商业化效率和构建稳定现金流的能力[5] - **“易中天”共同特征**: - 第二增长曲线清晰但兑现节奏偏慢,AI算力需求伴随资本开支和技术代际逐步释放[6][7] - 深度嵌入全球AI基础设施,需求来自头部客户,产业链位置带来议价能力[8] - 发展主线是降本增效(如更高速率、更高良率),而非粗放式扩张[9] - 估值重估源于订单、客户结构与现金流等确定性提升,而非情绪催化[10] 快手与“易中天”逻辑的相似性 - **AI视频生成带来生产效率跃迁**:快手的AI视频生成工具“可灵”降低内容生产与商业化成本,其长期积累的社区关系与信任成为AI时代稀缺的数据与分发土壤[11] - **平台定位类似基础设施**:快手不追求最快增长,而是作为内容生态的“基础设施提供者”,在降低创作者成本、提升商业转化效率和稳定现金流之间寻找平衡,与光模块降低算力互联成本的逻辑一致[11] - **估值阶段相似**:快手处于第二增长曲线(AI对内容供给和商业化效率的影响)被看到但尚未完全被定价的阶段[11] 组织与战略取向 - **克制扩张与长期主义**:公司未围绕AI进行激进组织重构,而是将AI能力嵌入既有业务体系,技术演进(如OneRec、可灵)始终服务于提升内容生态与商业化效率的长期目标[15] - **业务需求牵引技术投入**:此方式避免了资源分散与战略摇摆,使公司在行业波动中保持执行稳定性,为AI迭代与商业化落地提供更高确定性[16][17] 基本盘分析:内容社区护城河 - **差异化优势**:在下沉市场、熟人关系链与高互动内容领域形成优势,更强调内容与用户间的情感连接与信任关系[22] - **高转化与防御属性**:社区属性使平台在直播、电商等场景具备更高转化效率和更低用户流失率,是穿越周期的重要支撑[22] - **AI时代的价值核心**:内容生产成本下降不必然提升内容价值,商业化能力取决于内容是否被信任、分享和反复消费,这正是快手的核心优势[22] AI视频生成:可灵成为结构性变量 - **核心功能升级与商业化加速**:2025年12月初推出可灵2.6版本,实现音视频同步生成并达到全球领先水平,配合会员促销活动有效拉动用户付费意愿[27][28] - **海外爆款验证全球化潜力**:以“小狗跳舞”等特效为代表的内容在韩国、土耳其、哈萨克斯坦等多国应用总榜位列第一,轻娱乐、低门槛内容具备跨文化传播能力[29] - **流水增长清晰且可持续**:根据Sensor Tower数据,截至2026年1月3日,可灵单日流水已达到12月中旬平均日流水的2.5倍,增长伴随用户规模与使用频率提升[30][31] - **社交传播降低获客成本**:“Motion Control”等互动玩法在海外社交媒体引发用户自发分享与二次传播,形成自然拉新[33][34] - **收入前景广阔**:预计可灵2025年收入将突破1.4亿美元,2026年随着版本迭代、功能拓展及B端应用落地,收入规模与深度仍有扩展空间[35] 广告业务 - **AI提升变现效率**:第三季度,OneRec系统已为广告收入贡献约4–5%的正向增量,OneRec-Think等能力有望进一步提升广告匹配、素材生成与转化预测效率[37] - **修复逻辑来自ROI改善**:广告增长不依赖流量,而是通过AI系统性提升单位流量价值,内容消费与本地生活线索广告是外循环广告增长的重要支点[37] 电商与直播业务 - **直播业务健康度提升**:此前平台受攻击事件对基本面影响有限,随着安全体系与风控能力加强,长期健康度有望进一步提升[40] - **电商保持差异化竞争力**:GMV增速有望持续领先行业,达人抽佣机制与商品结构优化为货币化率提升提供基础,内容与交易高度融合[41] - **成熟业务提供现金流支撑**:电商与直播等稳态业务为AI投入与新产品孵化提供稳定现金流[42] 财务与估值 - **盈利预测**:预计公司2025年净利润为206亿元人民币,2026年为238亿元人民币,同比增长分别为16%和15%[44] - **估值水平**:对应2025/2026年市盈率约14倍与12倍,在AI带来收入弹性的同时,估值处于相对合理区间,“稳态盈利+技术增量”组合具备较好风险回报比[44][45] 短期、中期与长期展望 - **短期**:可灵商业化加速带来收入弹性[47] - **中期**:广告与电商业务在AI赋能下提升效率[47] - **长期**:AI视频生成将持续放大快手内容生态与社区关系的价值,公司正成为不断降低内容生产成本、提升商业转化效率的内容基础设施[47][48]
Sora的对手来了?我们实测了字节新品”随变” | 模力工场
AI前线· 2026-01-23 17:18
字节跳动推出AI视频生成应用“随变” - 字节跳动于2026年初上线AI视频生成应用“随变”,旨在AI视频生成领域打造类似“抖音”的产品,与OpenAI的Sora形成竞争[4][5] 产品定位与核心功能 - “随变”应用界面设计与抖音相似,但功能简化,主要保留“创作”和“合拍”两个核心入口[7] - 用户使用前需创建专属的AI数字形象作为其在应用内的数字分身[7] - 创作功能支持生成图片、动图和视频,内置多种流行风格模板,如蓝调摄影滤镜、渐变色光影、粘土风、治愈日漫风等,功能上与“剪映”存在重叠[11] - “合拍”功能允许用户的AI形象与经典角色(如企鹅、蒙娜丽莎)互动,组成CP,并提供了预设的提示词模板[13] - 当前生成视频的方式较为固定,仅支持“已有模板图+预设提示词”的图生视频模式,不支持完全自由的文本生成或混合多种元素[14] 横向测评:能力维度对比 - 测评将“随变”与Sora、Oiioii在动作流畅性与合理性、指令执行完整度、微表情与情绪刻画、场景与世界观构建、细节逻辑与准确性、生成时间等维度进行对比[21][22] - 动作流畅性与合理性:“随变”表现较弱(★ ★ ☆ ☆ ☆),场景切换生硬,缺乏动作过渡;Sora表现最强(★★★★★),物理逻辑自然;Oiioii基础流畅但细节逻辑易出错(★ ★ ★ ☆ ☆)[22] - 指令执行完整度:“随变”仅能执行部分指令,常简化处理(★ ★ ☆ ☆ ☆);Sora能较好理解并执行复杂指令(★★★★☆);Oiioii能执行大部分指令但细节有偏差(★ ★ ★ ☆ ☆)[22] - 微表情与情绪刻画:“随变”是核心优势,表现非常到位,有“人味”(★★★★★);Sora和Oiioii相对机械,精细度一般(★★★☆☆)[22] - 场景与世界观构建:“随变”场景切换较生硬(★ ★ ☆ ☆ ☆);Sora真实感强,物理合理(★★★★☆);Oiioii是核心优势,场景宏大,镜头语言丰富(★★★★★)[22] - 细节逻辑与准确性:“随变”在简化中能保持基础合理(★ ★ ★ ☆ ☆);Sora和Oiioii均表现较高,一致性较好(★★★★☆)[22] - 生成时间:“随变”生成速度极快,约10-15秒(★★★★★);Sora稳定偏慢,约2-3分钟(★★★☆☆);Oiioii提供两档模式,快速生成极快(约1分钟内),故事短片模式则很慢[22] 各产品综合评估 - “随变”被定位为“情感渲染大师”,优势在于人物微表情与情绪递进表现惊艳,10秒级生成速度重新定义用户预期,契合短视频消费节奏,且零门槛无缝上手,完全继承抖音交互逻辑[23][25] - “随变”的劣势在于多指令执行完整度不够,牺牲了复杂动作合理性与场景连贯性,难以支撑复杂叙事和长片创作,工具属性大于创作平台属性[23] - Sora被定位为专业创作的“预可视化引擎”,优势在于动作流畅性、物体运动轨迹和物理合理性上具有断层式领先,能较好理解并执行包含多步骤、场景转换的长文本指令,输出视频的稳定性、一致性和电影感画质处于行业第一梯队[25] - Sora的劣势在于情感表达略“机械感”,微表情不够细腻,生成耗时较长,无法满足即时分享的冲动,且存在使用门槛[25] - Oiioii被定位为创意快速落地的“快剪导演”,优势在于生成宏大场景、氛围渲染和镜头语言上颇具想象力,能快速搭建出“故事感”画面,独创“快速生成”与“故事短片”双模式,结合分镜编辑与自动音频生成,适合快速脑暴、概念可视化[24][26] - Oiioii的劣势在于细节逻辑有误,在物体互动、手部细节、空间关系上频繁出现明显错误,且生成质量不稳定,复杂视频生成速度慢,质量波动较大[26][28] 总结与适用场景 - “随变”在生成速度与情绪表达上表现突出,适用于需要快速产出情感化短视频的场景[29] - Sora在复杂指令执行与物理模拟方面保持优势,适合对逻辑性与完成度要求较高的创作[29] - Oiioii通过分镜编辑等功能降低了完整短片制作门槛,为创意可视化提供了可行路径[29] - 对于抖音的资深用户,若希望体验AI视频生成的即时效果与社交玩法,“随变”是一个不错的选择[29]
千亿豪赌!OpenAI领衔,视频生成上演巨头“终局之战”
搜狐财经· 2026-01-21 11:17
SORA模型的技术原理与局限性 - SORA模型的核心思想是对视频进行高度抽象和压缩,将其映射到一个抽象空间,类似于高级皮影戏,使用来自真实世界的抽象基本视频元素拼接成完整视频,使其“打眼一看”具有真实感 [3][25][48][71] - 该技术与真正“理解物理世界”并基于此仿真虚拟世界仍有不小距离,差距被比喻为手机拍视频与电影制作之间的距离 [3][25][48][71] - 现有AI缺乏对物理世界的理解,甚至无法产生“加速度”概念,因此无法生成物理意义上精确的运动轨迹,更无法处理复杂粒子模型 [7][30][53][76] - 以目前已知技术思路,AI绝对不可能产生与实拍电影完全对等的效果,不仅无法取代实拍电影,连取代动画电影也绝无可能 [7][30][53][76] 公众认知与AI能力现实的差距 - 外行普遍误解在于,看到AI能完成人类看来很难的事(如处理法律文件、智能驾驶),便认为其更能完成人类看来简单的事(如炒菜、端茶送水) [8][31][54][77] - 本质在于计算机擅长处理信息量大但规则简单的事务,而人类擅长处理信息量不大但潜在规则复杂的事务,当前AI并未突破这一点 [8][31][54][77] - 以“端茶送水”为例,其涉及多自由度关节精准控制、水面平衡实时观测、环境预警、运动轨迹规划等,对计算机程序的复杂度远超登月任务 [9][32][55][78] AI视频技术的实际应用与市场炒作 - AI视频生成技术(如SORA)最重大的实际影响可能在于股市,普通人对技术的理解与现实存在巨大差距,这创造了炒股空间 [11][25][34][48][57][71][80] - 在美国以股市为主导的环境下,企业更倾向于推出能激发公众无穷想象力的“颠覆性”技术,通过反复炒作(散户盲目上车后割肉离场)让庄家赚得盆满钵满,技术本身是否有用反而不重要 [11][34][57][80] - 对于AI视频技术,大部分行业难以想出具体应用场景,例如直播带货用AI虚拟主播替代真人主播,其可行性与意义存疑 [11][34][57][80] 务实与炒作两种AI发展路径对比 - 另一条发展路径是从客户实际需求出发,解决具体行业问题(如用AI加速气象云图分析、从雷达波干扰中识别隐形飞机),此类应用商业模式清晰,客户会实际付费 [13][36][59][82] - 但此类专业应用因公众不懂而缺乏炒作话题,不适合股市炒作,例如宣布将某项预测速度提高10倍难以引发公众兴趣 [13][36][59][82] - 以华为为例,其专注于商业模式清晰、客户按月付费的生意(如智能驾驶),不依赖吹嘘和炒作散户,其AI大模型(如盘古)渗透于千千万万具体行业以提升生产效率,大部分应用不为外行所知 [13][15][36][38][59][61][82][84] - 华为不上市,通过发行企业债融资,其一年所交税款超过许多上市公司的市值 [13][36][59][82] OpenAI与华为的商业模式与技术路线差异 - 抛开资本市场融资,单从客户赚钱角度看,OpenAI缺乏正经赚大钱的业务,其主要现金流来自股市炒作而非常规业务,这决定了其研发面向推出所谓的“划时代”技术以服务炒作 [15][38][61][84] - 真正的“AI时代”应由像华为盘古大模型那样,渗透到具体行业并与企业联合开发以提高生产效率的路径带来,而非以让散户激情四射为目的的研发 [17][40][63][86] - OpenAI不断推出刺激公众的产品(聊天、画画、视频),导致受众“敏感度”越来越低,未来若转向务实但不够刺激的行业应用(如AI控制金属探伤仪用于桥梁监测),将难以满足被吊高的公众预期 [18][41][64][87] - OpenAI目前提供的“想象空间”越大,其日后务实落地的空间反而可能越小,这类似于依赖不断寻找更刺激药物的成瘾模式 [20][43][66][89] 中美AI发展轨道与资本环境差异 - 中美AI发展轨道不同,基本不做对方的事情,若以实现通用AI比喻为攀登珠穆朗玛峰,中国主流思路(如华为)是进行基础体能训练(跑步、撸铁),而美国则相当于在小山坡表演攀岩并宣称“遥遥领先” [20][43][66][89] - 在美国以资本市场和“外行领导内行”的体制下,资本偏好能引发公众狂热的话题(如教授与幼女解方程),迫使科学家和研发资源服务于炒作,而非真正有重大价值的产品 [22][45][68][91] - 这种环境导致像OpenAI这样的公司,其科学家虽有操守和梦想,但在资本压力下,研发方向不得不面向股市炒作 [22][45][68][91]
快手20260115
2026-01-16 10:53
纪要涉及的行业或公司 * 公司:快手及其旗下AI业务“可灵AI”[1] * 行业:AI多模态生成工具、短视频平台、在线广告、直播电商[1] 核心观点与论据 **可灵AI的商业化表现与潜力** * 可灵非中国区2025年12月流水接近50万美元,2026年1月首周流水接近100万美元,环比增长近200%,显示巨大商业化潜力[2] * 2025年12月,可灵的年化经常性收入(ARR,SaaS)达到2.4亿美元,商业化能力突出[3] * 产品迭代(如O1发布)显著提升了流水增速,同时优化生成成本,降低价格,扩大了用户群体[2][4][5] **可灵AI的产品与技术进展** * 2025年12月1日发布首个大一统多模态创作工具“可灵O1”,整合文字、视频、图片、主体等多模态输入[2][4] * 推出音画同步功能,大大减少了人工编辑量[4] * 自2025年8月起,高级副总裁盖坤兼任可灵AI技术负责人,理顺技术职责,促进产品与技术结合,推动了OE版本迭代和降价策略[4][10] **可灵AI的竞争优势** * 聚焦于用AI产生视频内容的核心愿景,资源集中[6] * 具备强大的技术领先力和产品打通能力[6] * 依托母公司快手短视频平台的DAU/MAU优势,能更好洞察用户需求并推动技术迭代[2][6] **可灵AI所在的市场前景** * 全球视频制作市场规模约1,400亿美元,AI渗透率预计可达200-300亿美元,占比约1/5[2][7] * 长期来看,AI渗透率有望超过50%,重点渗透自媒体、广告营销、电商素材制作等领域[2][7] **快手主业的经营表现** * 2025年第三季度,快手直播业务收入近100亿元人民币,同比增长2.5%[2][8] * 广告业务收入超200亿元人民币,同比增长14%[2][8] * 电商业务收入近60亿元人民币,同比增长超40%[2][9] * 通过生成式强化学习出价模型及端到端推荐大模型,提升广告匹配效率和客户ROI,全站推广产品占内循环消耗比例提升至65%以上[4][9] **快手未来的增长预期** * 根据Bloomberg和Visible Alpha一致预期,到2026年,快手广告增速预计为15.5%,电商GMV增速预计为11.4%,均显著高于行业平均水平[9] 其他重要内容 * 可灵O1对标Google、NanoBanana Pro和Viola 3等多模态模型[4] * 在专业领域如电影电视剧方面,AI渗透节奏可能较慢[7] * 快手UAX自动解决方案渗透率持续提升[8]
爱诗科技发布实时视频生成模型 PixVerse R1
财经网· 2026-01-14 12:37
公司产品发布与技术突破 - 爱诗科技于1月4日正式发布通用实时世界模型PixVerse R1 [1] - PixVerse R1支持最高1080P分辨率,可实现即时响应,将视频生成从“静态输出、等待成片”推进至“实时交互、持续演化” [1] - 该模型是一种能够对画面、声音等内容进行实时生成和交互建模的人工智能系统,使数字场景能够持续演化并即时响应用户操作 [1] 核心产品能力与用户体验 - PixVerse R1的核心能力在于“实时交互”,视频画面会随着用户指令即时变化 [1] - 用户可以持续调整角色状态、环境变化和镜头走向,系统同步响应并保持画面、角色和场景演化逻辑的一致性 [1] - 视频内容能够连续生成而非反复重启,实现“所想即所见、所说即所现”的交互体验 [1] - 这一变化使AI视频从“生成结果”转变为“生成过程”,用户可像导演一样介入创作节奏 [1] 底层技术架构与优势 - PixVerse R1基于原生多模态基础模型、自回归流式生成机制和瞬时响应引擎构建 [2] - 相关机制使视频成为一条可持续生成、可随时调整的视觉流,而非由孤立片段拼接而成 [2] - 该框架系统性突破了长期困扰AI视频生成的画面突变、逻辑断裂和高延迟问题 [2] 公司背景与市场表现 - 爱诗科技成立于2023年,专注于AI视频生成大模型及应用研发 [2] - 公司海外产品PixVerse及国内产品“拍我AI”目前全球用户规模已超过1亿 [2] - 产品单月月活跃用户超过1600万 [2] - 产品被广泛应用于影视、广告、动漫及内容创作等场景 [2]