Workflow
AI视频生成
icon
搜索文档
谁是最被低估的AI股?摩根大通:快手!
华尔街见闻· 2025-08-13 09:55
核心观点 - 摩根大通认为快手科技是最被低估的AI股票 目标价从71港元上调至88港元 上行空间22% 并重申其为中国数字娱乐板块首选股 [1] 可灵业务前景 - 摩根大通将可灵2025年和2026年收入预期分别从7.5亿元和12亿元大幅上调61%至12亿元和19亿元 [2] - 可灵4月和5月月度流水均突破1亿元人民币 多数收入来自PC端而非移动端 [2] - AI视频生成潜在市场规模超过1000亿美元 可灵价格仅为海外同业20-30% 在海外市场有广阔增长空间 [2] 外卖业务模式 - 快手采用以聚合为中心的轻资产外卖模式 主要利用与美团等成熟企业合作 而非自建物流 [3] - 该模式可最小化前期投资 并通过收取流量入口服务佣金带来额外变现机会 [3] 核心广告与电商业务 - 快手广告和电商业务未充分变现 预计2026-2027年广告和电商佣金收入年复合增长率13% [4] - 用户流量保持稳定未受微信视频号影响 收入结构向高利润率业务倾斜 [4] - 预计2026-2027年利润年复合增速达20% [4] 财务预测 - 2025年净收入预测345.8亿元 同比增长12% 环比增长6% [6] - 在线营销服务收入195.95亿元 同比增长12% [6] - 2025年营业利润(IFRS)47.11亿元 同比增长21% 环比增长11% [6] - 2025年非IFRS净利润51.41亿元 同比增长10% 环比增长12% [6] - 毛利率55.2% 营业利润率13.6% 净利润率12.9% [6] 估值分析 - 尽管年初至今股价反弹73% 但估值仍具吸引力 对应14倍2025年预期市盈率和11倍2026年预期市盈率 [7] - 基于14倍2026年预期市盈率设定目标价88港元 反映对广告业务加速增长和可灵强劲势头的乐观看法 [9]
速递|华人前谷歌团队的一键AI造梗视频,OpenArt已获500万美元融资,ARR目标2000万美元
Z Potentials· 2025-08-10 11:57
AI生成视频行业趋势 - AI生成的离奇角色视频(如穿运动鞋的鲨鱼、卡布奇诺脑袋的芭蕾舞者)正受年轻用户热捧 [3] - 初创公司OpenArt推动这一趋势,拥有约300万月活跃用户 [4] OpenArt公司概况 - 由两位前谷歌员工于2022年创立,已从Basis Set Ventures和DCM Ventures筹集500万美元资金 [4] - 实现正向现金流量,年收入目标超2000万美元 [4] - 推出"一键故事"功能公开测试版,支持输入文本生成一分钟视频(TikTok/YouTube等场景适用) [4] "一键故事"功能细节 - 提供三种模板:角色Vlog、音乐视频、解说视频 [5] - 用户可上传角色图片或歌曲,AI根据歌词生成主题动画(如花园鲜花盛开场景) [5] - 整合超50种AI模型(如DALLE-3、GPT、Stable Diffusion等),支持故事板模式精细编辑 [5] 技术差异化与未来计划 - 强调角色一致性优势,确保视频叙事连贯性(普通AI模型依赖独立片段需用户拼接) [9][10] - 计划迭代功能:支持双角色对话视频、开发移动应用程序 [11] 商业模式 - 采用积分付费系统:基础版14美元/月(4000积分)、进阶版30美元/月(12000积分)、无限版56美元/月(24000积分)、团队方案35美元/成员/月 [12] 行业争议与应对 - 存在知识产权侵权风险(如生成皮卡丘、海绵宝宝等角色) [7] - 模型默认拒绝受版权保护角色生成,但存在漏网之鱼,公司愿与版权方洽谈授权 [7]
兔子蹦迪疯传,5亿观看!全球恐慌:一段AI视频把全人类拉入虚拟现场
搜狐财经· 2025-08-04 12:24
新智元报道 编辑:KingHZ 【新智元导读】一段兔子深夜「蹦迪」的视频令上亿人上当!许多人未能识破,甚至在TikTok上引发大量转发。随着AI技术的进步,真假难辨的视频越 来越普及,让人不禁思考,未来我们如何区分虚拟与现实? 最近,一段萌兔深夜「蹦迪」假视频骗了全球上亿人真感情! 曾认为自己不会被AI欺骗的一代人,竟然被下面这段兔子蹦床视频给骗了: 乍看上去,视频里的兔子非常可爱,TikTok的这段视频还配有文字: 刚刚查看了家里的安全摄像头…我觉得我们家后院的蹦床上有客人来了!@Ring 兔子们玩得很开心,网友Greg很上头,发推表示自己之前从来没有这类视频如此上头: 然而,这些兔子并不是真的:这段视频是由人工智能生成的。 在视频的第五秒和第六秒之间,画面中的一只兔子突然消失了。显然这是假视频。 左上角那只兔子消失的瞬间 这段AI视频之所以难以识破,部分原因在于监控录像本身就画面模糊。人们第一眼看到这种视频,很难察觉是AI制作的,因为普通人已经习惯了模糊且 昏暗的监控画面,而这恰好掩盖了人们通常用来判断视频是否为AI生成的一些特征。 此外,该画面背景是静态的;目前较新的AI视频生成技术在呈现视频前景主体方 ...
赛道Hyper | 阿里开源通义万相Wan2.2:突破与局限
华尔街见闻· 2025-08-02 09:37
技术突破 - 阿里巴巴开源电影级视频生成模型通义万相Wan2.2,包含文生视频、图生视频和统一视频生成三款模型,其中文生视频和图生视频模型首次采用MoE架构 [1] - MoE架构由高噪声专家模型和低噪专家模型组成,分别负责视频整体布局和细节完善,总参数量27B,激活参数量14B,同参数规模下可节省约50%计算资源 [1][4] - 激活参数占比高达51.85%,远超行业水平(如GLM-4.5激活占比仅9%),体现公司在模型架构设计与优化方面的技术积累 [6][7] 技术架构创新 - MoE架构通过动态选择专家模型参与推理,提高计算效率和性能,特别适合大型神经网络训练和推理 [2] - 架构设计针对视频生成瓶颈,将模型拆分为处理整体布局的高噪声专家模型和专注细节的低噪专家模型,形成分工明确机制 [2] - 需要精准把握视频生成数据流向和处理逻辑,以及复杂的算法设计和大量实验调试才能实现高效参数激活策略 [7] 行业影响 - 公司选择开源策略,在GitHub、HuggingFace等平台提供模型代码,降低研究门槛并可能加速技术场景落地 [8] - 此举可能加剧视频生成技术迭代速度,因其他企业可基于开源技术进行优化升级 [8] - 代表中国企业在全球AI视频生成领域的重要发声,与国际竞争者形成差异化路径(资源效率提升vs时长优势) [10][11] 应用场景 - 当前5秒高清视频生成能力更适合创意工具场景,如影视前期策划可视化、广告短视频初稿制作 [9] - 存在明显局限性:复杂叙事需人工拼接,与电影级生产需求有差距,且美学控制依赖用户专业提示词 [9] - 未来需解决长时序下的逻辑连贯性、画面一致性等问题才能实现更广泛应用 [9][12] 行业趋势 - 视频生成技术处于快速进化阶段,从文本到视频的跨越需要算力、数据、算法综合突破 [12] - 技术价值在于提供新选择而非颠覆行业,未来渗透更多领域需突破技术瓶颈并验证商业模式 [12] - 企业面临平衡技术研发投入与商业回报的挑战,这比单纯技术突破更复杂 [12]
水果刀切万物:AI做起了ASMR视频
虎嗅· 2025-08-01 15:36
AI ASMR视频内容趋势 - AI生成的反常识切水果视频在Tiktok爆火 账号5天涨粉十几万并引发跟风模仿 [1][7] - 猎奇类内容涵盖冰键盘敲击声、沉浸式钻石披萨吃播、粘土风微缩景观及动画改编吃播 突破物理限制创造感官新体验 [9][11][13][15] - 部分AI ASMR涉及软色情内容 如"情人悄悄话"系列被质疑涉嫌违规 [17] 多模态生成技术突破 - 谷歌Veo3实现音视频同步生成 支持4K输出且音频适配率出色 显著降低创作门槛 [19][20][22] - 此前需通过ElevenLabs等工具分离生成音视频 尤其人物口型同步难度较高 [21] - 音视频同步成为生成式AI关键节点 国内快手可灵2.1、字节SeedFoley均实现同步生成功能 [31][32][34][37] 厂商产品布局与商业化 - 主流视频生成模型支持时长5-85秒 谷歌Veo3采用订阅与按量计费双模式 快手可灵订阅价66-666元/月 [39] - 字节即梦通过Seedance1.0模型开放API MiniMax海螺02支持1080p原生输出且性价比突出 [39][55] - 创作者混合使用多平台工具 即可灵生成音效更真实 即梦文字生图细节更精准 [40][42] 商业化变现路径 - 头部创作者通过售卖提示词(9.9美元)及付费课程变现 专业账号月入过万 [48] - 平台流量分成与广告植入收益显著 单条视频报价达6.5万 [48][50] - 解压类品牌(香薰、游戏影视)将产品植入AI切割场景进行营销 [51] 行业规模与增长 - 快手可灵9个月累计收入超1亿人民币 2025年Q1年化收入(ARR)突破1亿美元 [56] - 头部视频生成产品年化收入预计2025年达1亿美元 2026年增至5-10亿美元 [60] - 快手可灵全球创作者超4500万 累计生成视频2亿个 图片4亿张 [61] 竞争格局与战略优势 - 字节Seedance1.0登顶文生视频/图生视频排行榜 快手可灵与MiniMax紧随其后 [55] - 平台依托短视频生态构建闭环:快手整合创作者与视频数据 字节联动剪映与抖音分发 [61][62] - 技术迭代需匹配用户偏好变化 持续降低创作门槛与差异化体验成竞争核心 [63]
中金 | AI十年展望(二十五):视频生成拐点将至,成长性赛道迎中国机遇
中金点睛· 2025-08-01 08:09
技术路径演进 - 2024年OpenAI发布Sora后视频生成技术路径收敛至DiT(Diffusion Transformer)架构,取代了此前图像拼接、自回归扩散等混合路径[2][4] - DiT架构通过时空注意力联合建模实现89%的生成一致性,支持60秒长视频生成和多分辨率输入,物理模拟能力显著提升[7][11] - 仍存在自回归路径分歧,OpenAI GPT-4o和Sand AI采用自回归模型,认为其对长时间序列建模更合适[14] - 技术发展将沿两个方向延伸:端到端多模态大模型(如Google Gemini)和多模态理解生成统一架构(如DeepSeek Janus-pro)[16][17] 市场空间与格局 - 2024年全球AI视频生成市场规模约6亿美元,中期P端+B端市场空间有望达100亿美元[3][22] - P端市场中性测算空间32亿美元,基于1.6亿国内创作者和2亿海外创作者的付费渗透率假设[23][24] - B端市场中性测算空间94亿美元,主要来自广告、电商视频和影视行业的AI渗透[25][26] - 2025年竞争格局集中,快手可灵以20%市占率领先,Runway、海螺、爱诗等中国厂商占据主要份额[27][28] 中国厂商表现 - 中国公司在模型能力和产品力上超越海外,快手可灵2025年ARR超1.5亿美元全球领先[3][22] - 技术榜单显示字节Seedance、MiniMax海螺、快手可灵在文生视频和图生视频排名靠前[39][40][41] - 产品定位分化:可灵、海螺专注P端/B端专业用户;爱诗PixVerse、字节即梦主攻C端低门槛市场[45][48] - 商业模式以订阅制为主,高质量模式单秒定价进入0.4-2元区间,已触及创作者价格不敏感阈值[50][51] 技术应用与影响 - 视频生成已初步渗透影视、电商、广告场景,顶级动画电影制作成本从200万美元/分钟降至300美元/分钟[22][31] - 生成时长10秒内已满足多数需求,核心矛盾转向角色一致性和提示词理解能力[38] - 多模态技术重构内容生产流程,催生Prompt导演、审美把关人等新岗位,传统视频剪辑等职位面临转型[31] - 开源生态加速发展,快手Orthus、通义万相等开源模型推动行业技术民主化[19][37]
马斯克偷偷憋了个大招,Grok秒出《阿凡达》画质,好莱坞瑟瑟发抖?
36氪· 2025-07-30 11:49
马斯克又放大招!这次不是火箭,不是Grok智商升级,而是一个几乎能拍电影的AI视频生成器「Imagine」。它不但能加音效、配画面,还支持 多风格生成。网友实测效果太炸裂! 马斯克的Grok也能生成视频了! Grok即将推出了「Imagine」视频功能,直接挑战谷歌的Veo 3。 马斯克表示正在修复相关的bug,并且附上了机器人修复机器鸟的视频。 源自古代天空的奇想:Archytas的飞行鸽 —— 可能是世界上最早的「机器人」? 视频效果之炫目,让Michael Hyacinth怀疑这段视频来自某部电影中的情节。 这是人类历史上首个具备自我推进能力的飞行装置。虽然它在今天看来并不算真正意义上的飞行,但这项发明在理解鸟类飞行机制与空气动力学方面,迈出 了具有划时代意义的一步。 视频中,机器人修复的金光闪烁的「机器之鸽」,让网友联想起古希腊数学家、哲学家、数学力学先驱Archytas的机械飞鸟传说。 得到试用机会的网友,用Grok制作了赛博朋克风格的视频。 代码在血色的暗室里跳动,机械手在键盘上掀起金属风暴。 这个瞳孔泛着危险红光的Robot,正用二进制语言撕咬人类文明的防火墙。六块曲面屏同时倾泻数据瀑布,0与1 ...
国产AI视频三国杀:可灵、即梦、Vidu,谁会是最大赢家?
36氪· 2025-07-30 08:16
产品实测表现 - 可灵AI优势在于表现力强 能够生成极具视觉冲击力的画面 适合制作戏剧化内容 劣势在于容易"用力过猛" 对度的把握不足 免费版生成等待时间超过3小时[2][14][17] - Vidu优势在于真实细腻 模拟真实物理世界和微表情潜力强 视频最具电影感 劣势在于节奏慢爆发力不足 5秒时长内难以完全展现核心内容[2][17][28] - 即梦AI优势在于均衡可控 能准确完成指令 功能全面性最佳 支持数字人/动作模仿/运镜选择 劣势在于艺术表达缺乏惊喜 略显平庸[11][18][33] 技术路线差异 - 可灵采用与Sora一致的DiT架构 并自研3D VAE和3D时空联合注意力机制 实现时空信息高度融合处理 支持生成10秒1080P视频 在多模态编辑功能上突出[23][24][25] - Vidu采用U-ViT融合架构 结合U-Net底层特征捕捉与Transformer全局语义理解 实现端到端一次性生成 支持1080P输出 在参考生视频功能上独具特色[26][27][28] - 即梦以自研Seedance 1.0系列模型为主 引入精准描述模型和统一预训练框架 最快40秒生成5秒1080P视频 采用分级模型策略 即梦3.0用Seedance 1.0 mini模型 pro版用更强模型[29][31][33] 商业生态布局 - 可灵背靠快手短视频流量池 全球创作者超4500万 累计生成视频超2亿个 图片超4亿张 通过《新世界加载中》案例展示内容侧野心[2][4][35] - 即梦依托字节跳动旗下抖音和剪映 形成创作-分发闭环 目标成为下一代视频创作工作流核心 工具属性定位明确[18][36][38] - Vidu具备清华系技术背书 定位底层基础大模型 在To B市场有想象空间 但面临产品化和市场化挑战[35][37] 行业竞争格局 - 第三方评测Artificial Analysis显示 即梦Seedance 1.0在文生视频榜单以1314分位居首位 图生视频榜单以1365分领先[30][32][33] - 可灵Kling 2.0在文生视频榜单获1114分 图生视频榜单获1194分 处于竞争梯队[30][32] - 行业形成可灵表现派 Vidu写实派 即梦工具派的技术分化格局 最终赢家预计在可灵和即梦间产生[34][37][38]
马斯克偷偷憋了个大招!Grok秒出《阿凡达》画质,好莱坞瑟瑟发抖?
搜狐财经· 2025-07-29 20:28
新智元报道 编辑:KingHZ 【新智元导读】马斯克又放大招!这次不是火箭,不是Grok智商升级,而是一个几乎能拍电影的AI视频生成器「Imagine」。它不但能加音效、配画面, 还支持多风格生成。网友实测效果太炸裂! 马斯克的Grok也能生成视频了! Grok即将推出了「Imagine」视频功能,直接挑战谷歌的Veo 3。 马斯克表示正在修复相关的bug,并且附上了机器人修复机器鸟的视频。 视频效果之炫目,让Michael Hyacinth怀疑这段视频来自某部电影中的情节。 视频中,机器人修复的金光闪烁的「机器之鸽」,让网友联想起古希腊数学家、哲学家、数学力学先驱Archytas的机械飞鸟传说。 源自古代天空的奇想:Archytas的飞行鸽 —— 可能是世界上最早的「机器人」? 这是人类历史上首个具备自我推进能力的飞行装置。虽然它在今天看来并不算真正意义上的飞行,但这项发明在理解鸟类飞行机制与空气动力学方面,迈 出了具有划时代意义的一步。 网友表示这次马斯克在视频上动真格了。 电影级质量 细节逼真到离谱 得到试用机会的网友,用Grok制作了赛博朋克风格的视频。 代码在血色的暗室里跳动,机械手在键盘上掀起金属 ...
阿里开源电影级AI视频模型!MoE架构,5B版本消费级显卡可跑
量子位· 2025-07-29 08:40
通义万相Wan2.2模型技术突破 - 阿里开源新一代视频生成模型通义万相Wan2.2,包含文生视频、图生视频和混合视频生成功能[4] - 首次在视频生成模型中实现MoE架构,包含Wan2.2-T2V-A14B和Wan2.2-I2V-A14B两个版本,可生成电影级质感视频[5] - 5B版本支持消费级显卡部署,是目前最快的24fps、720P基础模型[5] - 相比前代Wan2.1,图像训练数据增加65.6%,视频数据增加83.2%[31] 模型架构创新 - 采用MoE架构解决视频生成模型参数扩展难题,通过拆分高噪/低噪专家模型处理不同去噪阶段[26][28] - 引入900去噪时间步划分,高噪模型负责主体结构构建,低噪模型处理细节生成[28] - 自研高压缩比3D VAE结构实现16x16x4压缩比,降低显存占用同时保持重建质量[34][35] - 验证损失(Validation loss)达到行业最低水平,视频生成质量最优[29] 电影级美学控制系统 - 整合光影、色彩、镜头语言三大电影元素,提供12个美学维度和60+专业参数控制[37][38] - 支持精确调控光线时段/类型/强度/方向、构图法、拍摄角度、色彩情绪等[38][40][42] - 用户仅需添加美学关键词前缀即可自动生成专业导演质感的画面[46] 复杂运动与交互能力 - 构建面部原子动作系统,可生成微表情如"强忍泪水时的嘴唇颤抖"[47] - 优化手部动作系统,支持从基础操作到专业精密动作的生成[48] - 提升多人交互物理合理性,避免角色穿模现象[49] - 增强高强度运动(体操/滑雪等)的稳定性,减少动作失真[50] 产品生态与行业影响 - 通义万相系列累计下载量超4亿次,衍生模型超14万,全球排名第一[54] - 配套推出"万相妙思+"创作活动,设置兴趣组(5-15秒)和专业组(30秒+)赛道[54] - 模型已上线通义万相平台及GitHub/HuggingFace/魔搭社区[18][56] - 该技术突破可能重塑电影工业生产流程[55]