Workflow
AI视频
icon
搜索文档
“何以中国·理想都城”网络主题宣传活动在北京启动
人民日报· 2025-09-26 07:46
活动概述 - 网络主题宣传活动“何以中国·理想都城”于9月25日在北京启动 [1] - 活动在中央网信办网络传播局和北京市委宣传部指导下进行 [1] - 活动由北京市委网信办、北京市文化和旅游局、北京市文物局、人民网共同主办 [1] 活动内容与形式 - 启动仪式通过AI视频、微戏剧、情景讲述、众筹纪录片等方式呈现北京文化 [1] - 活动内容涵盖北京的古都文化、红色文化、京味文化和创新文化 [1] - 北京市考古研究院和北京市园林绿化局在活动现场发布了最新考古成果和金秋生态文化活动 [1] 参与方与支持方 - 活动邀请专家学者、文化名人、青年榜样、长城保护员、文旅博主等参与 [1] - 协办单位包括北京市科委中关村管委会、北京市园林绿化局、北京广播电视台、北京市东城区委区政府 [1] - 支持方包括中国互联网发展基金会、北京宣传文化引导基金理事会、吉祥大戏院 [1] 宣传与发布 - 中央重点新闻网站和商业网络平台发布了重点网络宣传项目 [1] - 活动由人民视频和人民科技承办 [1]
Meta推出与AI视频相关的Vibes
华尔街见闻· 2025-09-26 03:33
Meta推出与AI视频相关的Vibes。 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何 意见、观点或结论是否符合其特定状况。据此投资,责任自负。 ...
西湖大学发布世界模型WorldForge,让普通视频模型秒变「世界引擎」
具身智能之心· 2025-09-24 08:04
文章核心观点 - 西湖大学AGI实验室的研究团队提出了一种名为WorldForge的全新免训练引导框架,旨在解决AI视频生成中可控性与生成质量难以兼得的瓶颈问题 [2][3] - 该框架通过在推理阶段对视频扩散模型进行“即插即用”式的干预,成功实现了从单张静态照片生成360°环绕视频以及对现有视频进行电影级复杂运镜等任务,无需重新训练模型 [3][6][13] 方法概述:免训练引导框架 - WorldForge的核心思想是在生成过程的每一步进行“干预”和“校准”,而非在训练阶段改造模型,通过用户定义的相机轨迹指令确保时空几何一致性 [13] - 框架包含三个关键创新模块:步内递归修正(IRR)、流门控潜在融合(FLF)和双路径自校正引导(DSG) [15][16][17] - **IRR模块**:通过步内递归优化机制,在每一步推理中先用真实内容替换模型预测的“已知区域”,以增量式校正来精准注入轨迹控制信号,防止轨迹漂移 [15] - **FLF模块**:在VAE潜在空间中,基于光流相似性区分“运动通道”与“外观通道”,仅向运动通道注入控制信号,实现动静分离以保护画面细节 [16] - **DSG策略**:利用IRR产生的“即兴创作”(非引导路径)和“精准描摹”(引导路径)两条并行路径,计算差异形成动态校正项,在轨迹精确性与画面质量间取得平衡 [17][18] 技术亮点与应用 - **单图生成360°环绕视图**:仅需一张静态照片,即可生成清晰、稳定、几何一致的360°环绕视频,尤其适合以目标为中心的复杂开放场景 [21] - **视频的电影级可控重摄影**:用户可为任意视频指定希区柯克变焦、弧形环绕、升降摇移等复杂相机轨迹,WorldForge能稳定“重拍”并自动补全新视角内容,在人脸、动态物体与复杂环境中表现更稳定 [23] - **视频内容的编辑与再创作**:框架支持视频去抖与视角切换、物体擦除与添加、主体变换与虚拟试穿等多种编辑功能,保持几何一致性与环境融合 [29] - **免训练特性带来的优势**:WorldForge无需训练,作为一个即插即用的模块可灵活迁移至多种主流视频模型,具有卓越的跨域适应性,同时因免去重训与数据筹备而成本友好,降低了高质量3D/4D内容的创作门槛 [31][34] 行业意义与展望 - WorldForge代表了一种新范式,即在不牺牲大模型先验知识、不增加训练成本的前提下,于推理阶段实现对生成过程的精准控制,证明视频模型不仅是内容“生成者”,也能成为听懂指令的“执行者” [32] - 该技术极大地降低了影视预览、游戏开发、数字孪生等领域的高质量3D/4D视觉内容创作门槛 [32] - 展望未来,若将这种精准的时空控制能力与更强的多模态理解(如语言、草图)相结合,有望实现通过口头描述或简单勾画就能导演AI生成的“时空大片”,为通往“可控世界模型”提供了一条前景光明的技术路径 [32]
用AI一键直出超绝电影级转场,我的PR真的可以卸载了。
数字生命卡兹克· 2025-08-21 21:48
可灵2.1首尾帧技术升级 - 可灵2.1版本新增首尾帧功能 支持用户自定义视频起始帧和结束帧 实现高精度画面控制 [5][7] - 首尾帧生成价格与可灵基础版本一致 均为每条视频35积分 [7] - 相比1.6版本 2.1版本在动态效果、画面质感和语义理解方面有显著提升 恶龙案例中翅膀扑腾幅度、镜头运动速度和冲击力明显增强 [7][8][9] 首尾帧技术功能特性 - 通过设定起点和终点帧 可精确控制时间节奏、视觉风格和主体动作 大幅降低AI生成内容偏离预期的风险 [10] - 支持复杂镜头运动控制 包括快速推进、拉远、旋转等影视级运镜效果 [9][38] - 自动补帧能力突出 能无缝衔接首尾帧并自动生成中间帧 用户难以区分人工设定与AI生成帧的界限 [40][44] 应用场景拓展 - 支持影视级一镜到底制作 如蜘蛛侠跑酷视频通过多段首尾帧拼接实现全程丝滑效果 [19][21] - 适用于普通用户创意表达 包括地球转场特效、箱子爆炸弹出家具、车辆变形金刚化等视觉创意 [23][25][27] - 在商业领域具有应用潜力 可用于设计提案草图建筑化、LOGO与商品转化广告等场景 [27][29] - 支持超现实创意实现 如杯中热气变龙卷风、3D打印建筑内部探索等复杂视觉叙事 [33][35] 技术实现优势 - 物理运动规律遵循度极高 能自动生成符合物理逻辑的中间元素(如蜘蛛侠案例中自动生成楼梯) [42] - 提示词要求简洁 仅需描述镜头运动+主体动作即可生成高质量视频 降低使用门槛 [40] - 动态控制能力突出 支持大动态幅度镜头 要求首尾帧设定具备丰富动势以获得最佳效果 [38][40]
活动报名:AI 视频的模型、产品与增长实战|42章经
42章经· 2025-08-10 22:04
AI视频模型技术路径与能力展望 - Luma AI模型产品Lead戴高乐分享视频模型与世界模型的技术路径及未来能力展望 [2] - 探讨视觉模型从diffusion到DiT再到autoregressive的技术演进历程 [3] - 分析更智能的视觉模型能力发展前景 [3] Pixverse用户增长与商业化策略 - 爱诗科技联合创始人谢旭璋分享Pixverse两年内实现6000万用户的关键决策 [3] - 外部模型、自研模型与应用产品的选择与迭代策略 [4] - 从模型到特效类产品的转化逻辑及0-6000万用户的增长点与商业化路径 [4] 视频工具产品增长方法论 - 前OpusClip增长产品负责人谢君陶提出视频工具获客需聚焦创作者长期合作模式 [5] - 转化阶段强调灵活精准的定价策略与分阶段价格实验设计 [5] - 留存策略以用户为中心,通过客服团队与运营保持长期连接 [5] - 早期数据基建的取舍与数据驱动决策在增长中的关键作用 [5] 行业交流活动信息 - 活动聚焦AI视频领域模型、产品、增长三大维度实战经验分享 [10] - 线上会议时间为8月16日10:30-12:30,限额100人(非投资行业优先) [7][10]
东方证券:多重催化驱动趋势加速 锚定多模态与出海机遇
智通财经网· 2025-08-06 14:55
核心观点 - 坚定看好多模态AI和出海赛道 产业发展和商业模式优势将带动行业公司享受高成长和高估值 [1] - 重视下半年垂类多模态AI应用机会 技术突破和成本优化将加速产业趋势发展 [1] - 特别关注有多模态AI应用出海布局的公司 起量速率可能更快 [1] 技术发展进展 - 主流AI产品能保持5-10秒视频稳定性和一致性 行业正探索生成视频时长上限 [2] - 字节提出CaptainCinema电影级短片生成框架 采用双步规划器实现叙事连贯性 [2] - 年内可能看到1分钟左右时长的AI视频出现 时长提升将加速内容渗透率 [2] 成本优化与商业模式 - 快手可灵视频生成产品在推理层面实现毛利打平 [3] - 阿里Wan2.2的MoE架构可节省50%计算消耗 [3] - 行业成本持续下降将带来"更好更便宜"的产品 提升用户渗透速率 [3] - 技术迭代推动推理成本进一步下降 用户使用成本降低 [3] 内容创新与扩容 - AI漫剧直接生成中AI参与度从50%提升至近80% [3] - AI转绘漫剧对真人实拍短剧进行再创作 全球发行更具普适性 [3] - 新内容业态成熟将带动内容市场扩容 AI视频可触及规模扩大 [3] 市场空间测算 - AI视频潜在空间测算为416亿美元 [4] - P端市场:海外2亿+国内1.6亿创作者 35%月活使用比例 海外10%/国内8%付费渗透率 月ARPU 35/17美元 对应38亿美元市场空间 [4] - B端市场:内容制作规模1984亿美元 20%AI渗透率 对应397亿美元市场空间 [4] - 考虑P端和B端场景重合 给予P端50%折算 得出416亿美元总市场空间 [4] - 海外用户付费能力和意愿更强 内容创作人工成本更高 [4] 关注公司 - 建议关注:快手-W(01024) 美图公司(01357) 万兴科技(300624) MiniMax(未上市) [1]
“兔子蹦床”视频播放超5亿,是人类爱被AI“骗”的结果?
虎嗅· 2025-08-04 15:57
视频的标题写着:"刚查看了家庭监控,我想我们家后院来了几位特邀嘉宾!@Ring"。 一段看起来像是夜视监控拍到的"兔子蹦床"视频,在TikTok上爆火,全网收获了有5亿次播放。 视频看上去像是某户人家的安防摄像头拍到的,灯光昏黄、画面模糊,但恰到好处地捕捉到几只兔子轮番起跳,活像在开夜间演出。 0:00 / 0:08 监控的模糊画质、几只看似在狂欢的兔子,这可爱又略带一丝真实感的画面迅速吸引了人们的眼球。 视频数据截图,在TikTok上收获了2500万点赞 在社交媒体平台X上坐拥百万粉丝的名人@Greg也评论说,"我从没意识到自己需要一群蹦床兔子,直到今天"。 然而,这份可爱是虚假的。视频中的兔子并非真实存在,有人发现,它是AI生成的。 第5到第6秒之间,左上角的兔子忽然"消失"。回头再看,细节确实有点怪。 但和大多数"AI穿帮"视频不同,这次几乎没人第一时间认出来。哪怕是刷视频经验老到的年轻人,也直呼"完了,我居然被骗了"。 但这不是一场骗局,更像是一种小型社交媒体的灾难:不是"我们被骗了",而是"我们居然愿意被骗"。 一、看似糊得刚刚好,其实"骗"得刚刚好 这段AI视频之所以能成功"欺骗"大众,很大程度上 ...
1080P+超高一致性,Vidu Q1 参考生驱动广告电商赛道GMV快速增长
搜狐财经· 2025-07-18 11:09
行业背景与挑战 - 广告与电商行业面临预算紧缩和消费者注意力碎片化压力,内容营销重要性提升 [1] - AI视频因"主角变脸"、"商品失真"等问题未能在行业大规模应用 [1] - 传统视频制作成本高且周期长,中小商家难以承担多场景拍摄 [16] 技术突破与产品创新 - 生数科技Vidu Q1推出"1080P+超高一致性"参考生视频功能,解决多主体一致性问题 [5] - 支持7主体同时输入(人物/场景/道具等),实现多品类商品一体化展示 [9] - 突破人物与商品互动技术瓶颈,实现手持商品自然展示效果 [18] - 生成效率提升百倍,素材制作周期从1-2周缩短至1小时 [26] 商业化应用场景 - 服装行业:支持模特快速换装展示,实现180度转身等复杂动作 [5][23] - 品牌出海:通过替换人物/场景图一键生成本地化营销素材 [20] - 广告公司:单日可产出上千条创意变体,比稿效率显著提升 [26] - 电商平台:投流素材制作周期从2周压缩至1小时,加速A/B测试 [26] 市场反馈与数据表现 - 发布一周内获得众多广告电商新客户签约 [1] - 已服务3000+客户,验证产品易用性与商业化潜力 [28] - AI视频降低制作成本超50%,但此前因质量问题未被采用 [5] 技术细节与案例 - 模特展示案例:输入T恤正反面照片即可生成360度展示视频 [5] - 多品类搭配案例:同步生成服装/配饰/鞋包搭配方案 [12] - 场景化营销案例:洗面奶在不同场景下展现差异化调性 [16] - 全球化案例:保健品通过外籍模特讲解提升说服力 [18]
网上创业项目推荐:运用官方折扣政策赚取八万元利润
搜狐财经· 2025-07-18 10:36
AI视频行业成本优化机会 - AI视频生成工具使用成本较高 单次生成费用约2-3元 反复调试会显著增加成本 [3] - 可灵AI存在批量采购折扣政策 大客户采购可获得最低五折优惠 形成显著价格差 [5] - 二级市场出现兑换码转售渠道 价格较官方渠道低35% 验证了套利空间存在 [3] 商业模式分析 - 核心模式为利用团购政策获取低价兑换码 采购规模达10万可享35%折扣 50万以上可获五折优惠 [6] - 转售定价策略为六五折至七折 利润率可达15%-20% 25万投入预期回报7-8万 [6] - 销售渠道包括闲鱼/淘宝等平台 更倾向私域流量运营 通过内容引流提高转化率 [8] 市场可行性评估 - AI视频行业需求旺盛 用户降本需求明确 但项目需要10万以上启动资金门槛 [9] - 兑换码存在一年有效期限制 要求快速周转 考验销售能力和库存管理 [11] - 当前市场竞争格局分散 存在整合机会 规模采购可形成定价优势 [13] 项目本质与风险 - 本质为利用信息差和渠道差的套利模式 需资本/渠道/运营能力综合支撑 [14] - 建议采用小规模测试验证模式 确认销售通路可行后再扩大规模 [14]
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
数字生命卡兹克· 2025-06-23 03:12
AI视频爆款现象分析 - 动物奥运会AI视频在Tiktok获290万点赞,引发X和Tiktok平台模仿潮[1][2] - Veo3制作的卡皮巴拉Vlog在6月初爆火,带动大脚怪自拍、三国战地记者等衍生内容[8] - AI ASMR视频8天涨粉17万,播放量达5000万,推动该类型达到高潮[10] - AI唱Rap科普视频成为新爆款形式[12] 爆款复制价值探讨 - 跟风模仿AI视频格式易陷入短期流量陷阱,类似唐朝张大麻追逐潮流却失败的故事[20][24][26] - 流量本质具有不确定性,"流"代表变化性,"量"代表可测量但短暂的状态[33][35] - 表层模仿价值有限,核心在于构建独特叙事能力与IP宇宙,如将动物奥运会升级为连续剧式内容[43][44] 流量获取与留存挑战 - 生产门槛降低导致注意力竞争加剧,仅极少数创作者能持续获取流量[75][76] - 流量本质是情绪博弈,类似股市中散户在情绪高潮时进场却亏损的现象[67][68][71] - 观众忠诚度取决于创作者人格魅力而非内容形式,需建立情感连接[88][90] 长期价值构建路径 - 流量需转化为长期叙事或稳定IP才能产生持续价值,类似股票价格最终回归基本面[83][84] - 人类注意力具有刺激阈值递增特性,需通过独特观点和温度维持吸引力[86][87] - AI工具无法替代创作者的人生底稿与人格化表达[91][92] 行业启示 - 爆款周期缩短反映内容行业加速迭代,但匠人精神仍为核心竞争力[94][96] - 注意力经济下,平台算法与用户疲劳度加剧内容生命周期衰减[73][87] - 成功案例显示AI视频在娱乐、科普等领域的创新潜力[8][10][12]