Workflow
AI视频生成
icon
搜索文档
世界首个「实时、无限」扩散视频生成模型,Karpathy投资站台
机器之心· 2025-07-19 11:13
技术突破 - Decart发布全球首个实时无时长限制的扩散视频模型MirageLSD,支持任意视频流输入并实现40毫秒超低延迟转换[3] - 该技术突破视频生成两大瓶颈:实现无限长视频生成(突破传统模型20-30秒质量衰减限制)和零延迟交互(响应速度较前代提升16倍至24帧/秒)[19][20][28] - 核心技术采用实时流扩散(LSD)架构,通过逐帧去噪、历史增强方法及因果自回归结构保持时间连贯性[18][25][32] 应用场景 - 实时视频风格转换:可将摄像头画面/游戏画面实时转化为任意风格世界,支持文本提示控制[4][7][12] - 影视创作革新:实现自导自演实时电影,AI同步完成布景/风格化/剪辑[8] - 游戏开发提效:用基础几何体编码机制后由AI自动生成精美贴图,30分钟完成游戏原型开发[9][15] - AR/VR增强:支持视频会议虚拟背景、实时虚拟试衣及AR眼镜现实卡通化功能[11][12][13] 技术原理 - 采用Diffusion Forcing技术逐帧去噪,通过历史帧扰动训练增强模型对误差累积的鲁棒性[25] - 定制CUDA mega kernels和模型剪枝技术优化计算效率,使单帧生成时间压缩至40毫秒内[31] - 因果反馈机制实时融合历史帧/输入帧/用户提示,实现动态内容适应与零延迟响应[33][34][35] 发展潜力 - 前特斯拉AI总监Andrej Karpathy已作为天使投资人参与,认为技术具备通用性[14] - 公司计划升级面部一致性、语音控制、物体精准操控功能,并集成流媒体/游戏/视频通话场景[16] - 当前局限包括长期记忆窗口不足、极端风格下几何失真等问题,未来拟通过结构化控制信号提升编辑精度[36][37][38]
靠视频大模型赚钱,还是个梦
投中网· 2025-07-18 14:10
行业动态 - 2025年AI视频生成赛道成为行业最热门领域,国内大厂如快手、字节、阿里、腾讯等密集推出迭代产品,包括快手可灵2.0、字节即梦3.0、阿里万相2.1等 [4] - 行业技术快速进步,语义响应、画面质量、动态质量等指标显著提升,商业化前景显现,如快手可灵AI 2025年Q1收入超1.5亿元,带动股价上涨30% [4] - 全球竞争格局中,快手可灵系列使用份额达30%,超越Runway(23.6%)和Veo-2(16.6%),但谷歌Veo 3凭借音画同步技术重新定义行业标准 [8][10] 公司竞争 - 快手可灵AI通过快速产品化抢占先机,上线一年用户达2200万,早期技术优势明显(1080P清晰度),但近期被字节即梦等竞品追赶 [8][10] - 字节即梦AI通过Seaweed和PixelDance模型迭代实现反超,即梦App下载量一度登顶免费榜,月活用户893万(快手可灵180万),积分激励策略更激进 [10][12][13] - 创业公司表现突出,如生数科技Vidu 2.0、爱诗科技PixVerse(月收入千万元级),形成与大厂差异化竞争 [9][5] 技术瓶颈 - 视频生成面临三大限制:架构局限(最长10秒片段)、算力不足(数据量指数级增长)、高质量训练数据稀缺,导致技术进入平台期 [19] - 关键痛点包括输出一致性差(相同输入产生不同结果)、运动镜头生成困难(仅能制作"动态PPT"),制约商业化应用 [16][17] - 厂商转向优化用户体验,如可灵3.0拓展多模态支持,即梦3.0强化多模态生成能力,竞争焦点从技术突破转向工作流优化 [20] 商业化探索 - 主流商业模式为免费+会员制,字节即梦连续包月69元/1080积分,快手可灵66元/660积分,付费群体集中于影视、广告等专业创作者 [12][13] - 成本优势与局限并存:AI视频生成成本(300美元/分钟)远低于传统动画(200万美元/分钟),但试错成本高导致实际支出不可控 [14][17] - 短剧领域试水案例增多,但投资方态度谨慎(单项目约20万元),市场验证尚未完成,如《上海奇境》《三星堆》票房表现平平 [18] 生态布局 - 字节依托抖音/TikTok流量和火山引擎技术协同,强化即梦在内容分发、剧本创作等环节的生态优势 [21][22] - 快手通过创作大赛(如《末日进行时》《太阳坠落之时》)挖掘优质创作者,结合资源扶持构建内容生态 [22]
AI Video Is Eating The World,创作者、创业者的机会在哪?
Founder Park· 2025-07-17 19:25
AI视频生成行业趋势 - AI视频生成技术正在重塑短视频创作生态,大量低门槛AI生成内容(如切水果、宠物小剧场)催生了全新的去中心化IP商业化模式,首个被Netflix收购的AI原生IP可能即将出现[2] - TikTok、Instagram等平台90%的短视频内容已由AI生成,意大利无脑角色等去中心化IP宇宙形成规模效应,相关周边商品(玩具、T恤)已实现商业化[8][14] - 爆款内容公式为「熟悉IP+新奇感」,利用《星球大战》风暴兵等现有IP可快速获取用户注意力,同时原创奇特内容(如大猩猩Kim)也能通过强叙事性走红[25][26] 技术应用与创作工具 - Veo3等视频模型降低创作门槛,但存在角色一致性差、无法基于图像生成视频等技术限制,导致创作者需反复生成(单条视频平均尝试7-8次)[21][32] - 开源工具ComfyUI在风格转换、角色替换等复杂工作流中仍具优势,但基础模型功能正逐步替代其应用场景[41][42] - 多模型赋能平台(如Krea AI、Fal.ai)因简化操作流程而受青睐,相比Veo3的复杂订阅体系更符合创作者需求[35][36] 商业化变现路径 - 变现方式包括平台流量分成(TikTok每百万播放约20美元)、IP周边销售、虚拟网红带货及课程咨询,但高昂生成成本导致ROI不稳定[30][32][33] - AI虚拟网红经济规模预计增长10倍,创作者通过订阅制变现收入远超传统广告分成[29] - 内容套利现象显著,爆款视频在跨平台传播时有1-2天窗口期,TikTok的ASMR内容与Facebook系动物跳水视频存在平台用户差异[49][50] 内容生态创新 - 「提示理论」引发AI角色存在主义思考,生成角色探讨自身被提示词控制的命运成为新内容类型[43][44] - 二次创作内容(如粉丝自制星战角色跳水视频)流量表现不输原生短视频,形成去中心化创作社区[20][27] - AI家具设计等跨界商业化案例涌现,如大猩猩椅子从概念到实体商品快速落地[49]
靠视频大模型赚钱,还是个梦
创业邦· 2025-07-17 18:05
视频生成赛道竞争格局 - 国内AI视频生成赛道竞争激烈,快手可灵2.0、字节即梦3.0、阿里万相2.1、腾讯HunyuanCustom、生数科技Vidu2.0、MiniMax旗下Hailuo 02等模型先后登场,技术指标显著提升[3] - 快手可灵AI在2025年第一季度收入超过1.5亿元,带动快手港股涨幅超30%[4] - 字节跳动Seed负责人将2025年定义为图像生成商业化元年,Pixverse月订阅收入达千万元级别[4] 主要厂商市场表现 - 快手可灵AI全球用户达2200万,在Poe平台使用份额超30%,超越Runway和Veo-2[7] - 字节即梦App在苹果商店下载量一度登顶,超越豆包和红果短剧[13][14] - 谷歌Veo 3实现音画同步突破,重新确立技术领先地位[11] 技术发展现状 - 视频生成模型普遍面临"一致性"和"运动性"难题,输出效果不稳定[5][22] - 当前模型最长只能生成5-10秒片段,1分钟视频生成仍不可行[26] - 技术瓶颈主要来自架构限制、算力不足和高质量训练数据稀缺[26][28][29] 商业化探索 - 主流商业模式为免费+会员制,即梦包月69元/可灵66元,积分机制不同[17] - AI视频制作成本显著低于传统方式(300美元/分钟 vs 200万美元/分钟)但试错成本高[19][23] - 专业创作者是核心付费群体,集中在影视、短剧、广告、游戏领域[18] 厂商战略差异 - 字节即梦侧重用户规模扩张,月活达893万;快手可灵专注专业用户渗透,月活180万[17] - 快手通过创作大赛发掘人才,投资S级短剧项目;字节依托抖音生态和火山引擎技术支持[30] - 厂商竞争重点从技术突破转向用户体验优化和多模态能力拓展[29] 行业挑战 - AI视频在短剧领域成本优势不明显,1分钟短剧仍需数千元试错成本[23][24] - 动态镜头生成能力不足,当前AI视频多为"动态PPT"效果[23] - 投资方态度谨慎,多采取小规模试水策略[24]
Z Event|字节、快手、爱诗、生数的同学下班一起聊AI?北京线下AI视频生成局报名中
Z Potentials· 2025-07-15 11:14
活动信息 - 活动时间定于2025年7月18日周五晚7点 [1] - 活动地点在北京 具体地点报名后通知 [1] - 活动人数限制为6-7人 目标人群包括大厂 创业公司产品/技术 创业者 [1] - 活动主题为AI视频生成与场景应用 [1] 实习生招募 - 公司正在招募新一期实习生 [3] 创业交流活动 - 公司寻找有创造力的00后创业者参与小型聚餐 [5] - 活动旨在交流想法 分享经验 拓展人脉 [5] - 报名截止时间为活动前一日晚8点 名额有限 先到先得 [5] - 公司将根据参与者背景和诉求进行合理组合 确保每个人有所收获 [5] 公司介绍 - 公司名称为Z Potentials [6]
Z Event|字节、快手、爱诗、生数的同学下班一起聊AI?北京线下AI视频生成局报名中
Z Potentials· 2025-07-14 14:22
活动信息 - 活动时间定于2025年7月18日周五晚7点 [1] - 活动地点在北京 具体地点将在报名后通知 [1] - 活动人数限制为6-7人 [1] - 目标人群包括大厂员工 创业公司产品/技术人员以及创业者 [1] - 活动主题聚焦AI视频生成与场景应用 [1] 招募信息 - 公司正在招募新一期实习生 [3] - 公司寻找有创造力的00后创业者 [5] 活动特色 - 活动形式为小而美的聚餐 旨在交流想法和分享经验 [5] - 活动提供拓展人脉的机会 [5] - 报名采取先到先得原则 截止时间为活动前一日晚8点 [5] - 公司将根据参与者背景和诉求进行合理组合 确保活动效果 [5] 公司信息 - 公司名称为Z Potentials [6]
这是我花9毛钱拍的《Meta老板砸钱把我从苹果挖走》
量子位· 2025-07-14 13:23
技术突破 - 国产AI视频生成技术实现重大升级,通过4张参考图+9毛钱成本即可生成定制化视频,颠覆传统图生视频仅支持首尾帧+Prompt的局限[1][4][6] - 新功能实现"素材即剧组"模式,用户可自由决定视频中所有人物、道具、背景元素,支持7个主体同时生成且保持100%一致性[4][27][33] - 技术直接跳过传统分镜制作环节,流程简化为"素材准备→视频生成→剪辑",进入零分镜时代[12][13][20] 产品优势 - 生成质量达1080P,支持跨作品角色联动(如《老友记》与《生活大爆炸》角色同框)及真人/动漫素材混合创作[28][30][36] - 专业模式自动优化Prompt理解,支持素材一键存入主体库供重复调用,修改成本极低[19][22][24] - 成本仅为传统版权素材1/30,5秒视频最低0.9元,1000元预算可生成48分钟内容[36][37] 行业影响 - 首次实现多主体超高一致性生成,解决行业长期存在的角色畸变问题,技术指标领先同业[26][27][33] - 将影视制作流程从7个环节压缩至3个,大幅降低广告/内容创作门槛[8][10][13] - 开启"快好省"的AI视频生产力时代,成本降幅达30倍,推动商业化应用普及[36][37]
周杰伦发的1400万人点赞的AI视频,是怎么做出来的?
数字生命卡兹克· 2025-07-14 01:21
周杰伦AI视频现象 - 周杰伦抖音首条视频发布1天内突破千万点赞,目前点赞量超1400万[2] - 视频采用AI技术生成,通过首尾帧功能将人生重要节点串联,形成史诗般叙事效果[3][8] - 视频背景音乐《三年二班》引发强烈怀旧情绪,产生"爷青回"效应[6][7] AI视频生成技术 - 首尾帧生成功能原理:上传首尾两张图片,AI自动生成中间过渡画面组合成流畅视频[9] - 主流视频生成工具包括即梦、可灵、Veo3、Pixverse、Vidu等大模型[8] - 技术应用案例:周杰伦童年照片生成微笑跑向钢琴的连贯动作[13][17] - 视频制作流程:分段生成后导入剪辑软件微调,添加背景音乐完成[22] AI视频应用场景 - 影视剧情节改编:为《甄嬛传》果郡王桥段创造新结局[29][31] - 经典场景重现:科比空难事件平行宇宙设定[32][33] - 怀旧内容创作:周杰伦电影作品混剪致敬青春[41][42] AI技术价值 - 相比传统剪辑技术,AI能实现更丝滑自然的时空转换效果[36] - 创造沉浸式体验,让观众感觉"站在当下"触碰过去[39] - 技术赋能情感连接,实现与过去温柔重逢的可能性[49][50]
科技周报|智元、宇树中标中国移动旗下公司1.2亿元人形机器人采购订单;美团加码“0元购”,沪上阿姨忙到闭店
第一财经· 2025-07-13 12:03
人形机器人行业 - 智元机器人和宇树科技中标中国移动旗下公司1.2亿元人形机器人采购订单,其中智元机器人中标7800万元全尺寸人形双足机器人采购包,宇树科技中标4605万元小尺寸人形双足机器人、算力背包、五指灵巧手采购包 [1] - 该订单是国内已披露的最大金额人形机器人订单,中国移动拥有数亿用户资源,有望推动人形机器人进入更广泛的应用场景 [1] - 智元机器人通过协议转让和部分要约收购方式获得上市公司上纬新材至少63.62%股份,成为控股股东,此举可加速其登陆资本市场进程 [4] 互联网平台竞争 - 摩根士丹利将阿里巴巴美股目标价从180美元下调至150美元,主要因预计其外卖和闪购业务投入达100亿元导致短期盈利承压 [2] - 阿里巴巴、美团、京东在即时零售领域展开激烈竞争,外卖业务补贴大战预计持续至年末 [2] - 美团加码"0元购"策略导致部分奶茶店爆单,平台补贴策略出现分化,淘宝侧重常态化作战,京东聚焦高客单价商品补贴 [3] 半导体行业 - 国产DRAM厂商长鑫科技启动上市辅导,辅导机构为中金公司和中信建投 [5] - 长鑫科技2023年Q1市场份额为6%,预计Q4将提升至7.5%,但面临先进DRAM颗粒技术开发挑战 [5] - TCL科技上半年净利润预增81%-101%至18-20亿元,其中半导体显示业务净利润超46亿元,同比增长超70% [6][7] 显示面板行业 - TCL华星显示面板业务增长主要来自:大尺寸电视面板高端化、IT面板收入增长、OLED业务高端化,以及收购LGD广州8.5代线带来的利润增厚 [6][7] - TCL科技新能源光伏业务TCL中环上半年亏损12-13.5亿元 [7] AI视频生成技术 - 拍我AI(PixVerse)上线多关键帧生成功能,支持上传7张图片生成30秒连贯视频,提升创作者对AI视频叙事的控制力 [8] - 多关键帧技术通过语义解析和动作路径优化实现复杂物理交互,推动AI视频生成从技术验证向产业落地发展 [8]
Z Event|字节、快手、爱诗、生数的同学下班一起聊AI?北京线下AI视频生成局报名中
Z Potentials· 2025-07-13 11:31
活动信息 - 活动时间为2025年7月18日周一晚7点 [1] - 活动地点在北京 具体地点报名后通知 [1] - 活动人数限制为6-7人 [1] - 目标人群为大厂 创业公司产品/技术 创业者 [1] - 活动主题为AI视频生成与场景应用 [1] 招募信息 - 公司正在招募新一期实习生 [3] - 公司寻找有创造力的00后创业者 [5] 活动详情 - 活动形式为小而美的聚餐 [5] - 活动目的是交流想法 分享经验 拓展人脉 [5] - 报名截止时间为活动前一日晚8点 名额有限先到先得 [5] - 公司会根据参与者背景和诉求进行合理组合 [5] - 活动旨在让每位参与者都能有所收获 [5]