FLOW

搜索文档
从案例分析到提示词写作,手把手教你制作最火爆的AI视频
歸藏的AI工具箱· 2025-06-18 14:57
AI视频制作趋势 - AI生成视频在社交媒体平台获得高互动量 包括国内外市场 即使内容看似简单但具有强吸引力 [1][2][3] - AI视频已渗透广告营销领域 案例显示某牙医诊所广告改用"大脚男孩"主题后播放量从数千跃升至56万次 [4] Veo3技术突破 - Veo3显著降低AI视频制作成本 仅需两次生成与简单合并即可完成作品 大幅简化流程 [6] - 模型支持从创意构思到提示词生成的全程自动化 人类仅需筛选点子与复制提示词 [6] - 技术突破跳过传统视频制作的图片生成 语音合成 唇形同步等复杂环节 减少90%工作量 [35] 爆款视频核心要素 - 反差感引擎:通过现代形式呈现古老/虚构内容 或让严肃角色展现生活化特质 制造喜剧效果 [11][14] - 伪纪实手法:模拟真实拍摄增强沉浸感 如采访/Vlog形式强化荒诞性 [12][14] - 共同认知基石:利用历史事件 流行文化IP或文化迷因降低观众理解成本 [13][14] - 情感共鸣点:将宏大叙事转化为普通人吐槽 如暴风兵抱怨"混蛋老板"引发打工人共情 [23] 创意生产方法论 - 使用NotebookLM交叉分析多个爆款视频 提取分镜结构 台词内容及爆火原因 [8][9][10] - 通过Gemini生成新创意 需包含8秒分镜的详细环境 角色 台词描述 优先选择现实题材 [17][18][21] - 提供两类标准化提示词模板:第一人称Vlog强调主观镜头 虚构采访侧重权威角色与金融黑话反差 [29][30][32][33] 视频生成流程优化 - 推荐使用Gemini Pro会员或FLOW工具 后者需切换至Veo3 Fast模型控制成本 [37][40] - 后期仅需基础剪辑拼接 可添加台标 滚动文字等元素增强伪纪实感 [44] - 支持1080P超分输出提升画质 未来视频类Agent有望进一步简化字幕等包装工作 [45][46] 行业影响 - Veo3推动AI视频制作门槛降低 每日新增爆款视频覆盖多品类 验证技术应用潜力 [44][46] - 每减少一个制作环节可拓展10倍创作者基数 技术普及将释放潜在内容生产力 [44][46]
Veo3逼真脱口秀火爆全网,视频生成的GPT时刻到了吗?
第一财经· 2025-05-26 14:38
视频生成技术进展 - Veo 3新增原生音频生成功能,可同步生成环境音和人物对话,突破视频生成的"无声时代" [6] - 配合FLOW剪辑工具形成新一代AI影像工作流雏形,实现文字生成动画的一站式体验 [6][8] - 生成质量显著提升,8秒视频成本1.5美元,相比传统影视制作成本降低10-20倍 [9][12] 技术优势与突破 - 真正实现原生多模态生成,简化传统分步工作流程 [8] - 依托YouTube海量视频数据进行训练,数据质量管理严格 [13] - 具备复杂物理现象推断能力,提升画面真实感 [12] 现存技术局限 - 生成一致性难把控,存在丢台词、对话主体混乱等问题 [16] - 中文支持不佳,错误率较高 [16] - 文生视频模式与主流图生工作流不匹配,商业应用受限 [17] 商业化挑战 - 订阅费用高昂,Ultra套餐每月249.99美元 [18] - 商业项目需额外购买积分,1分半视频成本约70美元 [19] - 成片率低导致实际使用成本进一步上升 [19] 行业影响 - 显著降低创作门槛,可能颠覆传统影视制作模式 [12][13] - 个人创作者可产出质量接近专业团队的作品 [13] - 目前仍处早期阶段,指令遵循是基础性挑战 [16]
Veo3逼真脱口秀火爆全网,视频生成的GPT时刻到了吗?
第一财经· 2025-05-26 11:02
Veo 3技术特点 - Veo 3新增原生音频生成功能,可同步生成环境音和人物对话,突破视频生成的"无声时代"[4] - 模型实现真正原生多模态,文字生成动画同时自动完成音乐、音效、配音和对口型,大幅简化工作流程[7] - 视频生成质量显著提升,光线处理、人物神态和长镜头运动具有电影质感,但存在LOGO显示错误等一致性瑕疵[4][12] - 对复杂物理现象的推断能力是其逼真效果的核心,谷歌通过严格数据质量管理优化模型性能[10][11] 市场应用与成本效益 - 商业应用案例显示,传统50万美元的广告制作可被500美元Veo 3积分替代,成本降低约1000倍[7] - AI制作电影成本估算为9万美元/3小时,相比好莱坞传统制作便宜10-20倍[10] - 个人创作者使用Veo 3生成1.5分钟短片成本约70美元(6000-7000积分),但成片率受文生视频不可控性影响[16] - 订阅成本高昂,商业用户需支付每月249.99美元套餐费(前三月优惠价124.99美元),额外积分按1.5美元/8秒计费[16] 行业影响与局限性 - 技术被视为AI影像工作流雏形,可能颠覆传统影视制作模式,类似数码相机终结柯达垄断的变革[10] - 当前主要适用于文生视频场景,但行业主流工作流依赖图生视频,导致实际生产应用受限[15] - 中文支持不足,存在台词丢失、对话主体混乱等技术缺陷,8秒视频容量达到对话上限[14] - 谷歌凭借YouTube数据资源优势持续优化模型,但行业普遍认为尚未达到"GPT时刻"级突破[12][17] 创作者评价 - 专业创作者肯定其效率提升价值,但指出视频生成质量"低于预期",与国内第一梯队产品图生效果相当[3][15] - 现阶段工具更适合氪金玩家或商业项目,普通用户面临价格门槛和技术瑕疵双重限制[17] - FLOW剪辑工具的推出预示AI影像新工作流可能性,但完全替代传统流程仍需长期迭代[4][15]
每月1800元!谷歌推出最贵AI全家桶,谁买单?
第一财经· 2025-05-21 17:16
谷歌2025年I/O开发者大会核心动态 基础模型更新 - Gemini 2.5 Pro及2.5 Flash预览版占据大模型竞技场LMArena前两名,超越ChatGPT-4o [4][5] - Gemini 2.5 Flash主打生成速度与低成本,开发者接受度高 [5] - 深度思考模型Deep Think 2.5 Pro在美国数学奥赛(USAMO)得分率达40.4% [6] - Gemini系列Elo等级分一年半内提升300+分 [6] 多模态与创作工具 - 视频模型Veo 3新增原生音频生成功能,结束视频"无声时代" [6] - 图像生成工具Image4与电影制作工具FLOW集成多模态模型(Veo/Imagen/Gemini) [6] - 现场演示高清生成动画,实现音画同步 [6] AI应用生态拓展 - Gemini Live开放Android全用户,支持实时语音/视觉交互(如烘焙指导) [8] - 模型集成至搜索引擎/Chrome浏览器,新增内容总结功能 [8] - 发布3D视频通信平台Google Beam与异步代码助手Jules [8] 硬件布局 - Project Moohan头显与XR眼镜定位"空间计算革新",合作三星/XREAL开发 [9] - 硬件未公布上市时间与价格,仍属"期货"项目 [16] 商业模式与定价 - 推出行业最贵订阅服务AI Ultra(249.99美元/月),较ChatGPT Pro高50美元 [3][16] - AI Ultra捆绑云业务/无广告YouTube权益,瞄准高端专业用户 [16][17] - 公司通过高价策略筛选高价值客户,反哺模型迭代 [17] 搜索业务转型 - AI概览功能覆盖15亿用户,但威胁传统广告点击收入 [20] - 新增AI Mode深度搜索模式,可跨平台整合票务/生成专家报告 [20] - Search Live支持实时摄像头交互,提供语音解答 [20] 竞争与挑战 - 搜索业务面临OpenAI(拟推NLWeb浏览器)与Perplexity(估值140亿美元)冲击 [19][21] - Gemini月活超4亿(较去年10月增长4倍),但仍落后ChatGPT(6亿月活) [21] - 反垄断诉讼要求拆分Chrome,潜在收购方含OpenAI/Perplexity [21] - 公司股价较1月高点下跌20%,总市值1.99万亿美元 [18][19]
Veo3和FLOW一手实测:谷歌这次成了,这次视频创作可能彻底变天
歸藏的AI工具箱· 2025-05-21 15:18
谷歌视频模型Veo3和FLOW产品测评 核心观点 - 谷歌Veo3视频模型整合音效生成、语音同步及唇形同步技术,显著提升视频生成可用性,对剪辑软件、数字人产品形成降维打击[1][2][3] - FLOW作为配套AI视频创作工具,支持文生视频、图生视频及素材编排,填补谷歌在AI视频创作领域的空白[15][18][20] - 模型在复杂运动、多分镜一致性、长视频延长等场景表现优异,可生成游戏画面、ASMR内容及历史人物教学视频[5][6][7][8][9] Veo3技术特性 - **多模态生成**:同步生成环境音、语音并实现精准唇形同步,支持跨分镜人物一致性[2][7][11] - **复杂场景处理**:篮球运动音效(球鞋摩擦、篮筐碰撞声)准确率100%,游戏UI与人物动作符合提示词要求[5][6] - **长视频能力**:支持视频延长至16秒以上,保持内容连贯性,可生成完整ASMR视频[8][9][28] FLOW产品功能 - **创作模式**:支持文生视频(英文提示词)、图生视频(首尾帧控制)及三图素材风格迁移[18][20][21] - **剪辑编排**:Scenebuilder模块可调整分镜顺序,通过进度条定位插入点,导出1080P超清视频[23][25][26] - **延长技巧**:需切换至首尾帧模式并定位最后一帧,避免退回素材库中断生成[28] 行业应用场景 - **数字人领域**:实现多人唇形同步,播客对谈场景中语音与表情情绪100%匹配[11][12][13] - **教育内容**:生成牛顿讲解万有引力等历史人物教学视频,分镜切换时间可压缩至2秒内[7] - **UGC创作**:一键生成带环境音的ASMR视频,大幅降低专业级视频制作门槛[8][9][10]
indiGOtech Closes Strategic Funding Round from Industry Giants to Accelerate Sustainable Ride Hail and Delivery for Communities
Prnewswire· 2025-04-30 00:00
融资与战略合作 - 公司完成5400万美元BB轮融资 投资方包括FedEx、Foxconn和FM Capital [1] - 此轮战略融资将加速公司SmartWheels™技术开发及GO Loop服务启动 [5] - 已签署TD Cowen作为投资银行筹备2025年底的C轮融资 [5] 核心技术与产品 - 专利技术SmartWheels™集成智能悬挂和推进系统 提供"魔毯般"驾驶体验 [3] - DASH车型具备90立方英尺空间、110英里续航 税后售价约2万美元 2025年Q4交付 [3] - FLOW车型采用全线控驱动 配备185立方英尺空间、200+英里续航 支持轮椅无障碍进出 [3][4] - 收购无人配送车辆提供商Clevon 强化自动驾驶系统(ADS)能力 [4] 商业模式与服务 - 通过GO Loop服务中心提供车辆维护/充电/维修服务 降低司机运营成本 [1] - 为网约车和配送公司提供更具成本效益的电动化解决方案 [2] - FLOW车型采用中央驾驶座舱设计 支持人工驾驶与自动驾驶模式快速切换 [4] 市场定位与愿景 - 瞄准可持续本地出行市场 解决当前电动车成本高/充电难/维修贵痛点 [1] - 团队由MIT创业者领导 CEO曾主导三星支付等4个规模化科技项目 [2] - 在美国、欧洲和亚洲布局团队 推动可持续网约车及配送解决方案创新 [5] 公司背景 - 定位为新一代移动科技公司 专注于智能电动车及运输服务 [6] - 核心产品包括FLOW系列智能电动车和GO Loop本地电动交通服务(LETS) [6]