FLOW

搜索文档
从案例分析到提示词写作,手把手教你制作最火爆的AI视频
歸藏的AI工具箱· 2025-06-18 14:57
AI视频制作趋势 - AI生成视频在社交媒体平台获得高互动量 包括国内外市场 即使内容看似简单但具有强吸引力 [1][2][3] - AI视频已渗透广告营销领域 案例显示某牙医诊所广告改用"大脚男孩"主题后播放量从数千跃升至56万次 [4] Veo3技术突破 - Veo3显著降低AI视频制作成本 仅需两次生成与简单合并即可完成作品 大幅简化流程 [6] - 模型支持从创意构思到提示词生成的全程自动化 人类仅需筛选点子与复制提示词 [6] - 技术突破跳过传统视频制作的图片生成 语音合成 唇形同步等复杂环节 减少90%工作量 [35] 爆款视频核心要素 - 反差感引擎:通过现代形式呈现古老/虚构内容 或让严肃角色展现生活化特质 制造喜剧效果 [11][14] - 伪纪实手法:模拟真实拍摄增强沉浸感 如采访/Vlog形式强化荒诞性 [12][14] - 共同认知基石:利用历史事件 流行文化IP或文化迷因降低观众理解成本 [13][14] - 情感共鸣点:将宏大叙事转化为普通人吐槽 如暴风兵抱怨"混蛋老板"引发打工人共情 [23] 创意生产方法论 - 使用NotebookLM交叉分析多个爆款视频 提取分镜结构 台词内容及爆火原因 [8][9][10] - 通过Gemini生成新创意 需包含8秒分镜的详细环境 角色 台词描述 优先选择现实题材 [17][18][21] - 提供两类标准化提示词模板:第一人称Vlog强调主观镜头 虚构采访侧重权威角色与金融黑话反差 [29][30][32][33] 视频生成流程优化 - 推荐使用Gemini Pro会员或FLOW工具 后者需切换至Veo3 Fast模型控制成本 [37][40] - 后期仅需基础剪辑拼接 可添加台标 滚动文字等元素增强伪纪实感 [44] - 支持1080P超分输出提升画质 未来视频类Agent有望进一步简化字幕等包装工作 [45][46] 行业影响 - Veo3推动AI视频制作门槛降低 每日新增爆款视频覆盖多品类 验证技术应用潜力 [44][46] - 每减少一个制作环节可拓展10倍创作者基数 技术普及将释放潜在内容生产力 [44][46]
Veo3逼真脱口秀火爆全网,视频生成的GPT时刻到了吗?
第一财经· 2025-05-26 14:38
2025.05. 26 本文字数:3653,阅读时长大约6分钟 导读 : "瑕疵非常多,也很贵。" 作者 | 第一财经 刘晓洁 吕倩 "如果AI生成的角色拒绝相信他们是AI生成的,会怎么样?" 近日,海外博主用谷歌最新视频模型Veo 3生成的一些人物视频火了。在这些视频中,有一群人集体高 呼抗议"We're not prompts(我们不是提示词)",还有一位男士举着手机自拍,背景是美妙的高山峡 谷,他指着身后,"你想说我背后的完美创造物,仅仅是0和1的结果,一串二进制代码,再无其他?这 不合理。" 当然台词和剧本是人创作的,但由AI生成的这些人物和场景都极具真实感,无论是光线在人脸上投下的 阴影与高光,还是人物的长相、口型,在阳光下眯起眼睛的神态都极为自然。配合Veo 3新的原生音频 生成功能,人们再一次惊呼"真实不存在了"。 事实是否真的如此,视频生成的GPT时刻终于来了吗?第一财经记者采访的Veo 3的使用者们并不这么 认为。AI Talk主理人、AIGC创作者汗青提到,Veo 3确实是很好的技术,但并没有网传那么夸张,例 如视频生成质量有提升但不惊艳,价格不低,现阶段对实际生产帮助还不大。 AIGC创 ...
Veo3逼真脱口秀火爆全网,视频生成的GPT时刻到了吗?
第一财经· 2025-05-26 11:02
Veo 3技术特点 - Veo 3新增原生音频生成功能,可同步生成环境音和人物对话,突破视频生成的"无声时代"[4] - 模型实现真正原生多模态,文字生成动画同时自动完成音乐、音效、配音和对口型,大幅简化工作流程[7] - 视频生成质量显著提升,光线处理、人物神态和长镜头运动具有电影质感,但存在LOGO显示错误等一致性瑕疵[4][12] - 对复杂物理现象的推断能力是其逼真效果的核心,谷歌通过严格数据质量管理优化模型性能[10][11] 市场应用与成本效益 - 商业应用案例显示,传统50万美元的广告制作可被500美元Veo 3积分替代,成本降低约1000倍[7] - AI制作电影成本估算为9万美元/3小时,相比好莱坞传统制作便宜10-20倍[10] - 个人创作者使用Veo 3生成1.5分钟短片成本约70美元(6000-7000积分),但成片率受文生视频不可控性影响[16] - 订阅成本高昂,商业用户需支付每月249.99美元套餐费(前三月优惠价124.99美元),额外积分按1.5美元/8秒计费[16] 行业影响与局限性 - 技术被视为AI影像工作流雏形,可能颠覆传统影视制作模式,类似数码相机终结柯达垄断的变革[10] - 当前主要适用于文生视频场景,但行业主流工作流依赖图生视频,导致实际生产应用受限[15] - 中文支持不足,存在台词丢失、对话主体混乱等技术缺陷,8秒视频容量达到对话上限[14] - 谷歌凭借YouTube数据资源优势持续优化模型,但行业普遍认为尚未达到"GPT时刻"级突破[12][17] 创作者评价 - 专业创作者肯定其效率提升价值,但指出视频生成质量"低于预期",与国内第一梯队产品图生效果相当[3][15] - 现阶段工具更适合氪金玩家或商业项目,普通用户面临价格门槛和技术瑕疵双重限制[17] - FLOW剪辑工具的推出预示AI影像新工作流可能性,但完全替代传统流程仍需长期迭代[4][15]
每月1800元!谷歌推出最贵AI全家桶,谁买单?
第一财经· 2025-05-21 17:16
谷歌2025年I/O开发者大会核心动态 基础模型更新 - Gemini 2.5 Pro及2.5 Flash预览版占据大模型竞技场LMArena前两名,超越ChatGPT-4o [4][5] - Gemini 2.5 Flash主打生成速度与低成本,开发者接受度高 [5] - 深度思考模型Deep Think 2.5 Pro在美国数学奥赛(USAMO)得分率达40.4% [6] - Gemini系列Elo等级分一年半内提升300+分 [6] 多模态与创作工具 - 视频模型Veo 3新增原生音频生成功能,结束视频"无声时代" [6] - 图像生成工具Image4与电影制作工具FLOW集成多模态模型(Veo/Imagen/Gemini) [6] - 现场演示高清生成动画,实现音画同步 [6] AI应用生态拓展 - Gemini Live开放Android全用户,支持实时语音/视觉交互(如烘焙指导) [8] - 模型集成至搜索引擎/Chrome浏览器,新增内容总结功能 [8] - 发布3D视频通信平台Google Beam与异步代码助手Jules [8] 硬件布局 - Project Moohan头显与XR眼镜定位"空间计算革新",合作三星/XREAL开发 [9] - 硬件未公布上市时间与价格,仍属"期货"项目 [16] 商业模式与定价 - 推出行业最贵订阅服务AI Ultra(249.99美元/月),较ChatGPT Pro高50美元 [3][16] - AI Ultra捆绑云业务/无广告YouTube权益,瞄准高端专业用户 [16][17] - 公司通过高价策略筛选高价值客户,反哺模型迭代 [17] 搜索业务转型 - AI概览功能覆盖15亿用户,但威胁传统广告点击收入 [20] - 新增AI Mode深度搜索模式,可跨平台整合票务/生成专家报告 [20] - Search Live支持实时摄像头交互,提供语音解答 [20] 竞争与挑战 - 搜索业务面临OpenAI(拟推NLWeb浏览器)与Perplexity(估值140亿美元)冲击 [19][21] - Gemini月活超4亿(较去年10月增长4倍),但仍落后ChatGPT(6亿月活) [21] - 反垄断诉讼要求拆分Chrome,潜在收购方含OpenAI/Perplexity [21] - 公司股价较1月高点下跌20%,总市值1.99万亿美元 [18][19]
Veo3和FLOW一手实测:谷歌这次成了,这次视频创作可能彻底变天
歸藏的AI工具箱· 2025-05-21 15:18
谷歌视频模型Veo3和FLOW产品测评 核心观点 - 谷歌Veo3视频模型整合音效生成、语音同步及唇形同步技术,显著提升视频生成可用性,对剪辑软件、数字人产品形成降维打击[1][2][3] - FLOW作为配套AI视频创作工具,支持文生视频、图生视频及素材编排,填补谷歌在AI视频创作领域的空白[15][18][20] - 模型在复杂运动、多分镜一致性、长视频延长等场景表现优异,可生成游戏画面、ASMR内容及历史人物教学视频[5][6][7][8][9] Veo3技术特性 - **多模态生成**:同步生成环境音、语音并实现精准唇形同步,支持跨分镜人物一致性[2][7][11] - **复杂场景处理**:篮球运动音效(球鞋摩擦、篮筐碰撞声)准确率100%,游戏UI与人物动作符合提示词要求[5][6] - **长视频能力**:支持视频延长至16秒以上,保持内容连贯性,可生成完整ASMR视频[8][9][28] FLOW产品功能 - **创作模式**:支持文生视频(英文提示词)、图生视频(首尾帧控制)及三图素材风格迁移[18][20][21] - **剪辑编排**:Scenebuilder模块可调整分镜顺序,通过进度条定位插入点,导出1080P超清视频[23][25][26] - **延长技巧**:需切换至首尾帧模式并定位最后一帧,避免退回素材库中断生成[28] 行业应用场景 - **数字人领域**:实现多人唇形同步,播客对谈场景中语音与表情情绪100%匹配[11][12][13] - **教育内容**:生成牛顿讲解万有引力等历史人物教学视频,分镜切换时间可压缩至2秒内[7] - **UGC创作**:一键生成带环境音的ASMR视频,大幅降低专业级视频制作门槛[8][9][10]
indiGOtech Closes Strategic Funding Round from Industry Giants to Accelerate Sustainable Ride Hail and Delivery for Communities
Prnewswire· 2025-04-30 00:00
融资与战略合作 - 公司完成5400万美元BB轮融资 投资方包括FedEx、Foxconn和FM Capital [1] - 此轮战略融资将加速公司SmartWheels™技术开发及GO Loop服务启动 [5] - 已签署TD Cowen作为投资银行筹备2025年底的C轮融资 [5] 核心技术与产品 - 专利技术SmartWheels™集成智能悬挂和推进系统 提供"魔毯般"驾驶体验 [3] - DASH车型具备90立方英尺空间、110英里续航 税后售价约2万美元 2025年Q4交付 [3] - FLOW车型采用全线控驱动 配备185立方英尺空间、200+英里续航 支持轮椅无障碍进出 [3][4] - 收购无人配送车辆提供商Clevon 强化自动驾驶系统(ADS)能力 [4] 商业模式与服务 - 通过GO Loop服务中心提供车辆维护/充电/维修服务 降低司机运营成本 [1] - 为网约车和配送公司提供更具成本效益的电动化解决方案 [2] - FLOW车型采用中央驾驶座舱设计 支持人工驾驶与自动驾驶模式快速切换 [4] 市场定位与愿景 - 瞄准可持续本地出行市场 解决当前电动车成本高/充电难/维修贵痛点 [1] - 团队由MIT创业者领导 CEO曾主导三星支付等4个规模化科技项目 [2] - 在美国、欧洲和亚洲布局团队 推动可持续网约车及配送解决方案创新 [5] 公司背景 - 定位为新一代移动科技公司 专注于智能电动车及运输服务 [6] - 核心产品包括FLOW系列智能电动车和GO Loop本地电动交通服务(LETS) [6]