Google Veo 3

搜索文档
AI视频商用50万/分钟?!快手可灵负责人爆料信息量好大
量子位· 2025-08-30 14:40
AI视频制作市场现状 - AI视频制作市场价格最高达50万元/分钟 [2] - 日常接单价格集中在数千至5万元/分钟区间 [4] - 快手可灵AI生成1分钟视频成本约42元 全球第一梯队价格水平 [4] - Google Veo 3生成1分钟1080p带音效视频成本约260元 [4] 快手AI技术体系升级 - 上线OneRec生成式推荐模型 采用端到端生成推荐机制 [11] - 替代传统"召回-粗排-精排"三段式结构 计算复杂度大幅降低 [12][15] - 已接管25%推荐流量池 计算成本降至原来1/10 [14][16] - 采用机制模型EMER作为奖励系统 优化推荐排序 [22] - 联合技术使App时长提升2.5% DAU提升0.25% [23] 多模态内容识别技术 - 采用Keye多模态大模型生成多维度视频标签 [25][26] - 内容标签识别准召率提升10个百分点 [28] - 应用算法推荐后人均App时长提升0.2% [28] 创作者服务AI化 - 推出AI内容助手工具 含灵感推荐/标题生成/发布时间建议等功能 [30] - 通过分析粉丝偏好帮助创作者实现涨流量和涨粉 [31] AI内容生态发展趋势 - 平台近1亿用户使用AI参与内容创作 [36] - 2024年1-7月AI内容流量增长320% 达年初4倍以上 [38] - 上半年AI创作者收益同比提升159% [39] - AI漫剧赛道崭露头角 具备制作周期短/成本低/画质2K等特点 [41][42] 公司战略定位 - AI技术已渗透内容制作/分发/消费/变现全链条 [8] - 平台成为AIGC时代重要观察样本 具备生态规模大/创作者多/反馈及时等特征 [35]
关于 AI Infra 的一切 | 42章经
42章经· 2025-08-10 22:04
AI Infra的定义与架构 - AI Infra包括硬件和软件两部分 硬件指AI芯片 GPU 交换机等设备 软件层面类比云计算分为三层 [3][4] - 最底层类似IaaS 解决基础计算 通信和存储问题 中间层类似PaaS 包含资源调度 资源管理等平台 MaaS归属这一层 [4][5] - 最上层近似SaaS应用层 但在AI Infra领域更倾向于理解为训练及推理框架的优化层 [5] AI Infra的发展历程 - 第一批AI Infra人如贾扬清 李沐 陈天奇等有算法背景 他们为充分利用GPU而开发AI Infra [6] - 第二批AI Infra人主要推动AI Infra在工业界的规模化应用 [6] - 大模型兴起使AI Infra进入主舞台 类似搜索引擎兴起时的机会窗口 可能十年二十年才出现一次 [7][9][10] AI Infra与传统Infra的差异 - AI Infra绝对核心是GPU 传统Infra核心是CPU [11] - AI Infra需要更极致 更贴合AI特殊需求 太阳底下没有太多新鲜事但要做到更极致 [12] - Infra人才相比算法更强调积累 算法依赖年轻人而Infra需要长期经验 [14] AI Infra的核心指标与价值 - 线上服务侧关注首字延迟 吐字稳定性 整体成本 训练侧关注每张GPU处理数据量和训练效率 [15] - 优化Infra可显著降低成本 例如1万张GPU每月租金1亿 利用率提升10%可节省1000万 [18][19] - 小公司可通过对比云厂商方案决定是否自建Infra 云服务商价值在于帮助小公司节省优化成本 [20][21] AI Infra的商业模式 - 第三方公司短期价值在于提供API集贸市场 让客户自由选择不同API [22] - 长期来看 第三方需与硬件或模型垂直整合才能建立壁垒 避免被云厂商或模型公司取代 [24][25] - MaaS服务商可通过与硬件厂商深度合作获得差异化优势 类似游戏机独占游戏 [26][27][28] AI Infra与模型效果 - Infra水平影响模型效果 优化更好的Infra可在相同算力下多学20%数据 提升模型效果 [36][37] - MFU是常见指标但单一指标难判断优劣 DeepSeek的MFU偏低但Infra并不差 [37][38] - DeepSeek成功关键在于选对优化目标 即给定推理成本训出最好模型 而非传统训练算力优化 [39][40][41] AI Infra的未来趋势 - 当前最重要指标是decoding速度 直接影响线上业务成本和强化学习效率 [44] - 多模态仍有突破可能性 需实现理解和生成的统一 类似GPT-3.5让专用模型退休 [63][64] - 开源模型促进AI Infra发展但也可能阻碍创新 如过度优化Llama影响新范式探索 [69] AI Infra的组织架构 - 理想协作是Infra 算法 数据团队共同决策 大厂中Infra常被视为支持角色缺乏影响力 [46][47][49] - 合理架构应是Infra人设计模型结构 数据人负责刷分 算法人主攻训练范式革新 [54] - 大厂人才结构错配 如DeepSeek Infra工程师多于算法工程师 而多数大厂相反 [81][82] AI Infra的创业机会 - 训练侧商业模式难成立 因训练方不愿泄露核心竞争力 推理侧如加速优化仍有机会 [67][68] - 国产芯片需专门设计模型结构提升性价比 Step 3开源模型支持国产卡商用并达到SOTA [69][73][74] - 多模态成本有望大幅下降 理解已不贵但生成仍贵 视频生成一年后可能降至几分之一 [75][76][77]
顶尖AI模型加持、吹响全球创意集结号,爱奇艺(IQ.US)启动“与AI共生”短片创作大赛
智通财经网· 2025-07-11 18:25
行业动态 - 2025年AI视频生成模型技术快速迭代,谷歌发布集成原生音频功能的Veo 3,火山引擎推出国产视频生成模型Seedance1.0 pro,显著提升创作效率与艺术表达可能性 [1] - 在线视频平台积极推动AI工具落地应用,爱奇艺通过"与AI共生"短片创作大赛全球征集作品,提供免费AI工具(Seedance 1.0 pro和Google Veo 3)降低创作门槛 [1][10] - AI视频生成行业呈现全球化竞争格局,中国厂商(火山引擎)与国际巨头(谷歌)同台竞技,技术差异化体现在音频集成、本土化适配等方向 [1] 公司战略 - 爱奇艺将AI技术深度融入内容全生命周期,其"影像工坊"2025年Q1产出10万张AI设计图,"大星罗"平台实现视频自动化生产,"缪斯"工具年生成64万条短视频,总播放量达108亿次 [3] - 公司通过赛事构建AI创作生态,联合中传、北电等高校专家及《新神榜:杨戬》导演等业界人士组成评审团,从创意、技术运用等5维度评估作品,强化行业影响力 [2][3] - 战略定位从工具赋能转向协同创作,提出"AI是创作伙伴"理念,目标重塑影视行业生产范式,推动技术标准建立(要求作品AI工具使用量≥70%) [3][13] 赛事运营 - 赛制设计体现专业化与国际化,设置初审(合规审核)+终审(专家评审)两阶段,接受戏剧/动画/竖屏微剧等多元体裁,要求作品含中英字幕且分辨率≥1080P [2][4][13] - 奖金激励体系分层明确,总奖金超1万美元,设一二三等奖(3000/1500/600美元)及最佳创意/叙事单项奖(800美元),获奖作品获爱奇艺国际版专题展示 [5][14][15] - 配套支持体系完善,提供技术培训(AI专家指导)、版权合规咨询、赛事社群答疑等服务,解决创作者从工具使用到内容分发的全流程需求 [6][15] 技术应用 - 视频生成工具性能指标成为竞争焦点,指定工具需覆盖作品70%以上制作环节,强调原生音频生成等差异化功能对创作体验的提升 [1][13] - AI自动化生产已实现规模化应用,爱奇艺AI工具年产量达数十万级别,108亿播放量验证市场接受度,技术正从辅助生产向创意协同演进 [3] - 技术规范要求作品符合多地区法律,内容需规避色情/暴力/政治敏感等元素,体现平台对AI生成内容风险管控的重视 [13]
计算机行业周报(20250616-20250620):AIASMR现象级表现,多模态加速进入市场-20250622
华创证券· 2025-06-22 23:21
报告行业投资评级 - 计算机行业投资评级为推荐(维持)[3] 报告的核心观点 - 本周计算机(中信)指数下滑1.87%,落后创业板指0.21个百分点,行业排名17/30;全部A股资金合计净流出2700.12亿,计算机资金净流出210.45亿 [6][16][19] - 海外AI多模态持续推新,国内产业蓄势待发,随着大模型在多模态领域能力不断提升,今年下半年有望迎来多模态应用生态全面繁荣;计算机板块进入业绩披露期,市场主要矛盾将转移到业绩兑现及产业快速变革双主线上 [6][9] - Google Veo 3模型相比前代有质的飞跃,实现视觉、语音和音效完美同步生成,带来音画同步生成、唇形同步、物理效果模拟、镜头语言等关键突破 [6][10][22] - Llama 4系列模型具有大规模、多模态、长文本特点,参数规模大、多模态能力突出、长文本处理能力有突破 [6][11][23] - 海内外AI催化不断,建议关注AI企业级服务及场景落地机会,包括A股和海外侧不同领域的相关企业 [6][12][24] 根据相关目录分别进行总结 行业周观点 - 本周计算机(中信)指数下滑1.87%,创业板指数下降1.66%,上证指数下滑0.51%;板块周涨幅前三为楚天龙(36.59%)、四方精创(29.21%)、朗新集团(13.72%),跌幅前三为新北洋(-12.65%)、ST迪威迅(-12.63%)、国联股份(-11.27%) [6][9] - 海外AI多模态持续推新,国内MiniMax推出视频生成模型MiniMax Hailuo 02等产品;6月17日达梦披露2025H1业绩预告,收入高增40.63%-45.74% [6][9] 周行情(06.16 - 06.20)回顾 - 本周计算机(中信)指数下滑1.87%,落后创业板指0.21个百分点,行业排名17/30 [16] 资金情况回顾 - 本周全部A股资金合计净流出2700.12亿,计算机资金净流出210.45亿 [19] 多模态模型逐步进步,AI模型快速达到“以假乱真” Google Veo 3:AI视频生成新巅峰 - 2025年5月21日Google发布Veo3模型,相比前代有质的飞跃,实现视觉、语音和音效完美同步生成,带来音画同步生成、唇形同步、物理效果模拟、镜头语言等关键突破 [10][20][22] Meta Llama 4:原生多模态模型 - 2025年4月6日Meta发布Llama 4系列首批模型,具有大规模、多模态、长文本特点,参数规模大、多模态能力突出、长文本处理能力有突破 [11][20][23] 投资建议与受益标的 - A股AI应用方向建议关注办公、金融、大模型等多个领域相关企业 [24] - 海外侧建议关注办公、金融、工业等多个领域相关企业 [25]