Workflow
谷歌(GOOG)
icon
搜索文档
被立案调查,携程跌超10%;特朗普称苹果已投资英特尔,后者涨逾4%;特斯拉将停售FSD买断版,全面转向订阅制模式【美股盘前】
每日经济新闻· 2026-01-14 19:28
美股期指与市场情绪 - 截至发稿,道指期货跌0.16%、标普500指数期货跌0.18%、纳指期货跌0.22% [1] 携程集团 - 携程股价跌超10%,因市场监管总局依据《中华人民共和国反垄断法》对其涉嫌滥用市场支配地位实施垄断行为立案调查 [1] 特斯拉 - 特斯拉CEO马斯克宣布,自2月14日起全球市场将停止销售FSD(完全自动驾驶能力)一次性买断版,此后该功能仅以月度订阅形式提供 [1] 黄金与白银市场 - 花旗集团分析师将黄金未来三个月的目标价上调至5000美元/盎司,但预计达到高位后可能出现回调 [1] - 国际银价首次突破90美元/盎司创历史新高,总市值突破5万亿美元,超越英伟达成为全球第二大资产 [1] 谷歌 - 谷歌宣布推出新一代开源医疗AI模型MedGemma 1.5,以增强医学影像支持功能,股价截至发稿涨0.5% [2] 英伟达 - 美国政府批准英伟达向中国出口其人工智能芯片H200,预计将重启该芯片对中国客户的出货 [2] 英特尔 - 英特尔盘前股价涨超4%,消息源于白宫官方视频中特朗普透露“苹果公司已出手投资英特尔”,但苹果与英特尔尚未证实此事 [2] Rivian - 美国电动车制造商Rivian盘前股价跌超3%,公司宣布召回部分2022至2025年款R1T皮卡和R1S SUV共计19641辆,原因是维修流程错误可能导致后悬架部件在行驶中分离 [2] 美国经济数据 - 北京时间今晚21:30将发布美国11月零售销售和11月PPI数据 [3]
Women's, advocacy groups call on Apple, Google to drop X and Grok from app stores
Reuters· 2026-01-14 19:03
行业监管与平台治理 - 一个由妇女团体、科技监督机构和进步活动人士组成的联盟正呼吁Alphabet旗下的谷歌和苹果公司从其应用商店中移除社交媒体平台X及其相关聊天机器人Grok [1] - 该行动表明非政府组织和活动团体对大型科技平台的内容治理政策施加外部压力的趋势正在加强 [1] 公司业务与产品 - 社交媒体平台X及其人工智能聊天机器人Grok成为外部团体要求下架的目标 [1] - 谷歌和苹果作为主要移动应用分发渠道,其应用商店政策面临外部团体的直接诉求 [1]
苹果谷歌达成多年AI深度合作:马斯克强烈反对,中国市场布局引关注
搜狐财经· 2026-01-14 18:38
合作核心内容 - 苹果与谷歌达成多年期深度合作协议 苹果下一代基础模型将基于谷歌Gemini模型及云技术构建 为Apple Intelligence及今年推出的个性化Siri提供核心技术支持 [1] - 谷歌提供的Gemini模型参数量高达1.2万亿 远超苹果当前自研的1500亿参数模型 将显著提升苹果AI的性能表现 [3] - 苹果明确表示将维持与Open AI的现有合作协议 ChatGPT已整合进苹果系统负责处理复杂知识型与生成式查询 谷歌Gemini则聚焦苹果AI架构的内核层 二者形成功能互补 [12] 合作细节与影响 - Apple Intelligence将继续在苹果设备及私有云计算环境中运行 严格遵循苹果既定的隐私标准 用户数据不会完全交由谷歌处理 [5] - 此次合作为谷歌Gemini模型打开了全球数十亿台iPhone的原生入口 有望缓解其在C端市场面临ChatGPT的竞争压力 [5] - 合作消息公布后 特斯拉与xAI创始人埃隆・马斯克在X平台连续发文表达强烈不满 认为将加剧科技行业的“权力集中” 该言论已获得超过17万次转发和100万次点赞 [11] 合作动因与短期策略 - 分析师指出 苹果选择与谷歌合作是迫于短期挑战 包括WWDC上的AI功能展示已无失败空间 必须拿出具备竞争力的产品 以及用户对AI服务质量的期待持续提升 亟需更强的设备端AI模型支撑 [7] - 设备端AI短期内难以直接推动硬件出货量增长 但此次合作能有效缓解苹果来自行业竞争与用户期待的双重压力 [9] - 此次与谷歌的合作或仅为短期过渡性策略 [21] 长期战略与自研计划 - 分析师强调 AI终将成为硬件、操作系统与用户体验的核心 特斯拉FSD的成功案例已证明核心AI技术自主掌控的重要性 因此苹果长期仍需攻克AI核心技术掌控力的难题 [9] - 苹果自研AI服务器芯片预计将于2026年下半年量产 自有数据中心则计划在2027年启动建设并运营 [19] - 苹果对设备端AI的需求有望从2027年开始出现显著增长 [19] 中国市场策略 - 受数据安全、合规等监管要求限制 国行版AI Siri引入海外模型的可能性较低 [15] - 行业普遍预测 苹果在中国市场可能采取两种路径 一是继续沿用或升级自研AI模型 二是与国内具备大模型及云服务能力的头部科技企业展开合作 阿里巴巴等企业被视为潜在合作对象 [17] - 苹果尚未披露中国市场的具体合作规划 [17]
Gemini登陆iPhone:谷歌夺下15亿移动入口,苹果赢得时间,OpenAI遭分流
新浪财经· 2026-01-14 18:20
合作核心内容 - 苹果与谷歌正式达成一项重要人工智能合作协议 将谷歌的Gemini大模型深度集成至苹果生态系统 为升级版Siri及其他Apple Intelligence功能提供核心技术支持[1] - 苹果经过慎重考虑 认定谷歌的人工智能技术为Apple Foundation Models提供了最强大的基础 新版Siri将基于Gemini 3模型运行[3] - 尽管具体财务条款未公开 但据彭博社此前报道 苹果每年可能向谷歌支付约10亿美元[3] 对谷歌的影响 - 此次合作是谷歌AI战略的重大胜利 巩固了Gemini作为移动设备领先大语言模型提供商的地位[3] - 合作有望通过全球约15亿iPhone用户拓展其AI服务的分发渠道 甚至推动Gemini应用预装于iOS设备[3] - 随着Gemini 3在性能、稳定性和多模态能力上的显著提升 加之其自研TPU芯片在成本与效率上的优势 谷歌已重新确立其在AI领域的地位[3] 对苹果的影响 - 借助Gemini可加速兑现其2026年全面推出Apple Intelligence的承诺 提升Siri的对话理解与上下文感知能力[4] - 合作凸显苹果在自研大模型方面仍面临技术瓶颈 当前仍需依赖外部合作伙伴 尽管公司长期目标是实现完全端侧运行的轻量化AI模型[4] - 分析机构Futurum Group指出 2026年将是苹果AI战略的成败之年 此次合作或为其争取关键技术突破的时间窗口[4] 对OpenAI的影响 - 随着Gemini成为Siri的核心引擎 OpenAI在苹果生态中的战略地位明显削弱[4] - 失去苹果这一关键分发平台 对OpenAI的用户增长和品牌认知构成挑战[5] - 若iPhone用户普遍将Gemini视为更流畅、更集成的AI体验 市场对AI即ChatGPT的固有印象或将松动[5] - OpenAI的ChatGPT拥有超8亿周活跃用户 但近期增长已显疲态[5] 行业竞争格局 - 苹果与谷歌的合作并非排他性协议 目前iPhone用户仍可通过Siri调用OpenAI的ChatGPT处理部分查询[4] - 作为回应 OpenAI正加速推进由前苹果首席设计师Jony Ive参与打造的新型AI硬件设备 计划于2026年发布 意图构建独立于智能手机的AI交互入口 并与苹果形成直接竞争[4] - 此次合作对估值高达5000亿美元的人工智能独角兽OpenAI构成显著影响[1]
Billionaire Google co-founder Larry Page shells out $173 million on Miami mansions
MarketWatch· 2026-01-14 18:02
公司动态 - 公司首席执行官拉里·佩奇在迈阿密高档社区椰子林购买了两处豪华住宅 [1]
谷歌颠覆OpenAI购物战略
新浪财经· 2026-01-14 17:31
谷歌AI购物业务的核心商业模式 - 谷歌推出全新AI购物方案 明确表示不会对通过Gemini聊天机器人和AI搜索结果产生的购买行为抽取销售分成[2][12] - 谷歌计划通过向零售商销售一种新型广告来实现盈利 该模式与OpenAI的策略截然相反[2][12] - OpenAI于去年9月推出ChatGPT内置结账功能 并计划对相关销售额抽取分成 但目前暂未推出聊天机器人广告业务[2][12] 谷歌的竞争优势与现有资源 - 谷歌坚信其拥有数据优势 在谷歌购物搜索投放广告的零售商早已向其共享了商品描述、尺寸、颜色及库存等各类信息[3][15] - 这些基础数据是谷歌超500亿件商品数据库的重要组成部分 并会影响Gemini和AI模式搜索结果中的商品展示逻辑[3][15] - 谷歌掌握的海量数据可用于向消费者精准推送潜在购买意向商品 Gemini用户还可绑定谷歌与零售商账户以同步购买记录和会员信息[3][15] - 谷歌已成为消费者查找商品的重要渠道 覆盖传统搜索、带购物链接的YouTube视频及图像工具等[4] 新型广告产品的测试与特点 - 谷歌正在测试一种新型定向折扣功能 该功能可在Gemini聊天界面和AI模式搜索结果中直接展示商品优惠信息[4] - 零售商可设定专属优惠活动 例如向从未购买过该品牌商品的用户推送八折优惠码 未来计划推出更多形式如商品组合折扣[4] - 该新型折扣功能处于试点阶段 广告主沿用谷歌现有的按点击付费模式进行结算[6] - 新广告可融入零售商现有的广告预算与结算体系 并参照广告投资回报率等销售目标来决定竞价策略 谷歌会借助AI判断折扣信息的相关性[6] - 这类旨在促成即时下单的广告 与谷歌每年营收高达2000亿美元的传统搜索广告业务不同 后者主要对将用户导流至其他网站的点击行为收费[6] 市场背景与零售商顾虑 - 越来越多的消费者借助AI寻找购物灵感 2025年假日购物季期间 零售商网站来自AI渠道的流量同比激增近700%[6] - 零售商对全面试水这类未经市场验证的新型广告形式态度谨慎 部分零售商对谷歌进一步介入购物流程心存顾虑[6] - 有零售商高管评价 这像是谷歌在进一步靠近交易环节 过去品牌关键词搜索广告像必须缴纳的税费 现在其触手伸到了支付环节的更前沿[7] 市场接纳度与合作伙伴 - 沃尔玛等大型零售商已签约入驻 将通过谷歌的AI结账功能开展销售[7] - 谷歌与电商平台服务商Shopify达成合作 Shopify平台上的数百万商家可将商品目录共享至Gemini和AI搜索模式中直接销售 并参与广告试点项目[7] - Shopify认为谷歌在搜索与商品发现领域的专业能力颇具吸引力 合作有望结合双方优势[7] - 但功能的广泛普及仍面临阻碍 商家是否愿意使用最终取决于其自身意愿 即便有Shopify这样的合作伙伴加持[7] 行业挑战:数据标准化与协议碎片化 - 让聊天机器人顺利完成购物流程的一大障碍是 零售商需提供AI能够识别的标准化产品数据 梳理这类数据既耗时又耗钱[3][13] - OpenAI虽在去年9月公布结账功能 但至今仍在与零售商合作推进数据标准化与准确性核验 目前接入的零售商数量寥寥无几[3][13] - 相较于传统网页搜索 在对话式聊天场景中展示商品 商家还需向谷歌补充提交新数据 如商品常见问题解答、同类商品介绍或缺货替代选项等[8] - 当前AI驱动的电商领域技术方案与数据标准层出不穷 零售商面临眼花缭乱的选择[8] - 谷歌要求商家使用其新推出的“通用电商协议” 该协议为商家与AI智能体之间的数据共享制定了统一规范 涵盖了AI购物的全流程[9][19] - OpenAI与Stripe合作为ChatGPT内置购物功能制定了规则 但更侧重于规范结账环节 目前仅有各自的AI应用采用自家协议[9][19] - 人工智能企业Anthropic开发了更为通用的“模型上下文协议” 规定了AI开发者访问各类数据库、应用程序及网站的方式[10][20] - 部分零售商开始质疑 为适配每一种新协议或新产品而投入学习成本与精力是否值得 一些零售商感到手足无措[10][20] 平台选择权衡与用户规模对比 - 零售商选择合作平台不仅看用户基数 ChatGPT周活跃用户数接近9亿 高于Gemini的6.5亿月活跃用户数[8][18] - 对于商家而言 接入各平台功能的便捷程度是同等重要的考量因素[8][18] - 有行业专家指出 商家需要权衡 ChatGPT用户体量大但电商功能有限 Gemini用户规模小但相关功能已能顺畅运转[8][19]
中美AI巨头都在描述哪种AGI叙事?
腾讯研究院· 2026-01-14 16:33
文章核心观点 - 2025年人工智能领域的技术发展标志着“暴力美学”时代的终结,行业从单纯依赖堆砌参数转向深化基础研究,以突破通用人工智能的瓶颈 [5] - 技术进步主要集中在流体推理、长期记忆、空间智能和元学习四大领域,旨在解决模型在即时推理、长期记忆和视觉处理等方面的能力偏科问题 [6] - 通过测试时计算、新型记忆架构、世界模型和元学习等方向的突破,行业在“补短板”方面取得了显著成功,为模型能力的整体提升和未来演进奠定了基础 [7] 流体推理的进化 - **测试时计算的范式革新**:智能被重新定义为不仅是参数的函数,也是时间的函数,以OpenAI o1和DeepSeek R1为代表的模型通过在推理阶段投入更多计算资源进行“慢思考”,实现了推理能力从0到8的质变 [11][12][13] - **强化学习工程优化**:强化学习在提升推理能力中扮演关键角色,其工程可拆分为探索策略、评分系统和参数更新算法三部分,2025年后两部分有明显发展 [15] - **评分系统革新**:基于可验证奖励的强化学习和稀疏奖励指标全面崛起,通过给予模型对错结论作为奖励信号,使其能自发探索推理过程,大幅提升了在数学、代码等领域的能力 [16][17] - **参数更新算法革新**:GPRO算法流行,它通过让模型生成一组答案并计算平均分来替代传统的评论家模型,节省了50%的显存,成为国内各家公司在2025年延展的基础框架 [19] - **强化学习存在天花板**:研究发现强化学习的性能增长符合S型曲线而非幂律,存在性能天花板,但其工程实践(如使用长思维链和大批量大小)已变得更加精确和可预测 [21][23] 记忆与学习 - **记忆能力是短板**:长期记忆存储是通往通用人工智能得分中仍为0的能力分支,缺乏记忆导致模型无法在现实中自我学习,且个性化体验难以实现 [25][26] - **Titans架构突破**:这是一个深度的神经长期记忆模块,能在推理时实时更新自身参数,根据输入信息的“惊奇度”决定存储内容,并引入遗忘机制,从根本上挑战了Transformer的无状态假设 [28][29][30][31] - **Nested Learning架构**:将模型参数按低、中、高频率分层更新,使整个模型参数非冻结,能够持续学习和保有长期记忆,其成本低于传统的监督微调和强化学习方法 [31][33] - **RAG的模型化演进**:检索增强生成系统从静态资料库演变为具备反思与进化能力的系统,例如ReMem引入了“行动-思考-记忆-优化”的全链路处理,能对记忆进行修剪、重组和清理,实现经验复用 [35][36][38] - **克服灾难性遗忘**:通过稀疏记忆微调等方法,模型在注入新知识时仅更新部分参数槽位,在TriviaQA任务中仅导致11%的旧知识遗忘,远优于全量微调的89% [39][40] - **策略蒸馏进步**:在策略蒸馏结合了强化学习的采样和监督微调的密集反馈,让学生模型在自己的“犯错分布”中学习,提供了一种低成本且避免遗忘的参数更新方式 [42] 空间智能与世界模型 - **视觉处理能力提升**:在Sora 2、Veo 3等视频生成模型爆发的推动下,视觉处理能力从2024年的0分提升至2025年的5分,模型开始展现出对物理规律的掌握 [45] - **自监督生成模型的缩放定律**:视觉自回归模型和扩散Transformer被证实遵循特定的缩放定律,例如DiT模型对批量大小和学习率高度敏感,但遵循特定定律后能力可大幅提升 [46][47] - **原生多模态的优势**:研究发现,尽管训练效率较低,但原生多模态架构在参数利用率上可能比晚期融合架构有更高的性能上限 [49] - **VAE的替代方案**:SVG模型通过直接用图像理解模型代替变分自编码器,统一了语义空间,据称训练效率提升6200%,并在多项指标上击败了扩散Transformer和SDXL [50] - **符号主义的世界构建**:以李飞飞团队Marble平台为代表,其基于3D高斯泼溅等技术,从多模态输入生成可探索的3D空间表示,追求更稳定和可控的生成效果 [53][55][56] - **预测即理解的路径**:Meta的V-JEPA 2通过预测被遮挡的视觉内容来学习物理规则的表征,在使用超100万小时视频训练后,模型展现出了反事实预测的能力 [57][58][59] 元学习 - **元学习的核心价值**:赋予模型“学习如何学习”的能力,使其能通过少量样本快速适应新问题,是实现低成本快速适应和应对未知世界的关键 [62][63] - **对上下文学习的重新审视**:有研究认为上下文学习可能只是激活了预训练知识而非真正学习,这与元学习理念不同,但2025年出现了利用改进的上下文框架进行元学习的新尝试 [64][65] - **测试时计算催生隐式元学习**:研究证明模型在推理时的长思维链探索本质上是寻找最优路径,通过优化探索策略(如最小化累积遗憾)可以引导模型学会如何分配算力进行有效思考 [66][69] - **显式元学习系统的探索**:例如DiscoRL系统,通过内外双层循环让AI自主发现学习算法,其发现的Disco57算法在雅达利基准上击败了人类设计的顶级算法,并展现出强大的泛化能力 [70][72] - **中训练路径**:介于预训练和强化学习之间,让智能体通过自主探索产生后果并反思,以建立因果模型,在复杂环境中的成功率平均提升9.6% [72][73] 其他关键技术进展 - **对抗数据与算力瓶颈**:行业通过混合专家模型、合成数据与强化学习结合来突破瓶颈,例如利用DeepSeek-R1生成的长思维链数据对小模型微调,效果优于人类专家编写的数据 [81][82] - **数据质量重于数量**:研究表明数据达到一定规模后存在冗余,筛选前10%最长、最复杂的推理路径样本进行训练,其效果可匹配甚至超越全量数据集 [83] - **合成数据与模型崩溃**:大规模使用合成数据可能导致模型崩溃,但通过自我验证机制过滤(如设定置信度阈值)或使用另一个模型作为裁判进行清洗,可以有效缓解此问题 [85][86] - **小模型能力的飞跃**:蒸馏技术的进步是关键,包括针对混合专家模型的特化蒸馏方案(学习所有专家的“暗知识”)以及思维融合蒸馏(提取多个教师模型的稳健推理逻辑) [88][90][92] - **注意力机制演进**:多头潜在注意力及其变体普及,用于降低显存占用;线性注意力通过混合架构(如Kimi Linear的3:1设计)在性能上首次全面超越全注意力,并在1M上下文解码时吞吐量达到全注意力的6.3倍 [94][96] - **连续空间建模**:大型概念模型和连续自回归语言模型等尝试打破离散词元的限制,通过预测连续概念向量来提升语义带宽和推理速度 [97][100] 2026年可能的技术方向 - **记忆工程化实践**:记忆技术预计将在2026年迎来大规模工程化落地,涉及架构层革新或现有RAG、监督微调技术的精修,以实现持续学习和个性化智能体 [103][104] - **标准架构变革**:模型架构可能向分区、分层、增加功能层(如记忆层)的混合架构演进,以更贴近人脑运作模式,补齐能力短板 [105][106] - **自进化AI的探索**:在记忆、合成数据和元学习等技术完善的基础上,能够让AI进行自我对弈、自我算法优化的自进化研究将在2026年产生更多可能性 [107][112]
AI缺电逼急硅谷!大厂能源岗招聘激增34%,微软亚马逊狂招千人“找电”
华尔街见闻· 2026-01-14 16:32
文章核心观点 - 人工智能竞赛加速导致电力供应成为制约AI扩张的最大瓶颈 促使科技巨头大举招募能源专家并开始向能源公司转型 [1] - 科技行业能源相关岗位招聘在2024年同比激增34% 招聘规模比2022年ChatGPT发布前高出30% [1] - 科技公司不仅自建能源供应体系 还纷纷申请成为电力交易商以向电网出售多余电力 标志着其业务模式的根本性转变 [1][4][5] 人才招聘与竞争态势 - 2024年科技行业能源相关岗位招聘同比激增34% 招聘规模仍比2022年ChatGPT发布前水平高出30% [1] - 微软自2022年以来新增超过570名能源相关员工 亚马逊新增605名(包括AWS) 谷歌新增340名 [1][2] - 科技公司提供的高薪正在吸引能源基础设施领域的资深人才转行 能源战略、电力采购协议和电网连接等专业人才供不应求 [1][3] - 科技巨头通过收购扩充实力 例如Alphabet计划以47.5亿美元现金收购数据中心公司Intersect [2] - 项目和建设经理以及土地收购岗位需求激增 但科技公司更倾向于通过临时合同来完成基础设施初期建设 [2] 业务模式转型与能源布局 - 为满足AI数据中心的巨大能耗 科技公司不仅自建能源供应体系 还纷纷申请成为电力交易商 Meta、亚马逊、谷歌和微软均已获批或申请向电网出售多余电力 [1][4] - 能源岗位需求从传统的可持续发展岗位转向能源采购、市场、电网接口和战略等运营核心岗位 [3] - 有科技公司正在转变为能源公司 愿意拥有、资助和运营能源项目 但目前仅供自用 未来可能将额外能源出售给邻近用户或电网 [3][5] - Meta与小型模块化反应堆公司Oklo、Vistra和Terrapower签署电力采购协议 消息公布后Oklo和Vistra股价均飙升超17% [5] 行业影响与市场动态 - 数据中心在2024年占全球电力消费的约1.5% 过去五年年均增长12% [1] - 科技公司的深厚财力和高薪对传统公用事业和能源公司构成人才竞争挑战 [1][3] - 能源需求增长也为公用事业公司及其员工提供了巨大机会 因为科技公司会向它们寻求支持而非进行收购 [5] - 提高数据中心能源效率被视为第二阶段可能带来更多永久性岗位 但目前因电力紧缺而非优先事项 [3]
黄金、白银市值超越英伟达,位列全球资产排行榜冠、亚军
新浪财经· 2026-01-14 16:17
贵金属价格表现 - 截至发稿,现货黄金日内上涨0.9%,报4637.45美元/盎司 [1] - 现货白银日内涨幅近3%,一度站上91美元/盎司 [1] - 贵金属价格继续走高的背景是地缘政治叠加美联储独立性担忧 [1] 全球资产市值排名 - 根据CompaniesMarketCap数据,黄金以32.265万亿美元的市值位居所有资产榜首 [1][2] - 白银以5.070万亿美元的市值位居第二 [1][2] - 黄金与白银的市值双双超越芯片巨头英伟达,英伟达市值为4.523万亿美元 [1][2] 主要科技公司市值与股价 - 英伟达市值为4.523万亿美元,股价为185.81美元,日内上涨0.47% [2] - 谷歌市值为4.061万亿美元,股价为336.43美元,日内上涨1.11% [2] - 苹果市值为3.857万亿美元,股价为261.05美元,日内上涨0.31% [2] - 微软市值为3.498万亿美元,股价为470.67美元,日内下跌1.36% [2] - 亚马逊市值为2.593万亿美元,股价为242.60美元,日内下跌1.57% [2] 其他主要资产表现 - 比特币市值为1.897万亿美元,价格为94,835美元,日内上涨3.21% [2] - 台积电市值为1.717万亿美元,股价为331.21美元,日内下跌0.17% [2] - 博通市值为1.681万亿美元,股价为354.61美元,日内上涨0.68% [2] 机构价格预测 - 花旗集团预测,未来三个月内,金价有望在牛市情景下冲击5000美元/盎司 [2] - 花旗集团同时预测,白银价格或上看100美元/盎司 [2]
谷歌也要「AI抖音」了!新Veo 3.1原生支持竖屏,4K分辨率高画质
量子位· 2026-01-14 16:10
谷歌Veo 3.1模型升级核心要点 - 谷歌Veo 3.1模型进行了重要更新,核心升级方向为**竖屏**和**4K**画质,标志着公司正式进军AI短视频领域 [1][2][11] - 此次更新虽被官方视为小幅升级,但具备重大意义,旨在满足移动端短视频需求并提升用户体验 [9][10][12] 技术功能与性能提升 - **首次原生支持9:16竖屏视频**,专为移动端短视频平台优化,无需裁剪 [15] - 在原有720p基础上,**新增4K分辨率**,此前最高为1080p [15] - **创意能力提升**:即使提供简单提示词和参考图片,模型也能生成各种小剧场 [13][14] - **一致性大幅改进**:包括角色一致性(如人物在不同场景中保持相同外观)和背景与物体一致性(保持场景物体在多个镜头中的完整性) [16][26] - **元素融合能力大幅改善**:可将多张图片中的角色、物体、纹理和风格化背景自然融合成连贯视频 [20][21] 应用场景与用户反馈 - 功能已面向所有谷歌用户推出,**普通消费者**可通过YouTube Shorts、YouTube Create及Gemini应用体验 [23][24] - **企业或专业用户**可通过Flow、Gemini API、Vertex AI和Google Vids等平台使用 [25] - 用户实际生成案例显示效果良好,包括角色一致性故事、虚拟偶像组合及AI动漫制作 [26][29][30] 行业趋势与竞争格局 - AI视频正在进入**竖屏时代**,谷歌并非首家,OpenAI和迪士尼等公司已先行布局 [33][34] - OpenAI曾推出独立Sora应用(被视为“AI版抖音”),但其用户留存率数据显示从首日10%降至第7日2%、第30日1%,分析认为OpenAI在运营方面面临挑战 [35][36][37] - 谷歌拥有**全栈运营能力**和**平台闭环优势**,包括YouTube这一成熟的视频内容运营系统,Veo竖屏视频可直接适配YouTube Shorts,有利于形成“创作—分发—反馈—优化”的正向循环 [37][38] - 迪士尼计划在Disney+引入竖屏内容信息流,并与OpenAI合作引入视频生成能力,进一步印证竖屏模式的重要性 [40][41][42] - 国内AI玩家如可灵AI、Vidu AI等也已进行类似短视频生成的尝试 [44][46]