谷歌推出Gemini 3.5系列模型,开发者大会火力全开
财联社·2026-05-20 07:49

谷歌AI战略与产品发布 - 在全球AI竞争加剧的背景下,谷歌在年度开发者大会上宣布推出Gemini 3.5系列模型及用于模拟物理世界的新型AI模型,旨在保持模型开发领先地位并为庞大用户群提供更多AI智能体服务 [1] - 公司AI战略的核心是Gemini系列及相关工具,重点展示了轻量级产品Gemini 3.5 Flash,其成本仅为同类顶尖模型的一半甚至不到三分之一,同时保持高智能水平 [2] - Gemini 3.5 Flash将成为全球Gemini应用和搜索AI模式的默认模型,公司强化了其网络安全防护,使其生成有害内容的可能性更低 [3] - 重量级版本Gemini 3.5 Pro目前仅在内部使用,预计下月向更广泛的用户开放 [3] - 公司推出了新型通用AI智能体Gemini Spark,能够进行跨平台推理并管理用户的数字生活,目前处于测试阶段,下周将首先向受信任的测试用户及Google AI Ultra订阅用户开放 [3] - 公司重新设计了标志性的搜索框,以更好地处理用户向聊天机器人提出的更长、更复杂的问题 [8] - 公司为搜索引擎加入“代理”功能,可帮助用户追踪话题、预订餐厅及监测健康状况,部分功能初期仅向付费订阅用户开放 [10] - 公司发布了多款面向开发者的新工具,帮助利用AI编写代码并管理代理系统,这些工具被归入“Antigravity”平台之下 [10] - 公司推出新的订阅计划,开发者每月支付100美元即可获得更多AI工具使用权限 [12] - 公司升级了Gemini应用,付费用户可启用“Daily Brief”功能获取个性化晨间摘要,并采用新的“神经表达式”美学风格设计 [15][17] - 新的搜索框是产品25年来最大的一次更新,支持更长问题输入、更方便上传文件和图片,并帮助用户更自然地组织搜索内容 [17] 产品性能与市场影响 - 谷歌首席执行官表示,更加偏向AI的调整已经帮助提升了搜索使用量,Gemini应用的用户量同比翻倍,目前月活已达到9亿 [10] - Gemini 3.5 Flash在部分指标上速度快于竞争对手产品,同时使用成本更低,公司称其是迄今为止最强的编程模型 [11] - 随着类似功能分阶段上线,谷歌搜索免费版与付费版之间的差距正在扩大,但公司表示仍然专注于服务非付费用户 [12] - 公司正与OpenAI和Anthropic争夺AI编程工具市场的主导地位,近几个月来高层越来越担忧公司在AI编程领域已落后于竞争对手 [10] - 前DeepMind研究员认为,谷歌有机会在AI编程领域追赶上来,公司一直擅长通过稳定、持续的方式取得成果 [11] 新型AI模型:Gemini Omni - 谷歌的AI产品组合包括Gemini Omni,这是一款用于模拟物理环境的世界模型,可以根据用户操作预测接下来会发生的情况,在物理模拟方面更准确 [6] - Omni可以生成高质量视频,并允许用户在生成后与视频进行互动,为学习和探索提供了类似教程的能力 [6] - Omni可在Gemini Flash、Gemini应用、Google Flow及YouTube Shorts中运行,支持图像和音频功能,用户可利用其编辑视频并生成更逼真的图像效果 [6] - 该AI模型能够编辑视频中的动作、添加新角色或物体 [7] - 公司称Gemini Omni能够“通过任何输入生成任何内容”:用户可以通过图片、音频、视频和文字提示生成视频,还能够通过简单自然语言对视频进行编辑,未来还将扩展以支持生成图片和音频 [12] 行业背景与竞争 - 当前市场正高度关注OpenAI与Anthropic两家公司飙升的估值,这两家公司均计划最早于今年进行IPO [1] - AI公司的市场预期持续上升,尤其是在Anthropic近期发布的Mythos模型背景下,据称该模型强大到能够发现全球软件基础设施中的数千个未知漏洞 [4] - 高质量视频的生成一直是AI工具的难点,而且对计算资源要求极高,OpenAI在今年早些时候放弃了其视频生成工具Sora,部分原因是为了将算力资源用于其他项目 [7] - 随着AI生成视频日益普及,谷歌也将加强对“深度伪造”内容的标注 [13]

谷歌推出Gemini 3.5系列模型,开发者大会火力全开 - Reportify