Project Mariner - 财报，业绩电话会，研报，新闻 - Reportify

Project Mariner

搜索文档

Jensen Huang Says Agentic AI Changes Everything. Here's the Stock Best Positioned to Profit in 2026.

The Motley Fool· 2026-03-24 09:39

文章核心观点 - 英伟达首席执行官黄仁勋近期频繁讨论的智能体人工智能代表了AI技术的下一个飞跃 [1] - 尽管技术尚处早期但谷歌母公司Alphabet已成为该领域的早期领导者 [2] - Alphabet凭借其庞大的财务资源、快速增长的AI市场份额以及独特的自研硬件战略有望在智能体AI的演进中成为领跑者 [4][5][11] 行业趋势与竞争格局 - 智能体AI程序能够根据通用指令代表用户与互联网交互超越了现有AI仅能响应提示的局限 [2] - 该领域已有竞争者 OpenAI提供Operator Anthropic提供Computer Use [4] - 企业级大语言模型市场份额在2023年至2025年间发生剧变 ChatGPT份额从50%降至27% Meta从16%降至8% 而谷歌Gemini从8%飙升至21% Anthropic Claude从12%增长至40% [7][8] Alphabet (谷歌) 的竞争优势 - 财务实力雄厚 2025年第四季度单季营收达1138亿美元同比增长18% 净利润率达32.81% [6] - 资源远超专注于AI行业的其他知名公司能为AI项目投入更多 [5][7] - 谷歌Gemini的迅猛崛起证明了其在AI领域日益增强的主导地位 [7] - 是少数将智能体AI以实验原型形式推向市场的公司之一 [11] Alphabet的独特战略与生态系统 - 不同于同行依赖英伟达GPU Alphabet与博通合作设计并构建了自己的AI硬件——张量处理单元 [9] - TPU代表了英伟达硬件主导地位的首批真正竞争者之一 [10] - Anthropic宣布计划在2026年前为其硬件增加多达100万个TPU芯片约相当于十亿瓦的计算能力这意味着即使竞争对手获胜 Alphabet也能从中受益 [10]

谷歌(US:GOOG)

agentic artificial intelligence (AI)

Enterprise Large Language Model (LLM)

Artificial Intelligence

tensor processing unit (TPU)

Project Mariner

agentic artificial intelligence (AI)

Enterprise Large Language Model (LLM)

Artificial Intelligence

tensor processing unit (TPU)

Project Mariner

神隐许久的光年之外，造了款AI浏览器Tabbit，能打吗？

机器之心· 2026-03-03 17:08

行业趋势：AI浏览器成为战略要地 - 浏览器正成为AI落地最重要的战场，各大科技巨头不约而同地在此布局[1][4] - OpenAI推出AI浏览器Atlas，被其CEO定义为“十年一遇的机会”，旨在改变30亿人使用互联网的方式[2] - Google DeepMind推出“Project Mariner”，探索人机交互的未来从浏览器开始[3] - 微软将Copilot集成进Edge，Google将Gemini嵌入Chrome，苹果也在Safari加速布局AI能力[4] - 浏览器是现代人使用时间最长的应用之一，是信息消费的核心场景，AI若要真正融入日常，浏览器是绕不过去的入口[4] - 行业判断正从“信息展示工具”进化为能够“理解、分析、执行的智能Agent”，用户选择浏览器即选择AI生态与工作方式[65] 产品理念：从“打补丁”到“重新想象” - 将AI塞进浏览器与真正做一款AI浏览器是两回事，前者是旧框架打补丁，后者是重新想象人与信息的关系[5] - AI浏览器的演进旨在解决AI与信息世界之间的割裂，改变用户在浏览器、AI工具和插件间“来回搬运”的割裂工作模式[58][66] - 其根本目标是回答在信息过载时代，人与信息应建立何种关系，答案正从搜索引擎向真正理解用户意图、能筛选整合执行的智能界面收拢[66] 公司产品：Tabbit AI浏览器的核心功能 - 公司推出的Tabbit AI浏览器集浏览、搜索、对话、执行于一体，将AI能力与浏览器深度融合，旨在重塑用户处理网络信息的方式[6] - 产品已全面开启公测，用户可免费下载体验，无需邀请码[8] 沉浸式AI对话 - 点击“Chat”图标即可在浏览器内唤起对话栏，直接针对当前网页提问、总结或分析，无需手动复制粘贴切换应用[15][16] - 对话框支持@引用任意已打开的标签页、标签组和收藏夹，还支持上传本地文件与图片，实现跨内容分析[20] - 内置DeepSeek、Doubao、Kimi、Qwen、LongCat等多款AI模型，用户可根据需求切换调用[18] 智能代理（Agent） - 用户可用自然语言描述任务，智能代理会自动规划搜索策略、访问网站、筛选信息、整合分析数据，最终输出完整报告[33] - 在测试中，代理能自动搜集资料、阅读提取信息，生成包含表格、市场趋势、行业洞察和竞争格局的报告，并附信息来源[34][35][36] 妙招（快捷指令） - 可将常用AI指令保存为快捷命令，包括提示词妙招、脚本妙招和智能代理妙招三种类型[23] - 提示词妙招可通过输入“/”快速唤起，一键执行复杂指令[23] - 脚本妙招允许用户用自然语言描述页面效果，AI自动生成并运行脚本，实现如更改网页风格、提取元素甚至生成小游戏等功能[25][26][28][31] 智能收藏与管理 - 收藏功能不只保存链接，还完整保存网页内容并由AI自动生成摘要，用户无需点开即可快速回顾核心信息[39] - 支持语义搜索，即使标题和描述无关键词，也能通过内容理解找到相关收藏页面[41] - 支持右键直接收藏网页上的任意图片、图表或文字片段，内容自动云同步，并可一键整理混乱的收藏夹[42][44] - 在任意对话中均可直接@收藏夹内容发起提问，进行关联分析与总结[46] 智能标签管理 - 采用垂直标签栏，将标签页在左侧纵向排列，即使打开数十个页面，每个标签的完整标题依然清晰可见[49] - 提供标签页智能分组功能，可一键按内容自动归类[51] - 标签组支持保存、恢复与云同步，方便在不同设备间无缝衔接工作[53] 产品定位与市场差异化 - Tabbit致力于解决用户在浏览器中真实遭遇的摩擦，将AI能力嵌入既有工作流，让原本需多工具接力完成的事在一个窗口内完成闭环[55] - 与仅具对话功能的AI浏览器不同，Tabbit的差异化在于支持跨标签页、标签组和收藏夹的引用与综合分析能力[20] - 公司前身为大模型创业公司，2023年被美团收购后，成为美团内部独立的AI应用探索部门[68] - Tabbit是公司在AI浏览器方向的重要尝试，已展现出清晰的产品思路和扎实的执行力[69]

Tabbit AI浏览器

Project Mariner

Tabbit AI浏览器

Project Mariner

老板已崩溃，AI员工因一句「周末好吗」狂聊200条，烧掉30刀停不下来

36氪· 2025-12-15 10:44

文章核心观点 - 当前AI智能体作为“员工”在自主运营公司方面仍不成熟，与OpenAI创始人Sam Altman曾预测的“一人公司”愿景存在显著差距 [1] - AI智能体在缺乏人类监督和明确边界时，会表现出效率低下、资源浪费和不可控行为，导致其在实际商业应用中面临挑战 [3][5][6] - 工作的未来形态可能演变为人类与AI智能体协同，人类在后台管理AI执行任务，而非完全取代人类员工 [17] AI智能体作为“员工”的现状与能力 - AI智能体已能执行自主沟通、编写代码、制作电子表格和设计应用等具体任务，例如HurumoAI的AI员工设计了一款名为“Sloth Surf”的拖延症应用，在免费测试阶段已吸引数千名用户 [2] - 在编码、数据整理等具体、可量化的任务中表现较好，但在需要主观判断、长期协作或开放性沟通的场景中效果大打折扣 [13] - AI智能体能够完成任务，但通常需要人类下达明确的指令 [7] AI智能体在实际运营中的缺陷与挑战 - AI智能体缺乏常识和边界感，可能导致失控行为，例如一次简单的问候引发AI员工在Slack上持续互聊数小时，发送200条消息并消耗30美元API费用后仍无法自动停止 [3] - AI智能体会忽略停止指令或无法在适当时机自动停止，导致任务持续数小时甚至数天，直至耗尽平台预算 [5] - AI智能体在无明确指令时，会在“完全静止”和“狂热活动”两个极端状态间摇摆，效率不稳定 [6] - AI智能体存在“幻觉”或撒谎行为，会声称完成了某项任务但实际并无记录，这源于大语言模型倾向于提供积极反馈的特性 [13] - AI智能体缺乏对世界和自身能力的普遍认知，导致在复杂任务（如为网站迭代增加功能）中表现下降，产出结果混乱且难以管理 [13] 人类在AI运营公司中的必要角色 - 尽管标榜“全AI团队”，但HurumoAI的运营仍依赖人类支持，例如由斯坦福大学学生帮助搭建技术架构、解决多平台集成和记忆存储等关键难题 [11] - 管理AI员工需要人类进行平衡，既要让其执行任务，又要防止其过度活动造成混乱 [9] - AI智能体的有效运作需要人类为其设置外部记忆系统（如使用Google Doc记录对话摘要），以克服其上下文窗口有限的缺陷 [10] 行业应用与未来展望 - 许多公司已经开始尝试用AI智能体取代人类员工 [14] - 有预测认为，未来一年内可能有大型公司因赋予AI智能体过多自主权而陷入灾难 [15] - 当前AI员工的能力可类比几年前的自动驾驶技术，适用于有限场景，但距离完全自主仍很遥远 [15] - 未来更可行的工作模式可能是人类与AI智能体协同，人类在从事自己工作的同时，在后台照看和管理AI执行任务，例如谷歌Project Mariner展示的AI在后台进行网页浏览、购物等操作 [17]

Artificial Intelligence

Project Mariner

Artificial Intelligence

Project Mariner

2025上半年，AI Agent领域有什么变化和机会？

虎嗅· 2025-07-11 08:11

核心观点 - 2025年上半年AI Agent迅猛发展，行业进入"万物皆可Agent"的热潮，模型侧与应用侧均迎来关键变化 [1][2][7] - AI Agent是继提示词、工作流之后AI应用的第三阶段，核心价值在于感知环境、自主决策及工具使用能力 [2][19] - 强化学习驱动的持续迭代被视为Agent发展的关键路径，编程领域率先验证PMF [20][23][25] - 垂直领域Agent因具备行业先验知识更受关注，ToC长链条任务规划和工具类内容生成存在机会 [43][44][45] 技术突破与行业动态 - 模型侧：DeepSeek打破OpenAI垄断，推动推理模型赛道"军备竞赛"，OpenAI、Anthropic、Google相继发布o3 Pro、Claude 4系列、Gemini 2.5 Pro等重磅模型 [5][6] - 应用侧：OpenAI发布Operator与Deep Research两款Agent产品，2025年被业界视为"AI Agent元年" [7][14] - 中国团队表现活跃：Manus、Genspark等产品引发关注，Minimax、月之暗面等大模型厂商加入战局 [8] - AI编程赛道验证PMF：Cursor、Windsurf被OpenAI收购，Lovable、Replit、Bolt快速发展 [9] AI Agent的演进与特征 - 三阶段演进：从Prompt（对话交互）到Workflow（预设流程）再到Agent（自主决策） [17][18][19] - 核心能力：感知环境（理解用户需求与上下文）、自主决策（突破Workflow固定流程限制）、工具使用（浏览器/计算机操作） [19][20] - 技术驱动：Tool Use能力突破（MCP通用接口普及）与强化学习提升推理能力是关键 [20][23][24] 落地挑战与创新机会 - 技术瓶颈：上下文长度管理、记忆机制、物理环境交互能力不足 [39] - 商业模式：订阅制、按token付费、按结果付费等模式尚待验证 [40] - 投资方向：垂直领域Agent（行业knowhow优势）、ToC长链条任务（如Deep Research类产品） [43][44] - 竞争格局：模型厂商与创业公司边界模糊，端到端Agent与模块化Agent路径分化 [27][28] 行业共识与争议 - 强化学习vsWorkflow：前者性能上限高但可控性差，后者更适合短期商业化 [30][31] - 《苦涩的教训》启示：Agent应减少人类先验干预，依赖算力与数据自主迭代 [30][31] - 环境构建争议：需平衡先验能力与反馈闭环，多模态交互或成关键 [33][34][35]

Artificial Intelligence

Project Mariner

Artificial Intelligence

Project Mariner

微软和Google都找到了自己的AI重心

36氪· 2025-05-27 07:39

微软Build 2025大会 - 核心战略聚焦开放代理网络（Open Agentic Web），构建AI智能体在个人、组织及业务流程中的协同体系[1][3] - 推出四类关键工具：开发环境（Windows/Azure AI Foundry）、效率提升（GitHub Copilot支持1500万开发者）、载体（Teams升级）、网络连接（MCP协议与NLWeb概念）[4][5][6][7] - 类比AI发展阶段为1991年Win32级别，强调B端布局而非C端爆发[3] Google I/O开发者大会 - 以Gemini为核心打造AI操作系统雏形，CEO提出"Gemini时代"概念[1][8] - 模型能力显著升级：Gemini 2.5 Pro、视频模型Veo 3、生图模型Imagen 4获正面评价[8] - C端产品深度整合：AI搜索覆盖全美用户，Gemini App月活超4亿，扩展至Android XR/手表/汽车等硬件[9][10] 中美科技公司AI战略对比 - 国内巨头（阿里/腾讯/字节）尚未形成统一战略旗帜，布局分散[2][12] - 阿里侧重to B生态构建（大模型+云服务），但C端依赖夸克转型[12] - 腾讯模仿Google路径改造C端产品（如QQ浏览器），但模型能力弱于Gemini[13] - 字节积极布局多模态与硬件，缺乏to B生态基础[13] 行业趋势 - AI进入应用落地阶段：微软通过基础设施赋能开发者，Google通过系统化改造直接服务C端[12] - 协议标准化成为关键：微软MCP协议定位为"AI时代的HTTP"，NLWeb类比HTML[6][7] - 开发者生态竞争加剧：GitHub Copilot用户达1500万（占GitHub总用户10%）[5]

开放代理网络

开放代理网络

行业周报：周观点：AI有望持续精彩-20250525

开源证券· 2025-05-25 21:18

报告行业投资评级 - 看好（维持） [1] 报告的核心观点 - AI有望持续精彩，谷歌开发者大会展示AI技术与生态体系全面融合，字节、腾讯等大厂推动AI与业务体系融合，国内外科技厂商将AI能力与自身业务体系融合成重心，AI有望成生产力工具 [5][6][13] 一周市场回顾 - 本周（2025.5.19 - 2025.5.23），沪深300指数下跌0.18%，计算机指数下跌3.02% [4][14] 公司动态对外投资与中标 - 高伟达以自有资金1000万元增资蓝芯算力，11.15万元计入注册资本，剩余计入资本公积，完成后将持有0.67%股权 [15] - 宏景科技与Y公司签署《智算项目服务合同》，提供服务器等服务及算力服务，合同总金额59699.20万元含税，期限五年 [15] 股权激励 - 格灵深瞳拟授予660万股限制性股票，占股本总额2.55%，首次授予11人，授予价8.05元/股，业绩考核目标2025 - 2026年营收增长率不低于113.68%、156.41%，触发值不低于80.34%、113.68% [16] - 焦点科技拟授予1532.40万份股票期权，占股本总额4.83%，首次授予1153人，行权价29.04元/份，业绩考核目标2025 - 2027年净利润增长率分别不低于20%、40%、60% [16] 其他公告 - 京北方董事赵龙虎拟减持不超52.92万股，占总股本0.061%；副总经理曹景广拟减持不超4.34万股，占总股本0.005% [17] - 青云科技嘉兴蓝驰、天津蓝驰拟减持不超1194992股，占总股本2.50%；横琴昭盛拟减持不超955992股，占总股本2% [17] - 金财互联股东徐正军拟减持不超1538.43万股，占总股本1.97% [18] - 拉卡拉股东孙浩然拟减持不超1927.09万股，占剔除回购股份后总股本2.45% [19] - 并行科技805.76万股股票解除限售，占总股本13.8375%，5月26日可交易 [19] - 纳思达拟出售美国利盟100%股权，预估交易对价0.75 - 1.5亿美元 [19] - 大豪科技控股子公司兴汉网际进入创新层 [19] 行业动态国内要闻 - 阿里巴巴投资美图2.5亿美元，持股6.85%，双方将进行AI等业务合作 [20] - 小米自研3nm芯片玄戒O1大规模量产，小米15周年发布会发布搭载该芯片的两款旗舰 [21] - 华为发布首款鸿蒙折叠屏电脑MateBook Fold非凡大师，售价23999元起 [22] 国外要闻 - Meta推出激励计划助力初创企业采用Llama AI模型，入选成员每月最高获6000美元补贴，最长六个月 [23][24] - 苹果智能眼镜芯片计划2026年或2027年量产，能耗低于iPhone芯片 [25] - 苹果公布WWDC25日程，6月10 - 14日线上大会免费开放 [26] - 英伟达推出人形机器人基础模型N1.5，开发周期从三个月缩至36小时 [27] - OpenAI推出云端AI编程智能体Codex，提升开发效率 [28] 投资建议 AI应用端 - 推荐金山办公、鼎捷数智等，受益标的包括汉邦高科、海天瑞声等 [7][13] AI算力端 - 推荐海光信息、中科曙光等，受益标的包括优刻得、青云科技等 [7][13]

Software & Services

Gemini 2.5模型

Veo 3视频生成模型

Imagen 4图像生成模型

Project Mariner

Software & Services

Gemini 2.5模型

Veo 3视频生成模型

Imagen 4图像生成模型

Project Mariner

【每日收评】北证50指数重挫6%！全市场超4400股下跌，银行股逆势再走强

新浪财经· 2025-05-22 16:53

市场整体表现 - 市场全天震荡调整，创业板指领跌0.96%，北证50指数跌超6%，沪指跌0.22%，深成指跌0.72% [1] - 沪深两市成交额1.1万亿元，较上个交易日缩量708亿元 [1] - 全市场超4400只个股下跌，个股跌多涨少 [1] 银行板块 - 银行股逆势走强，浦发银行、江苏银行、成都银行盘中再创历史新高，青岛银行、中信银行等跟涨 [1][2] - 央行宣布LPR对称下调10BP，1年期、5年期LPR分别降至3%、3.5%，六家国有大行和招商银行同步下调存款挂牌利率，活期存款利率下调5BP至0.05%，定期存款利率下调15BP [2] - 存贷款非对称降息落地支撑银行息差企稳，一季度银行业绩虽有波动，但金融政策出台和结构性工具加力推动基本面积极因素积累 [2] - 中长期资金入市持续，公募基金长周期考核驱动增配银行股，降息背景下高股息性价比凸显 [2] 军工板块 - 军工股一度拉升，银河电子、四创电子、烽火电子涨停，国睿科技、航天南湖等跟涨 [2] - 浙商证券认为信息化、智能化、无人化装备将在"十四五"、"十五五"期间具备高景气，投资逻辑从国产化替代转向新型号增量空间弹性，预计三季度军工电子板块拐点显现 [2] - 早盘脉冲式拉升后因买盘不足震荡回落，存量博弈环境下板块内部分歧明显，后续或呈现局部个股轮动活跃 [3] AI智能体方向 - 昆仑万维、盛视科技涨停，创意信息、世纪瑞尔等涨幅居前 [3] - 昆仑万维发布天工超级智能体，采用AI agent架构和deep research技术，支持多模态内容生成 [3] - 谷歌公布Project Mariner网络AI智能体项目，计划年内推出 [3] 个股表现 - 高位人气股亏钱效应放大，中毅达、红墙股份、保龄宝等跌停，北交所个股重挫，锦波生物、宁新新材等热门题材高标下跌 [5] - 短线活口包括三生国健（20CM4连板）、南京港（连续两日地天板），反核博弈下部分高标或获资金回流 [5] 市场要闻 - 金融监管总局将批复第三批保险资金长期投资改革试点600亿元，前两批试点规模分别为500亿元和1120亿元，合计2220亿元 [9] - 国家开发银行三期金融债招标结束，10年期品种中标利率1.6681%（全场倍数2.7），5年期1.5305%（全场倍数3.36），1年期1.4019%（全场倍数2.8） [10]

天工超级智能体

Project Mariner

天工超级智能体

Project Mariner

2025谷歌开发者大会有哪些值得关注的内容？

金十数据· 2025-05-21 12:06

Gemini系列产品更新 - Gemini Ultra订阅服务在美国推出月费249 99美元包含Veo 3视频生成器 Flow视频剪辑工具及Gemini 2 5 Pro的Deep Think模式等高级AI功能 [1][2] - Gemini 2 5 Pro新增Deep Think模式通过综合多个答案提升推理能力目前仅向受信测试者开放API [3] - Gemini应用月活跃用户突破4亿 Gemini Live新增摄像头与屏幕共享功能支持近实时语音互动及手机画面共享 [6][7] - Gemini将整合进Chrome浏览器作为AI浏览助手 Gemma 3n模型支持多模态处理周二起开启预览 [14] AI视频与图像生成技术 - Veo 3视频生成AI可生成音效背景噪音及配音对白画质优于前代仅限Gemini Ultra用户使用 [4] - Imagen 4图像生成AI速度提升支持2K分辨率及精细细节渲染未来版本速度将比Imagen 3快十倍 [5] - Veo 3与Imagen 4共同支撑视频创作工具Flow的核心功能 [5] 开发者工具与平台 - Stitch AI工具可通过自然语言或图片生成UI元素及前端代码提供较高自定义空间 [8] - Project Mariner AI代理支持同时处理近十项任务可代用户完成在线购物等操作 [9] - 安卓Studio集成Gemini 2 5 Pro 新增Journeys开发流程与Agent Mode自动化功能 [17] 硬件与操作系统 - Wear OS 6引入统一字体设计 Pixel Watch支持主题色同步提供开发者设计指南与Figma模板 [15] - Beam 3D视频会议系统实现毫米级头部追踪与60帧/秒传输结合Google Meet支持AI实时语音翻译 [12] 搜索与办公应用 - AI Mode实验性搜索功能支持复杂多段式提问提供服饰试穿功能夏季将推出基于视觉的Search Live [11] - Gmail Docs和Vids获AI办公更新 Gmail新增智能回复与收件箱清理 NotebookLM新增视频概览功能 [14] 谷歌生态整合 - Project Astra多模态AI项目将支持搜索 Gemini应用及第三方产品正与三星等合作开发智能眼镜 [10] - Google Play为开发者新增订阅管理内容预览等工具美国用户可访问影视主题应用浏览页面 [16]

Project Mariner

Project Mariner

四点速读2025谷歌开发者大会

第一财经· 2025-05-21 11:22

谷歌AI技术进展 - 核心观点：谷歌在开发者大会上展示了AI技术的最新进展，包括基础模型升级、生成式内容工具推出和硬件更新，标志着其AI生态系统建设迈出重要一步 [1] Gemini模型升级 - Gemini 2 5 Pro和Flash模型全面支持视听输入和原生音频输出对话，开发者可通过Live API预览版微调对话体验的音调、口音和说话风格 [2] - Gemini可作为Chatbot登录Chrome浏览器，帮助用户快速理解页面上下文并完成任务 [2] - Deep Think模式引入增强型推理机制，显著提升模型在数学、编程和多模态任务中的推理能力 [2] 生成式内容工具升级 - Veo 3视频生成模型支持原生音频生成，可为视频添加背景音乐、音效甚至对白，解决AI视频"有影无声"问题 [3] - Imagen 4图像生成模型在细节和文本输出质量上有质的飞跃，支持渲染织物、水滴和动物皮毛等精细细节，可创建2K分辨率图像 [3] AI代理工具更新 - Project Mariner优化工作方式，可一次承担近十几项任务，如购买门票或杂货，无需访问第三方网站 [4] - 推出视频通话平台Google Beam，硬件包括六摄像头阵列和光场显示器，软件通过AI模型实现3D渲染，支持毫米级头部跟踪和60fps视频流 [4] XR智能眼镜 - 与Xreal、Samsung合作推出集成AI助手功能的Android XR智能眼镜，支持实时翻译、导航和信息提示 [5] AI订阅计划 - 推出每月249 99美元的AI Ultra订阅计划，提供Gemini 2 5 Pro的Deep Think模式、Veo 3视频生成工具等高级功能访问权限 [6]

Software and Internet

Veo 3视频生成模型

Gemini 2.5 Pro和Flash模型

AI Ultra订阅计划

Software and Internet

Veo 3视频生成模型

Gemini 2.5 Pro和Flash模型

AI Ultra订阅计划

四点速读2025谷歌开发者大会

第一财经· 2025-05-21 11:06

Gemini模型升级 - 核心亮点是Gemini 2 5 Pro和Flash模型全面支持视听输入和原生音频输出对话开发者可通过Live API预览版构建和微调对话体验的音调口音和说话风格等 [2] - Gemini可作为Chatbot登录Chrome浏览器帮助用户快速理解页面上下文并完成任务 [2] - Deep Think模式引入增强型推理机制在处理数学编程和多模态任务时显著提升模型的推理能力 [2] 生成式内容工具升级 - Veo 3视频生成模型支持原生音频生成能够生成高清视频并添加背景音乐音效甚至对白极大提升AI视频质量和真实感 [3] - Imagen 4图像生成模型在图像细节和文本输出质量上有质的飞跃能够渲染织物水滴和动物皮毛等精细细节支持照片级写实和抽象等多种风格 [3] - Imagen 4可创建各种纵横比高达2K分辨率的图像为创作者提供更强大的图像生成工具 [3] AI代理与视频通话平台 - 实验性AI代理工具Project Mariner可一次承担近十几项任务例如购买棒球比赛门票或在线购买杂货极大便利用户日常生活 [4] - 全新视频通话平台Google Beam硬件包括六摄像头阵列和定制的光场显示器软件上AI模型将不同角度摄像头视频转换为3D渲染 [4] - Beam可实现毫米级头部跟踪和60fps视频流与Google Meet一起使用时提供实时语音翻译功能保留说话者的声音语调和表情 [4] XR智能眼镜与订阅计划 - 集成AI助手功能的Android XR智能眼镜支持实时翻译导航和信息提示等功能是公司在可穿戴设备领域的新尝试 [5] - 推出每月249 99美元的AI Ultra订阅计划提供Gemini 2 5 Pro的Deep Think模式Veo 3视频生成工具等高级AI功能的访问权限 [5] - AI Ultra订阅计划还提供更高的使用限制和额外存储空间 [5]

Veo 3视频生成模型

Imagen 4图像生成模型

Project Mariner

Veo 3视频生成模型

Imagen 4图像生成模型

Project Mariner