Workflow
Project Mariner
icon
搜索文档
微软和Google都找到了自己的AI重心
36氪· 2025-05-27 07:39
微软的Build 2025大会和Google的I/O开发者大会都选择了在本周举办,并且两场活动谈论的核心都是 AI。 不同的是,微软的重心是向行业展示如何更好搭建Agent。微软在Build 2025大会上向用户呈现了一套 更加成熟的Agent基础设施,想要吸引更多开发者加入到构建开放Agent网络(Open Agentic Web)的进 程中——这是一个 AI 智能体能够在个人、组织、团队乃至整个端到端业务流程中协同运作的体系。 Google则致力于展示一个围绕Gemini搭建的AI操作系统雏形。谷歌首席执行官Sundar Pichai在演讲中使 用了「Gemini时代(Gemini Era)」来描述未来。一方面,Google展示了更强的模型研发能力;另一方 面,Google在将Gemini的能力融入到各个C端产品中。 微软和Google虽然重心不同,但其面向AI的战略规划都具备了一定的整体性,不再是进行散点的尝试, 而是开始找到一条线,将散落的点串联起来,成为一个体系。这个体系的使命就如Pichai所言——让研 究成果真正发挥作用,将其尽快转化为现实应用。 这是目前我们在国内大厂中尚未观察到的一种变化。我 ...
行业周报:周观点:AI有望持续精彩-20250525
开源证券· 2025-05-25 21:18
报告行业投资评级 - 看好(维持) [1] 报告的核心观点 - AI有望持续精彩,谷歌开发者大会展示AI技术与生态体系全面融合,字节、腾讯等大厂推动AI与业务体系融合,国内外科技厂商将AI能力与自身业务体系融合成重心,AI有望成生产力工具 [5][6][13] 一周市场回顾 - 本周(2025.5.19 - 2025.5.23),沪深300指数下跌0.18%,计算机指数下跌3.02% [4][14] 公司动态 对外投资与中标 - 高伟达以自有资金1000万元增资蓝芯算力,11.15万元计入注册资本,剩余计入资本公积,完成后将持有0.67%股权 [15] - 宏景科技与Y公司签署《智算项目服务合同》,提供服务器等服务及算力服务,合同总金额59699.20万元含税,期限五年 [15] 股权激励 - 格灵深瞳拟授予660万股限制性股票,占股本总额2.55%,首次授予11人,授予价8.05元/股,业绩考核目标2025 - 2026年营收增长率不低于113.68%、156.41%,触发值不低于80.34%、113.68% [16] - 焦点科技拟授予1532.40万份股票期权,占股本总额4.83%,首次授予1153人,行权价29.04元/份,业绩考核目标2025 - 2027年净利润增长率分别不低于20%、40%、60% [16] 其他公告 - 京北方董事赵龙虎拟减持不超52.92万股,占总股本0.061%;副总经理曹景广拟减持不超4.34万股,占总股本0.005% [17] - 青云科技嘉兴蓝驰、天津蓝驰拟减持不超1194992股,占总股本2.50%;横琴昭盛拟减持不超955992股,占总股本2% [17] - 金财互联股东徐正军拟减持不超1538.43万股,占总股本1.97% [18] - 拉卡拉股东孙浩然拟减持不超1927.09万股,占剔除回购股份后总股本2.45% [19] - 并行科技805.76万股股票解除限售,占总股本13.8375%,5月26日可交易 [19] - 纳思达拟出售美国利盟100%股权,预估交易对价0.75 - 1.5亿美元 [19] - 大豪科技控股子公司兴汉网际进入创新层 [19] 行业动态 国内要闻 - 阿里巴巴投资美图2.5亿美元,持股6.85%,双方将进行AI等业务合作 [20] - 小米自研3nm芯片玄戒O1大规模量产,小米15周年发布会发布搭载该芯片的两款旗舰 [21] - 华为发布首款鸿蒙折叠屏电脑MateBook Fold非凡大师,售价23999元起 [22] 国外要闻 - Meta推出激励计划助力初创企业采用Llama AI模型,入选成员每月最高获6000美元补贴,最长六个月 [23][24] - 苹果智能眼镜芯片计划2026年或2027年量产,能耗低于iPhone芯片 [25] - 苹果公布WWDC25日程,6月10 - 14日线上大会免费开放 [26] - 英伟达推出人形机器人基础模型N1.5,开发周期从三个月缩至36小时 [27] - OpenAI推出云端AI编程智能体Codex,提升开发效率 [28] 投资建议 AI应用端 - 推荐金山办公、鼎捷数智等,受益标的包括汉邦高科、海天瑞声等 [7][13] AI算力端 - 推荐海光信息、中科曙光等,受益标的包括优刻得、青云科技等 [7][13]
【每日收评】北证50指数重挫6%!全市场超4400股下跌,银行股逆势再走强
新浪财经· 2025-05-22 16:53
智通财经5月22日讯,市场全天震荡调整,创业板指领跌,北证50指数跌超6%。沪深两市全天成交额1.1万亿,较上个交易日缩量708亿。盘面上,市场热点 较为杂乱,个股跌多涨少,全市场超4400只个股下跌。从板块来看,银行股逆势走强,浦发银行等多股盘中再创历史新高。军工股一度拉升,银河电子等涨 停。下跌方面,新消费概念股集体大跌,可靠股份跌超10%;固态电池概念股震荡走低,宏工科技跌超10%。截至收盘,沪指跌0.22%,深成指跌0.72%,创 业板指跌0.96%。 板块方面 板块上,银行股再度逆势走强,浦发银行、江苏银行、成都银行再创历史新高。青岛银行、中信银行、沪农商行、成都银行等个股跟涨。 近日,央行宣布LPR对称下调10BP,下调后1年期、5年期LPR分别为3%、3.5%。同日,六家国有大行和招商银行宣布下调存款挂牌利率,其中,活期存款 下调5BP至0.05%;定期整存整取3个月、半年、1年、2年均下调15BP。 从行业基本面来看,存贷款非对称降息落地,银行息差企稳有支撑。一季度银行业绩虽有所波动,但近期一揽子金融政策出台,结构性工具加力,银行基本 面积极因素持续积累。另外资金面方面,中长期资金入市持续,公 ...
2025谷歌开发者大会有哪些值得关注的内容?
金十数据· 2025-05-21 12:06
Alphabet(GOOGL.O)谷歌年度最盛大的开发者大会Google I/O 2025于本周二和周三在加州山景城的海岸 线圆形剧场举行。这是展示其全产品线发布动态的舞台,涵盖安卓、Chrome、谷歌搜索、YouTube,以 及当然不可或缺的AI聊天机器人Gemini等众多领域。 谷歌还专门为安卓更新举办了一场独立活动。公司宣布了多项新功能,包括寻找遗失安卓手机和其他物 品的新方式、Advanced Protection高级保护计划新增的设备级安全功能、防诈骗防盗的安全工具,以及 全新设计语言Material 3 Expressive。 以下是Google I/O 2025公布的重磅内容: Gemini Ultra Gemini Ultra(目前仅限美国)提供对谷歌AI应用与服务"最高级别的访问权限",月费为249.99美元。套 餐内含Veo 3视频生成器、新推出的视频剪辑工具Flow,以及尚未上线的强大AI功能Gemini 2.5 Pro的 Deep Think模式。 订阅Gemini Ultra的用户还将获得更高配额的NotebookLM与图像混合应用Whisk,以及在Chrome中使用 Gemini聊 ...
四点速读2025谷歌开发者大会
第一财经· 2025-05-21 11:22
谷歌推出的Veo 3视频生成模型支持原生音频生成,不仅能够生成高清视频,还可为视频添加背景音乐、 音效甚至对白,解决了以往AI视频生成中"有影无声"的问题,极大提升了AI视频的质量和真实感。 2025.05. 21 本文字数:977,阅读时长大约2分钟 作者 | 一财科技 北京时间5月21日,谷歌开发者大会(Google I/O)上公布了在AI技术上的最新进展,从基础模型升级到 生成式内容工具推出,再到硬件更新,标志着谷歌将AI技术融入其生态系统的进程又迈出重要一步。 一、Gemini模型升级,多模态能力显著提升 核心亮点仍是Gemini模型。Gemini 2.5 Pro 和 Flash 模型全面支持视听输入和原生音频输出对话,开发 者可通过Live API 预览版构建和微调对话体验的音调、口音和说话风格等。Gemini还可作为Chatbot登 录Chrome浏览器,帮助用户快速理解页面上下文并完成任务。其中,Deep Think模式引入增强型推理机 制,在处理数学、编程和多模态任务时,能够在回答前充分考虑多种可能性,显著提升了模型的推理能 力。 二、生成式内容工具 再升级 针对各项AI升级功能,谷歌推出了每 ...
四点速读2025谷歌开发者大会
第一财经· 2025-05-21 11:06
核心亮点仍是Gemini模型。Gemini 2.5 Pro 和 Flash 模型全面支持视听输入和原生音频输出对话,开发 者可通过Live API 预览版构建和微调对话体验的音调、口音和说话风格等。Gemini还可作为Chatbot登 录Chrome浏览器,帮助用户快速理解页面上下文并完成任务。其中,Deep Think模式引入增强型推理机 制,在处理数学、编程和多模态任务时,能够在回答前充分考虑多种可能性,显著提升了模型的推理能 力。 谷歌在开发者大会上展示了升级的多模态Gemini模型、增强的生成式内容工具以及集成AI功能的智能 硬件。 北京时间5月21日,谷歌开发者大会(Google I/O)上公布了在AI技术上的最新进展,从基础模型升级 到生成式内容工具推出,再到硬件更新,标志着谷歌将AI技术融入其生态系统的进程又迈出重要一 步。 一、Gemini模型升级,多模态能力显著提升 四、XR智能眼镜亮相 二、生成式内容工具再升级 谷歌与Xreal、Samsung等品牌合作,推出了集成AI助手功能的Android XR智能眼镜。这款眼镜支持实时 翻译、导航和信息提示等功能,是谷歌在可穿戴设备领域的新尝试,为用 ...
Alphabet (GOOG) 2025 Update / Briefing Transcript
2025-05-21 02:00
纪要涉及的公司和行业 - **公司**:Alphabet(旗下Google)、HP、Automation Anywhere、UiPath、Zillow、Aira、Gentle Monster、Warby Parker、Walmart、Red Cross、Waymo - **行业**:人工智能、视频通信、搜索、软件开发、机器人、科学研究、影视制作、时尚购物、卫星监测、无人机配送、自动驾驶 纪要提到的核心观点和论据 人工智能模型进展 - **模型性能提升**:自第一代Gemini Pro以来,Elo分数提升超300点,Gemini 2.5 Pro在多个基准测试中表现出色,在WebDevArena上超越前版本42 Elo点,在LM Arena排行榜上占据前三 [3]。 - **应用广泛且受欢迎**:在顶级编码平台受青睐,在Cursor上是年度增长最快的模型,每分钟生成数十万行被接受的代码;Gemini应用月活用户超4亿,2.5 Pro版本使用量增长45% [4][8]。 - **基础设施强大**:第七代TPU Ironwood性能是上一代的10倍,每个端口计算能力达42.5 hexaflops,将为Google Cloud客户提供服务,助力模型输出更快且价格下降 [5][6]。 - **处理能力飞跃**:过去一年,每月处理的令牌数量从9.7万亿增长到480万亿,增长约50倍 [7]。 - **开发者采用率高**:超700万开发者使用Gemini API进行开发,自上次IO以来增长超5倍,Vertex AI上的Gemini使用量增长超40倍 [8]。 产品创新与应用 - **视频通信平台Google Beam**:基于Project Starline技术,将二维视频流转化为逼真的三维体验,与HP合作,今年晚些时候为早期客户提供设备 [12][13]。 - **实时语音翻译**:在Google Meet中引入,英语和西班牙语翻译已面向订阅用户开放,未来几周将推出更多语言,企业版将于今年晚些时候推出 [20]。 - **Project Astra融入产品**:Gemini Live具备其相机和屏幕共享功能,可用于多种场景,如工作面试练习、马拉松训练等,今日起在Android和iOS上向所有人推出 [21][31]。 - **Project Mariner进展**:引入多任务处理,可同时处理10个任务,具备“教与重复”功能,其计算机使用能力将通过Gemini API提供给开发者,今年夏天更广泛可用 [33]。 - **Gemini应用新功能**:推出实验性的代理模式,可帮助用户查找公寓、安排参观等;个性化智能回复功能将在今年夏天在Gmail中面向订阅用户推出 [35][41]。 模型更新与优化 - **Gemini 2.5 Flash更新**:在推理、代码和长上下文等关键基准测试中表现更好,仅次于2.5 Pro,6月初全面可用,专业版随后推出,可在AI Studio、Vertex AI和Gemini应用中试用预览版 [46]。 - **文本转语音改进**:引入新的预览版,支持多语音,可在24种以上语言间切换,今日起可在Gemini API中使用 [50][53]。 - **安全与透明度增强**:加强对间接提示注入等安全威胁的防护,通过Gemini API和Vertex AI提供思想摘要,提高模型透明度 [57]。 - **效率提升**:2.5 Flash效率提高22%,并将思维预算功能引入2.5 Pro,用户可控制成本、延迟和质量 [58][59]。 前沿研究与探索 - **DeepThink模式**:为2.5 Pro引入新的DeepThink模式,在数学和编码基准测试中表现出色,目前正在进行前沿安全评估,将先提供给可信测试人员 [72][73]。 - **世界模型探索**:努力将Gemini扩展为世界模型,使其能够模拟世界、制定计划和想象新体验,相关能力已在一些方面显现,如Genie 2模型可生成三维模拟环境 [76]。 - **机器人应用**:微调专门的Gemini Robotics模型,教机器人执行有用任务,可在AI沙箱中体验 [78]。 搜索产品升级 - **AI概述成功**:自去年IO推出以来,每月用户规模扩大到超15亿,在200多个国家和地区使用,推动视觉搜索增长65%,在主要市场推动相关查询增长超10% [103][104]。 - **AI模式推出**:全新的AI搜索体验,具备更高级的推理能力,可处理更长、更复杂的查询,今日起在美国面向所有人推出,本周将引入Gemini 2.5模型 [105][107]。 - **个性化与深度研究**:今年夏天将引入个人上下文功能,提供个性化建议;还将引入深度搜索功能,可生成专家级、全面引用的报告 [115][118]。 - **复杂分析与可视化**:今年夏天将为体育和金融问题提供复杂分析和数据可视化功能 [123]。 - **代理能力集成**:将Project Mariner的代理能力集成到AI模式中,可帮助用户完成任务,如查找活动门票、预订餐厅等 [124]。 - **多模态搜索升级**:将Project Astra的实时功能引入AI模式,实现搜索实时功能,用户可通过相机与搜索进行实时交互 [129][130]。 - **购物体验创新**:提供视觉购物灵感,推荐个性化产品;引入虚拟试穿功能和代理结账功能,提升购物体验 [146][156]。 创意工具与媒体生成 - **Gemini应用新特性**:推出五项新功能,包括免费的Gemini Live,具备相机和屏幕共享功能;深度研究可上传文件;Canvas可进行协同创作;Gemini in Chrome可在浏览网页时提供帮助;引入Imagine 4图像生成模型和VO 3视频生成模型 [167][187]。 - **音乐创作工具**:与音乐家合作开发Music AI Sandbox,推出Lyria 2音乐生成模型,可生成高保真音乐和专业级音频 [188][191]。 - **合成内容检测**:继续创新合成内容检测技术,扩展Synth ID水印嵌入和检测功能,新的Synth ID检测器开始向早期测试人员推出 [192][193]。 - **影视制作工具**:与导演合作探索VIO作为影视制作工具,推出新的AI影视制作工具Flow,结合Vio、Imagine和Gemini的优势 [194][211]。 订阅计划升级 - **Google AI Pro**:全球可用,提供全套AI产品,具有更高的速率限制和特殊功能 [221]。 - **Google AI Ultra**:面向开拓者和先锋用户,提供最高速率限制、最早访问新功能和产品,今日在美国推出,即将全球推广 [222]。 Android平台与AI融合 - **Android更新**:上周在Android展上推出Android 16和Wear OS 6的全新设计和重大更新 [224]。 - **Gemini集成**:Gemini将很快集成到Android设备中,包括手表、汽车仪表盘和电视,还将通过Android XR平台支持多种新兴设备 [225][226]。 - **Android XR体验**:与三星合作开发,支持头戴式设备和眼镜,Gemini可在这些设备上提供更丰富的上下文理解和帮助,三星的Project Moohan头戴式设备今年晚些时候上市,眼镜原型已供可信测试人员使用,今年晚些时候可开始开发 [228][230][265]。 其他重要但是可能被忽略的内容 - **AI助力社会公益**:与合作伙伴构建Firesat卫星星座,利用多光谱卫星图像和AI提供近实时火灾洞察,首颗卫星已在轨;在飓风Helene期间,Wing与Walmart和Red Cross合作,通过无人机提供救灾物资 [269][270]。 - **用户体验与反馈**:分享了盲人用户对Project Astra的期待和使用体验,展示了AI在无障碍领域的潜力 [93][100]。 - **AI排行榜**:Gemini在AI计数器排行榜上领先,得分95 [267]。
速递|谷歌换帅Gemini:NotebookLM之父接棒,能否扭转流量仅为ChatGPT十分之一的困局?
Z Potentials· 2025-04-03 11:48
图片来源: Meta 谷歌于 4 月 2 日周三表示,公司正更换其 Gemini 聊天机器人的负责人,试图从 OpenAI 的 ChatGPT 手中争夺市场份额。 据发言人透露,现任谷歌实验室产品孵化器负责人的乔希 ·伍德沃德(Josh Woodward)将同时领导 Gemini 聊天机器人团队(内部称为 Bard )。长期任职于谷歌、此前负责 Bard 项目的萧茜茜将于周 三调任新职。 分析公司 Similarweb 数据显示,随着 ChatGPT 使用量激增,谷歌 Gemini 聊天机器人难以匹敌,其 网络流量仅为 ChatGPT 的十分之一左右。 伍德沃德领导的实验室部门已开发多款 AI 新产品,包括帮助开发者使用谷歌 Gemini 大语言模型构 建应用的 AI Studio 软件、尚未发布的可在网页浏览器中执行操作的智能体产品 Project Mariner ,以 及去年秋季因推出基于用户上传文档生成 AI 播客功能而引发关注的 NotebookLM 。 参考资料 https://www.theinformation.com/briefings/google-replaces-head-gemini- ...