Nano Banana
搜索文档
DeepMind CEO:AI将开启未来10–15年“科学发现黄金时代”
搜狐财经· 2026-02-23 12:17
人工智能驱动的科技与产业展望 - DeepMind首席执行官预测未来10到15年内人类将迎来一个全新的发现“黄金时代”和一场新的“文艺复兴” [2] - 人工智能将使医学领域发生根本性改变 实现个性化治疗并有望治愈重大疾病 [2] - 人工智能将通过开发新材料 例如在聚变或太阳能技术方面取得突破 以解决能源危机 最终助力星际探索 [2] 谷歌(Alphabet)的战略转型与组织调整 - 生成式人工智能的兴起对谷歌而言是一个生死攸亡的转折点 公司必须承担颠覆其核心搜索业务的风险以构建未来 [2] - 为应对OpenAI的ChatGPT等竞争 谷歌在2023年将谷歌大脑(Google Brain)和DeepMind两大研究部门合并为一个实体 由哈萨比斯领导 [3] - 此次整合旨在融合双方文化优势 并为整合训练Gemini等前沿模型所需的“庞大计算能力” [3] - 哈萨比斯将合并后的实体比作“一座接入这家卓越公司其他部门的核电站” 为从搜索到YouTube等应用提供原始智能 [3] 人工智能模型进展与商业影响 - 在Gemini 3和爆款图像生成器Nano Banana等模型发布后 谷歌母公司Alphabet的股价在2023年底前飙升了约65% [3] - 哈萨比斯认为公司现已“跨越了分水岭” 人工智能模型已经足够强大 可以作为高水平研究的得力助手 [3] 人工智能在生物学与药物研发的应用 - 人工智能在生物学领域的应用被视为新时代的基石 以DeepMind的AlphaFold模型为例 它解决了困扰50年的“蛋白质折叠难题” [4] - AlphaFold能够预测超过2亿种蛋白质的三维结构 目前已被超过300万名研究人员使用 [4] - 谷歌旗下子公司Isomorphic Labs正在应用AlphaFold技术 致力于攻克疾病难题 哈萨比斯相信通过计算机模拟可将药物研发效率提升1000倍 [4] - Isomorphic Labs已启动癌症药物的临床前试验 并希望在2024年底前进入临床试验阶段 [4]
Google Gemini, Apple add music-focused generative AI features
BusinessLine· 2026-02-19 12:34
核心观点 - 谷歌与苹果正在其核心消费级应用中集成音乐生成式人工智能功能 标志着先进AI工具正进入主流应用阶段 [1] 谷歌 (Alphabet) 产品更新 - 谷歌Gemini AI助手现可利用其DeepMind最新Lyria 3模型 根据用户上传的文本、照片或视频创建30秒音乐片段 [2] - 该功能可生成定制歌词或纯器乐音频 面向18岁以上多语言用户 正于桌面版Gemini推出 未来几天将登陆移动应用 [2] - 其流行的图像生成模型Nano Banana可为生成的音乐轨道创建定制封面艺术 增强用户分享时的视觉元素 [3] - 免费版用户每日可生成10条音轨 付费用户根据订阅等级每日可生成20至100条音轨 [7] - 公司表示用户拥有其生成音轨的使用权 并设有过滤器检查输出内容 以避免侵犯知识产权或隐私规则 [7] - 公司称设有防护措施 禁止AI提取特定艺术家的内容 若用户提及真实音乐家 Gemini仅将其作为“广泛的创作灵感”并创作风格或情绪相似的音乐 [9] - 公司发言人表示 Lyria 3的训练设计使用YouTube和谷歌根据服务条款、合作伙伴协议及适用法律有权使用的音乐 [9] 苹果产品更新 - 苹果宣布用户很快可在Apple Music中使用AI创建播放列表 该功能名为“Playlist Playground” 利用Apple Intelligence将文本提示转化为包含封面艺术、描述和25首歌曲的播放列表 [5] - 此功能包含于iOS 26.4中 该版本已于周一发布测试版 将于今年春季更广泛推出 [5] - 苹果音乐的新功能与Spotify Technology SA提供的类似功能形成竞争 [5] - 作为人工智能领域的后进者 苹果正努力在其应用和设备中添加更多AI功能 包括其最近发布的软件包Creator Studio [6] - 据报道 其Siri虚拟助手一些备受期待的更新在2024年首次宣布后可能会被推迟 [6] 行业竞争与影响 - 在移动应用中添加音频创作工具可能加强谷歌的消费者产品供应 因其与OpenAI的ChatGPT争夺用户的竞争持续 [4] - 谷歌于11月发布的Gemini 3 AI模型获得了投资者和用户的广泛赞誉 促使OpenAI首席执行官Sam Altman宣布进入“红色代码”状态以加速ChatGPT改进 [4] - 生成式AI工具在音乐行业遭遇了警惕且有时敌对的反应 该行业视部分技术为其业务和知识产权的威胁 [8] - 2024年 环球音乐集团、华纳音乐集团和索尼音乐娱乐起诉了初创公司Suno AI和Udio AI的开发商Uncharted Labs Inc 指控其侵犯版权 [8] - 华纳音乐此后已与Suno达成和解 并且它与环球音乐均已与Udio达成协议 以确保该应用在适当的许可和控制下运行 [8]
谷歌DeepMind CEO:今年开启AI抗癌药物临床试验,未来18个月迎来机器人突破
华尔街见闻· 2026-02-13 13:38
核心观点 - 谷歌DeepMind首席执行官Demis Hassabis在达沃斯论坛上描绘了AI发展的宏伟蓝图,核心是解决智能问题并用其解决其他所有问题,包括药物研发、能源危机等,预言未来10到15年人类将迎来“发现的黄金时代”和“新文艺复兴” [2][8][58] AI在生物医药领域的颠覆性潜力 - 通过其创立的Isomorphic Labs,目标是在2026年初将首个AI设计的药物送入临床试验 [4] - Isomorphic Labs正在研究癌症、心血管疾病和免疫学等多个治疗领域,已有17个药物项目正在推进,并计划扩展到数百个 [4][28] - 公司与礼来公司(Eli Lilly)等全球顶级制药巨头建立了合作伙伴关系 [4][28] - 传统药物研发平均耗时10年,耗资数十亿美元,成功率仅为10%,而AI的目标是将效率提高“几十万倍”,通过在“硅基”层面完成大部分搜索和设计工作,将实验室仅作为验证步骤 [4][25][28] - 此技术基于AlphaFold的突破,该模型解决了长达50年的蛋白质结构预测难题,以惊人准确性预测了2亿个蛋白质结构,并免费提供给全球300万研究人员使用 [19][21][22] 谷歌大模型Gemini与AI整合进展 - Gemini 3模型已经跨越了“分水岭时刻”,变得非常有能力,可用于研究、总结和编码等日常工作 [5][52] - 谷歌已重建基础设施,以便将最新模型的能力快速投射到搜索、YouTube、Chrome等核心产品端 [5][44] - 公司正在重拾“黄金时代”的特质,包括承担风险、快速发布和创新 [5][38] - 谷歌在2023年将DeepMind和Google Brain两个AI团队合并,以集中人才和计算资源,推动下一代AI发展 [34][36] - 2025年,谷歌在AI开发方面取得进展,包括推出热门图像生成模型Nano Banana和Gemini 3,推动母公司Alphabet股价上涨约65%,创下自2009年以来的最佳表现 [41][42][43] AI代理(Agents)、机器人技术与未来产品形态 - AI代理和更自主的系统将在2025年年底真正开始显现,用户可以将整个任务委托给它们 [6][52] - 智能眼镜被认为是潜在的杀手级应用载体,AI技术是使其真正可行的关键拼图,公司内部有关于“通用助手”的概念,该助手将跨越手机、电脑和眼镜等所有设备 [6][53][55] - 预测在接下来的18个月左右,将会看到机器人技术的突破时刻 [7][53] 对未来的宏观展望 - 未来10到15年,如果发展得当,人类将迎来一个新的“发现黄金时代”和一场“新文艺复兴” [2][58] - 人类健康将被彻底改变,个性化医疗将成为现实 [7][58] - AI还将用于解决能源危机(如核聚变、太阳能、电池技术),最终将人类带入一个“极度丰富”的世界,并有能力去“探索银河系” [7][58] - AI领域的变革速度极快,感觉几乎每年都在发生巨大变化,2025年也不例外 [8][52] 公司背景与战略 - Demis Hassabis于2010年联合创立DeepMind,公司使命是“解决智能问题,然后用它来解决其他所有问题” [14][15] - 谷歌在2014年以约5亿美元收购了DeepMind,此次收购被视作商业史上最具变革性的时刻之一,为谷歌奠定了AI领域的基础 [14][15] - 谷歌创始人拉里·佩奇和谢尔盖·布林深度参与公司的AI战略和具体项目,如Gemini [39][40] - 公司管理强调将世界一流的跨学科团队(如生物学家、化学家、机器学习专家和工程师)聚集在一起,并倡导持续改进(Kaizen)的文化 [31][35][37]
春节前打响“百模大战”:AI生图为何突然“开窍”了?
新浪财经· 2026-02-12 15:27
行业核心观点 - 2026年初,阿里巴巴的Qwen-Image-2.0与字节跳动的Seedream 5.0同日发布,标志着AI生图行业竞争进入新阶段,行业焦点已从早期的创意探索转向高效生产,核心能力体现在可控生成、文字还原和多场景适配等方面 [2][31] - AI生图行业在不到四年时间内从“破圈”走向“成熟”,2025年谷歌Nano Banana凭借轻量化优势推动了技术普惠,2026年则成为各大模型厂商的角力场 [3][4][30] - 行业竞争逻辑发生根本变化,从比拼生成质量和创意发散,转向比拼可控性、场景适配性和生态整合力,以满足商用场景的批量生产需求 [24][51] 技术演进与核心能力突破 - **关键分水岭**:2025年,谷歌Nano Banana引爆“轻量普惠”时代,降低了使用门槛,实现了图文原生融合和快速出图 [5][32] - **最新模型突破**:阿里巴巴Qwen-Image-2.0首次将图像生成与编辑功能统一到单一模型架构,提升了出图效率;字节跳动Seedream 5.0增强了对提示词的理解能力,支持检索生图、多步逻辑推理和联网知识整合 [5][32] - **四大核心能力**:1) **多模态原生融合**:解决了图内文字乱码问题,能精准生成文本;2) **物理世界对齐**:生成的画面符合真实世界的物理规律;3) **可控生成**:能精准控制细节,支持局部修改和多轮编辑而不影响整体;4) **动态叙事**:能理解复杂业务逻辑,主动推理并输出完整交付物 [6][33] 主要模型技术路线与场景适配 - **模型共性**:主流模型均主打端到端多模态图像生成,功能上一站式搞定(文生图、图生图、编辑等),能理解创作意图,且生成效率高,几秒钟即可出图,并能适配商用场景的交付标准 [8][9][35][36] - **阿里巴巴 Qwen-Image-2.0**:采用MMDiT多模态扩散架构,整合生图与编辑能力,擅长中文创作场景,能解析最多1000个字符的中文长指令,对中文文字(如古诗词)的生成和排版还原度较好,适用于海报、广告图等场景 [11][38] - **字节跳动 Seedream 5.0**:采用混合多模态架构,加入RAG知识库和联网检索能力,能通过检索获取最新信息后再生成图片,对内容时效性要求高的场景(如热点事件、新产品)有帮助,同时擅长理解抽象指令,进行创意内容生成 [16][19][46][48] - **谷歌 Nano Banana**:采用Flow-Matching架构,在光影、材质、空间关系等物理细节还原上表现自然,角色一致性高,适合需要多图风格统一的需求(如故事绘本、IP设计),作为轻量化模型,硬件门槛低,普通笔记本即可运行,但中文理解能力和时效性内容支持有限 [23][50] 行业竞争格局与未来趋势 - **竞争焦点转变**:2026年,行业核心需求从创意探索转向高效生产,评价指标变为可控性、场景适配性等,Midjourney因在精细化控制和批量生产方面存在局限,市场声量下降 [23][24][51] - **当前三大竞争维度**:1) **可控性**:需求匹配度成为关键,如Seedream和Qwen在商用场景下的可用率更高;2) **场景适配性**:厂商深度绑定具体场景以建立壁垒,如Seedream集成到剪映切入短视频制作,Qwen瞄准电商和办公场景,Nano Banana面向专业摄影和影视领域;3) **生态整合力**:通过免费试用、简化操作(如Qwen的千问APP)等方式降低使用门槛 [24][25][52] - **未来发展方向**:1) **普及程度更高**:轻量化技术使更多设备可流畅运行,免费试用和低成本部署选项增加;2) **更懂用户需求**:AI能理解指令背后的意图,提供更个性化的方案;3) **场景适配加深**:技术与电商、短剧制作、设计等具体场景结合更紧密,实现一键生成和流程自动化;4) **使用门槛降低**:可能只需上传参考图加简单描述即可生成结果 [25][26][52][53]
迪士尼维权后,谷歌 Gemini停止生成迪士尼角色内容
环球网资讯· 2026-02-12 11:31
核心事件概述 - 谷歌旗下AI产品(包括Gemini、Nano Banana等)已开始拦截并拒绝生成迪士尼相关角色内容,以回应迪士尼的侵权指控 [1] - 这一变化发生在迪士尼于去年12月发出停止侵权函约两个月后 [1] 侵权指控与谷歌的应对 - 迪士尼于去年12月通过外部律师向谷歌发出长达32页的停止侵权函,指控谷歌的Veo、Nano Banana与Gemini等AI工具“在大规模侵犯迪士尼版权” [4] - 函件中附有实例图片,显示通过简单提示词即可生成达斯·维达、钢铁侠等迪士尼角色的精细渲染图像 [4] - 迪士尼在函件中提出四项明确要求,包括要求谷歌立即停止侵权行为、停止使用迪士尼IP训练AI模型,并指出此前已多次表达担忧但谷歌未明显改进 [4] - 谷歌发言人回应称,公司与迪士尼长期保持互利合作关系并将继续沟通,同时表示其AI模型使用开放网络的公开数据训练,并已推出Google-extended、YouTube Content ID等版权控制机制 [5] 技术执行与现状 - 今年1月,相关媒体曾通过提示词在谷歌AI工具中成功生成高质量迪士尼角色图像,但目前相同提示词会触发系统提示,称“由于第三方内容提供方的相关顾虑”无法生成 [4] - 目前存在例外情况:若用户自行上传迪士尼角色照片并搭配文本提示,谷歌AI产品仍可生成相关IP内容 [4] 行业合作动态 - 在向谷歌维权的同时,迪士尼与OpenAI宣布达成一项价值10亿美元的协议,迪士尼将旗下角色授权给OpenAI的生成式视频应用Sora [5]
未知机构:美图公司25年调整后归母加速增长尚未被大模型影响PE回到历史低位-20260210
未知机构· 2026-02-10 10:20
纪要涉及的行业或公司 * 公司:美图公司 [1][2] 核心观点与论据 * **财务表现强劲**:公司预计2025年调整后归母净利润同比增长60%-66%,增速高于2024年的59% [1][2] * **增长驱动明确**:主营业务影像与设计产品收入快速增长,主要驱动为全球付费订阅用户数快速增加 [1][2] * **国际市场表现突出**:来自国际市场的付费订阅用户增速高于中国内地市场 [1][2] * **盈利能力改善**:体现经营杠杆,毛利增速超过运营开支增幅 [2][3] * **利润预测**:根据预告增速,对应2025年全年调整后归母净利润为9.38-9.73亿元,其中2025年下半年为4.70-5.06亿元,高于2025年上半年的4.67亿元 [3] * **大模型影响有限**:公司董事长表示,在Nano Banana发布之后,美图的应用数据依然在快速增长,验证大模型对公司的实质影响小 [3] * **产品线更新**:Nano Banana于8月上线,Pro版于11月上线 [3] 其他重要内容 * **抵御大模型冲击的原因**: * 技术储备久,拥有海量数据并且强运营 [3] * 在toC生活场景,修图是核心需求(如写真照等频率低),大模型自然语言交互修图方式的效率和效果,均低于美图可视化编辑器模式 [3] * 跟踪审美时尚流行趋势需要强运营,大模型仍需补足 [3] * 在toB生产力场景,美图对垂类电商场景进行了深度优化 [3] * **增长前景看好**: * 产品力强大模型影响小,需求端toC平价悦己,toB显著降本 [4] * 增长路径:国内toC是基本盘;国内toB和海外toC开始起量;海外toB是未来选项 [4] * **估值处于低位**:2026年预测市盈率(PE)为19倍,PE回到历史低位 [4]
华源证券:自主Agent开启第三次Scaling 建议关注国内高壁垒科技企业
智通财经网· 2026-02-06 16:19
文章核心观点 - Anthropic大幅上调未来收入预期,2026年收入预期上调至180亿美元,2027年收入预期上调至550亿美元,AI Agent在B端应用从降本增效进入驱动业务增长阶段,其渗透率提升是推动收入预期上修的关键杠杆 [1] - AI产业趋势明确,短期波动与长期验证并存,AI原生产品不断涌现,预期2026年将看到Agent的“Token->ARR”商业模型价值大幅上修 [1] - 行业正经历从C端生产力探索到群体智能初级形态的多样化发展,每次市场热点(FOMO)后都会留下新的场景和商业规则,推动Agent更接近商业化拐点 [3][4] Agent的产业变化与商业化进展 - Anthropic收入预期显著上调,其产品主要围绕B2B展开并提供API服务 [1] - Agent在B端应用已超越浅层的降本增效,进入驱动业务增长的阶段 [1] - Agent的token消耗量是传统聊天的数十倍,其渗透率提升成为撬动Anthropic收入上修的关键杠杆 [1] - 截至2025年11月,Anthropic的Claude Code年化经常性收入已超过10亿美元 [2] - 科技大厂正通过内嵌Agent争夺流量,例如谷歌Chrome嵌入Gemini等工具 [2] 市场竞争与流量格局演变 - OpenAI的ChatGPT在2026年1月的全球网页端流量份额已降至64.5%,较2025年1月下降约20个百分点 [2] - 在ChatGPT流量下滑后,OpenAI的增长叙事向混合收入模式迁移 [2] - 腾讯启动“上元宝,分10亿”春节活动,试图复刻微信支付借助春晚红包崛起的路径以争夺市场 [2] C端生产力探索与市场现象 - OpenClaw风靡带动Mac mini购买热潮,其通过高权限和本地网关帮助用户体验大模型在C端的生产力边界 [3] - 该现象本质上是产业趋势下的一次FOMO(错失恐惧症),因为C端用户对模型性能低敏感但对交互高敏感 [3] 群体智能的初级形态与平台发展 - Moltbook作为Agent版本的Reddit平台出圈,是基于OpenClaw开发的群体智能初级形态 [4] - 平台上存在超过150万个Agent,但真实运行的仅有数千个 [4] - Agent之间的社交被描述为“模仿游戏”,而非持续、互惠的情感交互 [4] - Agent通过读取Skill.md配置文件即可零摩擦接入平台,并通过心跳机制定期拉取指令执行 [4] - 每次市场FOMO后,都会留下新的场景、产品和商业规则,推动Agent更接近商业化拐点 [4] 产品与战略动向 - Anthropic发布Claude Cowork,阿里巴巴发布Qoder Work,核心思路是从Coding Agent向通用场景拓展 [2] 建议关注的投资标的 - 国产大模型:Minimax-WP(00100)、智谱(02513) [5] - Agent相关:合合信息(688615.SH)、鼎捷数智(300378.SZ) [5] - 基础设施:深信服(300454.SZ) [5] - 国产算力:芯原股份(688521.SH)、寒武纪(688256.SH)、海光信息(688041.SH) [5] - CPU相关:澜起科技(688008.SH)、兴森科技(002436.SZ) [5] - AIDC(AI数据中心)相关:麦格米特(002851.SZ)、中恒电气(002364.SZ)、东阳光(600673.SH)、潍柴重机(000880.SZ)等 [5]
美图公司董事长吴欣鸿:通用大模型和应用之间是协同、相辅相成的关系
中证网· 2026-02-05 19:48
公司战略与市场定位 - 美图公司董事长兼CEO吴欣鸿认为,通用大模型与应用是协同、相辅相成的关系,而非覆盖关系,他将通用大模型比喻为“瑞士军刀”,而垂直应用则是“剪刀、剃须刀”等专业工具 [1] - 公司正致力于成为一个不断产生优质影像应用的平台,目标是打造更多垂直场景的影像产品 [1] - 即便在Nano Banana发布之后,美图公司的应用数据依然在快速增长 [1] 行业洞察与发展机会 - 应用开发者在每个时代阶段都有发展空间,关键在于对高价值垂直场景的深度挖掘,这类场景普遍存在刚性需求和高成本、低效率的问题 [1] - 客户愿意为能解决高价值垂直场景问题的服务付费,这类服务能创造出高弹性的增长空间 [1] - 应用与通用大模型的竞争壁垒,关键在于能否建立“这个垂直场景我最专业”的用户心智,以解决最后一公里与长尾需求 [1] - 当下通用大模型的对话式交互具有局限性,且提炼垂直行业能力的门槛较高,需要垂直应用来释放大模型的能力 [1]
喝点VC|a16z掌门人谈AI投资:我们正迎来史无前例的多重赢家时代
Z Potentials· 2026-01-29 13:35
文章核心观点 文章通过a16z联合创始人Ben Horowitz的访谈,系统阐述了一家顶级风投机构在AI时代的管理哲学、投资策略与行业趋势判断[2] 其核心观点聚焦于:通过聚焦团队竞争优势、建立垂直精简架构来构建高效组织;在AI投资浪潮中,识别应用层的复杂性与超越基础设施的机遇;并预判将出现更多大规模并购以及前所未有的、由强劲需求驱动的市场增长[4][8][18][24][25] 团队管理哲学 - 管理高智商人才团队的关键在于聚焦其核心竞争优势,而非短板,投资应关注其是否在特定领域“独步天下”[4][6] - 团队管理应提供清晰度而非单纯追求正确性,清晰能让团队迅速行动[5][13] - 领导力需平衡细节感知与战略放手,通过接触“时间创业者”(即决策前沿人员)来获取知识并快速决策[11][12] 风投责任与评估体系 - 在风险投资的长周期中,不能等待10年或15年才评估成果,必须建立实时评估关键节点的体系[7] - 评估需关注个人如何展现能力、把握机会的敏锐度、赢得机会的效率以及整体表现[7] 组织架构与文化建设 - 采用垂直化结构是保持团队精简的关键,最佳团队规模不应超过一支篮球队(约5人),以避免过度膨胀和政治内耗[8] - 公司致力于构建反政治文化,追求共赢而非零和博弈,这减少了内部斗争[10] - 通过安排跨团队会议、行业交流会以及每年两次、每次两三天的GP线下会议来促进紧密协作与沟通[9] 垂直领域投资策略 - 垂直领域的选择需双重考量市场时机与人才匹配,市场既不能进入过早也不能过晚[14][15] - 投资应聚焦于正经历实质性技术变革并能带来重大机遇的领域,例如供应链管理、国防和能源,而非空洞的营销概念[16] - 对于美国创新活力等领域,需验证其是真正的技术革新而不仅是营销噱头,并确保存在能推动变革的创业人才[16] AI时代投资趋势 - AI的发展颠覆了早期认知,大型基础模型提供了关键基础设施,但特定应用场景的复杂性(如模拟人类行为长尾)超越了基础设施本身[5][19] - 应用程序的行为表现和复杂度可能比拥有最多GPU的巨型模型更重要,不同应用场景最终需要不同的模型,不存在“上帝级”通用模型[20] - 所有企业及传统行业都面临AI威胁,为求生存将出现大量并购活动以重构运营模式[18] 市场前景与估值判断 - AI领域将呈现多重赢家格局,未来必将涌现更多市值突破十亿美元甚至千亿美元的科技巨头,其规模是科技史上前所未有的[24] - 当前AI领域估值飙升与客户采用率、营收增速等需求激增同时出现,是前所未有的景象,并非单纯泡沫[25] - 以NVIDIA为例,其估值倍数考虑到增长速度和盈利规模,从历史数据看并不算极端[25] - 对于近期投资中持股比例达到20%甚至更高的项目,在估值快速增长背景下被认为是合理的[21] 风投行业格局与定位 - 当前市场上有超过3000家活跃的风投公司,资本来源多样,但真正能助力公司成功的风投机构寥寥无几[22] - 公司通过速成加速器项目支持尚未达到风投标准的早期创业者,借助新工具将创意转化为产品变得更容易,以此吸引优秀人才[23] - 风投机构的职责不仅是盈利,更是帮助国家在科技、经济、军事领域取得胜利,创造改变世界的机遇[17]
谷歌(GOOGL.US)AI变现新篇章:Chrome“自动浏览”功能锁定AI Pro/Ultra付费订阅用户
智通财经网· 2026-01-29 11:53
核心观点 - 谷歌正为其Chrome浏览器推出由Gemini驱动的AI助手功能“自动浏览” 标志着浏览器从单纯的信息载体向智能助手的演进 [1] - 该功能旨在代替用户执行打开网站、页面点击等操作 让用户无需离开浏览器即可完成购物、比价等任务 以节省用户时间 [1] 产品功能与定位 - “自动浏览”功能可代替用户执行打开网站、页面点击等操作 让用户无需离开浏览器即可完成购物、比价等任务 [1] - 用户可指令该助手同时打开多家航空公司和酒店网站进行比价 从而高效规划家庭旅行等场景 [1] - 测试人员用其处理预约安排、填写在线表格、收集税务文件、获取报价、查看账单、提交费用报告、管理订阅服务以及加快驾照更新等事务 节省了大量时间 [1] - 在Chrome上启用“个人智能”功能后 Gemini助手可以协助处理旅行相关的后勤事务 比如查看学校课程表和已有的预约安排 从而为家庭找到最佳选择 [2] - 自动浏览的核心优势在于其高度整合能力 特别是与现有工具的协同 使得AI在用户授权下 能处理各种需要跨网页交互的“数字琐事” 例如收集和整理信息、完成在线流程等 显著提高了生产力 [2] - 作为此次发布的一部分 谷歌还将其图像生成工具Nano Banana直接引入Chrome [2] 技术发展与整合 - 此次推出是母公司Alphabet将人工智能技术进步融入其整个产品线的最新举措 [2] - 本月早些时候 公司表示Gemini可以利用用户在Gmail、搜索、照片和YouTube上的数据来个性化其回复 [2] - 这项技术的研发可追溯至代号Project Jarvis的项目 旨在开发能够自动化浏览器操作的AI [2] 商业模式与发布计划 - Chrome的“自动浏览”功能将面向美国的AI Pro和AI Ultra订阅用户开放 [2] - 该功能将使用Google密码管理器代用户登录网站 [2] 安全与隐私考量 - 谷歌在设计中强调了用户安全与隐私保护 设定了明确的界限 确保在关键环节仍需用户介入确认 [3] - 公司表示已设置保障措施 以确保这款代理型人工智能在未经用户许可的情况下 无法做出诸如下单之类的最终决定 [3] - 公司正在利用人工智能以及设备端模型来保护人们免受不断演变的复杂环境的侵害 无论是人工智能生成的诈骗手段 还是日益复杂的攻击者 [3]