Workflow
Nano Banana模型
icon
搜索文档
谷歌Gemini学会了看图作曲,你的朋友圈也能拥有专属BGM了
量子位· 2026-02-19 15:03
谷歌Gemini集成Lyria 3模型推出AI音乐生成功能 - 谷歌将最新的Lyria 3模型集成到Gemini中,使其能够根据用户输入的文本或上传的照片,在几秒钟内生成包含歌词、旋律及人声演唱的完整音乐作品[1][2] - 该功能支持48kHz高保真立体声音频采样率,显著提升了生成音乐的音质[5][7] - 生成音乐的同时,系统会调用Nano Banana模型自动生成风格匹配的专辑封面,极大简化了从创意到成品的流程[3][4][15] AI音乐生成功能的具体特性与能力 - 功能可根据用户上传的照片内容(如森林徒步)生成契合场景氛围的音乐(如民谣),为静态图像赋予声音[7] - 支持通过简单的文字提示(如“怀旧非洲节拍”)生成包含押韵歌词的完整歌曲,人声合成效果自然[10][11] - 能够生成多种音乐风格,例如1970年代的摩城灵魂乐、惆怅空灵的流行音乐,乃至纯人声伴奏的曲目[12][13][14] - 支持跨语言创作,Lyria 3首发支持韩语、日语、德语等八种语言,方便用户生成K-pop或日系风格音乐[15] 谷歌构建“超级入口”的产品与生态战略 - 谷歌旨在通过Gemini打造一个包揽所有数字生活的“超级入口”,其战略是All In式的深度整合[16][18] - 在产品层面,谷歌已打通网盘、相册、YouTube等核心资产;在模态层面,Lyria 3的加入使Gemini的多模态能力拼图更加完整[16] - 通过将创作功能深度绑定在单一应用内,用户无需在不同APP间跳转,这种全场景覆盖和便捷性构成了竞争壁垒,降低了用户使用独立工具的动力[16][17]
谷歌Chrome觉醒,Gemini 3全面接管,38亿用户一夜进入Agent时代
36氪· 2026-02-02 15:52
核心观点 - 谷歌将Gemini 3深度集成至Chrome浏览器,旨在将浏览器从网页查看工具转变为全能的人工智能通用智能体入口,以此应对OpenAI、Perplexity等竞争对手的挑战,并利用其庞大的38亿用户基础重塑流量入口和用户交互范式 [1][8][12][17] 产品更新与功能 - 所有桌面端Chrome浏览器正式接入Gemini 3,覆盖MacOS、Windows和Chromebook Plus [1][11] - 引入全新侧边栏体验,Gemini可随时待命,支持用户在不切换标签页的情况下进行多任务处理,例如对比选项、汇总产品评价、查找日历空档等 [15][18] - 推出重磅“自动浏览”功能,该功能目前仅限Google AI Pro和Ultra订阅的美国用户使用,能够执行复杂的多步骤工作流,如比价酒店机票、填写在线表格、收集报税文件、预约挂号、续期驾照等 [4][11][16][20] - “自动浏览”功能具备调用Google密码管理器完成登录任务、从PDF提取信息填表、根据用户标准筛选推荐公寓或出游周末等新一代智能体能力 [20] - 内置Nano Banana模型,用户可直接在网页侧边栏通过提示词对选中图片进行实时修改和重构,无需下载图片或使用外部软件,极大简化创作者工作流 [6][21] - 通过Connected Apps深度集成谷歌生态服务,Gemini 3可无缝调用Gmail、Google Maps、YouTube、Google Flights等应用,高效处理如结合邮件和航班信息规划行程等复杂任务 [6][23][24] - 未来几个月将为Chrome引入“个人智能”功能,该功能可记住对话背景、提供量身定制的答案,并允许用户自行控制连接或断开应用,使浏览器成为更懂用户的主动助手 [16][26] - 支持开放标准通用商务协议,确保AI智能体在Chrome内的购物流程顺畅 [20] 市场竞争与行业影响 - 谷歌Chrome凭借超过38亿的全球用户量,在浏览器市场占据统治地位 [1][12] - AI原生浏览器的崛起对谷歌存量市场构成冲击,Perplexity Comet凭借颠覆性AI搜索体验吸引大量用户,OpenAI也发布了内嵌ChatGPT的浏览器Atlas [12] - 此次更新被视为谷歌对市场竞争的有力回应,通过将顶级AI体验变为浏览器的“出厂设置”,可能降低用户下载其他独立应用的需求,利用其庞大的用户底座和深厚的生态护城河构建竞争优势 [8][12][23][28]
引力传媒:目前在业务开展过程中已应用谷歌Veo3及Nano Banana模型。
新浪财经· 2025-12-02 16:08
公司业务技术应用 - 公司在业务开展过程中已应用谷歌的Veo3模型 [1] - 公司在业务开展过程中已应用Nano Banana模型 [1]
为什么我建议你重读30年前的《失控》?
虎嗅· 2025-09-21 12:58
文章核心观点 - 凯文·凯利的著作《失控》为理解当前人工智能时代的核心特征与发展路径提供了关键思维框架,其关于“涌现”和“共同进化”的概念是解读AI现象的地图与指南针[4][5][21] AI的“涌现”特性 - “涌现”指整体大于部分之和,即简单个体通过互动产生复杂高级的整体行为,这是AI系统展现超出预设能力的原因[6][7] - 书中以蜂群为例,说明单个蜜蜂智力有限,但群体能形成超级智能体并作出复杂决策,智慧从混乱中涌现[8] - 大型语言模型由数千亿简单参数组成,当参数规模突破临界点(如GPT-3的1750亿参数),系统会自发获得推理、幽默等新能力[10][11] - 基于“涌现”特性,AI发展具有不可预测性,其能力突破非平滑直线而是一连串突变和惊喜[18] 人与AI的“共同进化”关系 - 人与AI的关系是共同进化,我们塑造工具的同时也被工具塑造,此关系正经历从工具到伙伴再到共生体的三阶段演变[13][15][16][17] - 第一阶段AI作为工具被动执行命令,第二阶段AI成为工作生活伙伴能理解意图并共同创作,第三阶段将形成人类与AI不可分割的共生系统[15][16][17] - 具体案例包括程序员与Claude Code通过代码建议与反馈相互训练,以及艺术家与Nano Banana通过提示工程与用户创作相互提升[19] - 共同进化关系表明未来核心竞争力是与AI高效协作的能力,而非简单使用工具,人类独特价值将体现在提出正确问题与复杂价值判断等方面[25] 《失控》对理解AI时代的重要性 - 该书提供穿越时空的洞察框架,帮助克服对AI未知的恐惧,建立未来信心,并在失控世界中找到控制力[21][23] - 重读该书旨在获得驾驭AI时代的智慧,其30年前于互联网黎明时期写就的预言正于当前AI萌芽阶段成为现实[22][24]