Workflow
谷歌(GOOG)
icon
搜索文档
橡树资本联席董事长:人工智能的弱项正是伟大投资者的强项
格隆汇APP· 2026-02-27 10:25
文章核心观点 - 人工智能技术可能像指数基金一样,将许多投资者挤出资产管理行业,因其极为擅长吸收数据并识别模式 [1] - 未来能留在行业的基金经理将是那些在人工智能相对薄弱领域表现卓越的专家,例如评估管理层能力、新产品重要性等定性因素,并更擅长应对难以与既有模式匹配的情况 [1] - 人工智能技术进步速度令人惊讶,其日益增强的自主性可能会深刻改变商业世界乃至整个社会 [1] - 微软和Alphabet等巨头正向人工智能技术投入巨额资本,其股价可能并未严重脱离合理区间 [1] - 在人工智能快速发展的背景下,人类在投资过程中仍有创造价值的空间,但行业内的岗位数量可能会减少 [1]
谷歌版的“豆包手机”来了
第一财经资讯· 2026-02-27 10:23
谷歌与三星合作发布AI手机功能 - 北京时间2月26日,三星在Galaxy Unpacked发布会上推出Galaxy S26系列手机,谷歌宣布与三星合作,在该系列的安卓系统中推出AI功能,可帮助用户完成订餐、叫车、购物等多步骤复杂任务[2] - 谷歌安卓生态系统总裁萨米尔·萨马特发文称,这是安卓的下一个篇章,从操作系统发展成为智能系统,未来安卓将与AI助手协同工作[5] - 新的AI功能首先支持的场景包括出行打车(如Uber)、餐饮外卖(如DoorDash、Grubhub)和生鲜杂货配送,用户长按手机侧边电源键即可唤醒Gemini,用自然语言下达指令[5] - 谷歌计划在Pixel 10、Pixel 10 Pro和三星Galaxy S26系列上推出测试版功能,最初仅在美国和韩国推出[7] AI功能的具体应用与特性 - 用户可通过自然语言指令让Gemini处理复杂任务,例如读取家庭群聊内容,梳理成员披萨口味偏好,自动启动外卖应用、添加菜品并生成订单等待确认[5] - 新的AI系统是透明和可控的,用户可从通知中观察Gemini的每一个操作步骤,并随时进入或停止任务,AI在后台运行时用户仍可自由操作手机[6] - 升级版Circle to Search(圈选即搜)功能未来可一次搜索多个对象,例如识别用户圈选的多件衣服并进行视觉匹配,同时扩展了虚拟试穿功能[7] - 新的安卓系统集成了设备端Gemini模型以智能识别诈骗,在通话中检测到潜在骗局时会向用户发出即时音频和触觉警报,为保护隐私,分析在设备上进行且对联系人自动关闭[7] 技术路径与行业对比 - 谷歌与三星的AI功能采用了AppFunctions(类似苹果意图框架)与UI automation(读屏自动化)并行的技术路径,而非单纯的AI读屏路径[10] - AppFunctions和UI automation需要用户和app的双重授权,其设计初衷是为应用减负、降低开发成本,这与当前市面其他AI手机采用的技术路径有本质不同[10] - 相比之下,三个月前字节跳动与中兴努比亚发布的“豆包手机”核心卖点也是系统级AI助手,能通过自然语言指令实现跨App自动化操作,其首批3万个售价3499元的样机一夜售罄[8] - 中兴通讯终端事业部总裁倪飞评论称,三星S26与Gemini的组合采用了GUI技术,但只实现了努比亚M153的局部能力,两者产品逻辑高度相似,都支持侧边键唤醒和跨应用多步骤任务[9][10] - 谷歌的AI功能目前仅能操作个别已合作的app,说明其没有采用单向的“无障碍”加“AI读屏”技术路径[10] 生态系统挑战与开发者策略 - 安卓生态主管表示,将安卓从操作系统转变为“智能系统”的最大障碍依然是应用开发者,目前任务自动化功能仅限于优步、Grubhub和DoorDash等少数应用[11] - 谷歌正与一小部分app开发者合作打造高质量用户体验,并计划在2024年晚些时候分享更多关于如何使用AppFunctions和UI automation功能为app启用智能代理集成的信息[11] - 谷歌的AI手机没有采用改变安卓系统权限的方式,而是选择搭建平台呼唤开发者加入,但也没有放弃视觉技术的使用[12] 市场前景与行业影响 - 根据IDC预测,2026年中国智能手机市场中,新一代AI手机的出货量将达到1.47亿台,同比增长31.6%,占据整体市场的53%,业界普遍将2024年视为“AI手机元年”[12] - 三星宣布其Galaxy AI已覆盖全球4亿台设备,与谷歌合作后,预计2024年搭载Gemini的设备数量将翻倍至8亿台[12] - 谷歌的AI技术路径选择对AI手机发展有较强的风向标意义,就在2024年1月,苹果确认将采用谷歌的Gemini大模型来驱动下一代Apple Intelligence功能,这意味着Gemini将成为安卓和iOS两大平台的AI基座,覆盖全球绝大多数智能手机用户[11][12] - 当前AI手机主要有两条技术路线:一是系统权限结合视觉路径,通用性强但隐私风险大;二是A2A(智能体互联)路线,对隐私安全更友好但需与应用进行授权谈判[12]
告别“鬼画符”!谷歌Nano Banana 2深夜空降,强势修复文字短板,AI生图进入“闪电时代”,价格直降37%
金融界· 2026-02-27 10:13
产品发布与定位 - 谷歌于2月27日低调发布了新的图像生成模型Nano Banana 2,其官方代号为Gemini 3.1 Flash Image,正在逐步取代旧版成为Gemini平台的默认图像生成模型 [1][2] - 该模型定位为“用Flash的速度,跑出Pro的质量”,旨在将过去Pro版本独占的能力下放给Flash用户 [2] - Nano Banana Pro版本将退守至对事实准确性要求极高的专业场景 [2] 技术规格与性能提升 - 模型底层架构从Gemini 2.5 Flash升级至3.1,输出分辨率从2K提升到4K,并支持从512px到4K的多种分辨率和宽高比 [2] - 核心升级包括更强的世界知识、更精准的文本渲染、更可控的多图一致性,以及原本Pro才有的推理与指令遵循能力 [2] - 模型接入了Gemini的实时搜索和图像检索,能根据地理位置、天气数据、文化符号校准画面细节,实现从“照着风格画画”到“先理解世界,再动笔”的转变 [3] - 在多语言文本渲染上取得显著进步,中英日等多语言混排基本稳定,乱码明显减少,可可靠生成漫画对白、海报文案等 [3] - 在“时钟难题”上有所改善,能准确生成可读时钟,但在处理“时钟+满杯红酒”等多物体复杂场景时仍可能出错 [4] - 模型支持在单个工作流中保持最多5个角色的外貌一致性,以及最多14个物体的特征保真 [8] 定价策略与成本效益 - 定价按像素计算:1000像素图像每张约0.0672美元,2000像素约0.101美元,4K图像约0.151美元 [5] - 相比Nano Banana Pro(2K图像0.134美元/张,4K图像0.24美元/张),Nano Banana 2在4K分辨率下价格降低约37% [5] - 推理速度接近翻倍,生成4K图像时间可缩短至不到一分钟 [5][6] - 单张图像生成成本约为0.067美元,约为Nano Banana Pro的一半 [6] 战略意义与行业影响 - 谷歌正试图将AI生图从“创意玩具”转变为“工业生产线”,核心逻辑是提供可预测的工业化输出 [7] - 通过注入世界知识、解决文字排版顽疾、提供可控的多图一致性,使生成物可直接用于广告、电商、UI设计等商业场景,减少人工修图需求 [7][8] - 示例应用展示了其向流程化、批量化生成符合业务逻辑的视觉内容方向发展 [8] - Nano Banana 2的出现标志着AI生图竞赛进入“画得多快、多准、多便宜”的阶段,谷歌意图通过“Pro级能力 + Flash级速度”的组合在规模化应用上拉开差距 [9] - 在“信息图表准确性”、“指令遵循度”、“事实性”等基准测试指标上,该模型已显著领先于部分主流竞品 [9] - 该模型可能成为企业用户将AI生图从“试点”纳入“生产流水线”的拐点 [9]
谷歌发布NanoBanana2
财经网· 2026-02-27 10:07
公司产品发布 - 谷歌推出最新图像模型NanoBanana2 为旗下新款Flash模型带来高保真图像生成与更快速 更先进的编辑功能 [1] - NanoBanana2模型将在谷歌旗下各产品中逐步上线 [1] - 公司将于3月23日在谷歌营销平台推出GeminiAdvantage产品 [1]
联手三星,让安卓系统点外卖,谷歌给AI手机先“打个版”
第一财经· 2026-02-27 10:06
文章核心观点 - 谷歌通过与三星合作,在Galaxy S26系列手机中推出基于Gemini大模型的AI功能,标志着安卓系统向“智能系统”演进,谷歌可能因此成为AI手机领域的最大赢家 [1][4][10] - 行业将2024年视为“AI手机元年”,AI手机出货量预计将大幅增长,谷歌的AI技术路径选择对行业发展具有风向标意义 [11] 产品与功能发布 - 三星在Galaxy Unpacked发布会上推出Galaxy S26系列手机,并与谷歌合作在安卓系统中推出新的AI功能 [1] - 新AI功能通过长按手机侧边电源键唤醒Gemini,用户可用自然语言下达指令,完成如打车、订餐、购物等多步骤复杂任务 [4] - 具体应用场景包括出行打车(如Uber)、餐饮外卖(如DoorDash、Grubhub)和生鲜杂货配送 [4] - 功能演示显示,AI可读取群聊内容,梳理个人偏好,自动启动外卖应用并生成订单等待用户确认 [6] - 系统是透明和可控的,用户可从通知中观察AI的每一个操作步骤,AI在后台运行时用户仍可自由操作手机 [6] - 升级了Circle to Search(圈选即搜)功能,未来可一次性搜索多个对象,并提供虚拟试穿功能 [6] - 新的安卓系统集成了设备端Gemini模型,可在通话中智能识别潜在诈骗并发出警报,分析在设备端进行以保护隐私 [7] - Gemini测试版功能将首先在谷歌Pixel 10、Pixel 10 Pro和三星Galaxy S26系列上推出,最初仅在美国和韩国推出 [7] 技术路径与生态策略 - 谷歌的AI手机智能体主要依靠Gemini的大模型能力,尚未触及安卓底层系统权限 [1] - 与字节跳动“豆包手机”采用单纯的AI读屏(无障碍权限)路径不同,谷歌采用了AppFunctions(类似苹果意图框架)与UI automation(读屏自动化)并行的技术路径 [9] - AppFunctions和UI automation需要用户和App的双重授权,其设计初衷是为App减负、降低开发成本,这与当前市面上其他AI手机有本质不同 [10] - 谷歌选择搭建平台呼唤开发者加入,而非改变安卓系统权限,将安卓从操作系统转变为“智能系统”的最大障碍依然是应用开发者 [10] - 目前任务自动化功能仅限于优步、Grubhub和DoorDash等少数应用,谷歌希望今年晚些时候能有更多应用原生支持智能体操作 [10] - 谷歌正与一小部分App开发者合作优化体验,并计划在今年晚些时候分享更多关于如何为App启用智能代理集成的信息 [10] 市场竞争与行业动态 - 三个月前,字节跳动与中兴努比亚发布的“豆包手机”成为现象级产品,首批3万个售价3499元的样机一夜售罄,其核心卖点是系统级AI助手 [7] - 中兴通讯终端事业部总裁倪飞称,谷歌的跟进印证了AI智能体是手机行业的共同方向,但指出三星S26与Gemini的组合只实现了努比亚M153的局部能力 [8][9] - 苹果已确认将采用谷歌的Gemini大模型来驱动下一代Apple Intelligence功能,这意味着Gemini将成为安卓和iOS两大平台的AI基座,覆盖全球绝大多数智能手机用户 [10] - 三星宣布其Galaxy AI已覆盖全球4亿台设备,与谷歌合作后,预计2024年搭载Gemini的设备数量将翻倍至8亿台 [11] 市场预测与发展趋势 - 根据IDC预测,2026年中国智能手机市场中,新一代AI手机的出货量将达到1.47亿台,同比增长31.6%,占据整体市场的53% [11] - 业界普遍将2024年视为“AI手机元年” [11] - 当前AI手机主要有两条技术路线:一是系统权限结合视觉路径(通用性强但隐私风险大),二是A2A(智能体互联)路线(对隐私更友好但需授权谈判) [11] - 谷歌的AI技术路径选择对AI手机的发展有较强的风向标意义,其选择搭建平台并部分使用视觉技术,AI手机智能体的最终走向仍有待观察 [11]
深度解析谷歌版「豆包手机」:Android 的统治者下了一盘什么棋?
36氪· 2026-02-27 09:47
AI硬件形态的演进趋势 - AI正推动智能手机等硬件设备产生新的形态变化,例如智能手机新增独立AI按键,智能眼镜被视为下一代个人终端的潜在形态,小而专注的AI设备在某些场景下比All-in-one设备更可靠,而试图一次性替代手机的激进尝试则遭遇市场冷遇 [1] 三星与Google的Gemini智能体合作 - 三星Galaxy S26系列与Google合作,展示了全新的Gemini智能体能力,用户可通过口头吩咐让Gemini在Uber打车或在DoorDash点外卖,该功能目前处于早期预览阶段,仅在美国和韩国提供 [2][3] - 此合作可被视为全球版的“豆包手机助手”,相关能力后续将推送到Google Pixel 10及更多Android 17设备上 [5] - 与字节跳动“豆包手机”主要依赖系统级权限和读屏的“硬来”思路不同,三星与Google的Gemini智能体结合了AI读屏理解与系统/应用层API双重路径,并已与排名前200的应用开发者大体达成合作 [8] Gemini智能体的核心功能与体验 - Gemini的“自动任务”能力可模仿人类操作手机实现自动化,例如在虚拟窗口中执行打车、订餐等任务,该虚拟窗口是一个沙箱化的“虚拟机”,旨在保护用户隐私 [9] - Gemini具备杀手级能力,能结合读屏与信息抓取功能处理复杂任务,例如从聊天记录中提取披萨订单详情并自动在外卖平台完成添加购物车等操作,甚至在遇到问题时(如披萨店限购)能提供替代解决方案 [13][14][16] - Google高管透露,Gemini并非预编程,而是利用推理能力模仿人类查看屏幕并操作,这意味着其在更多场景具备应用潜力,目前首批主打订餐、叫车等日常场景 [16] Google的Android系统底层AI战略 - Google为Android系统推出了名为“AppFunctions”的框架,允许开发者公开应用特定功能入口供AI助手调用,其逻辑类似苹果的App Intents,旨在通过规范化接口确保兼容性 [20][21][22] - 基于AppFunctions,Gemini无需打开相册或短信应用,即可通过调用对应功能入口完成如“找出特定照片并用短信发送”等任务,效率更高 [23] - 同时,Google正在开发UI自动化框架,允许AI助手模仿人类直接打开App逐步操作,此路径无需应用额外适配,上线即可覆盖大量应用,是“豆包手机”路线的翻版 [24][26][28] - AppFunctions(需应用适配)与UI自动化框架(依赖AI能力,无需适配)是Google为Android Gemini智能体规划的两条互补技术路线 [28] - 这些系统级自动化能力并非Gemini专属,未来手机厂商内置AI助手或第三方应用(如ChatGPT)均可调用,三星Galaxy S26的国行版Bixby助手也已通过替代模型实现类似功能 [28][29] 行业影响与未来展望 - Google手握整个Android生态,其选择“豆包手机”路线并构建系统级自动化样板,为众多新机赋予了化身“豆包手机”的潜力,这标志着AI手机道路并非只有“孤勇者” [31][33] - 此浪潮可能不止于Android阵营,苹果已与Google达成合作,Gemini将成为Siri的技术支持,且苹果的App Intents与Google的AppFunctions非常相似 [33] - Google的愿景是将Gemini智能体扩展至手机以外的硬件,如智能眼镜、AI吊坠甚至汽车,用以完成复杂任务,尽管该场景距离落地尚远 [35] - 行业面临的主要挑战在于手机厂商、AI模型提供商与大平台应用之间围绕AI时代新“入口”的争夺,例如Gemini叫车可能绕过Uber的广告与促销,直接损害平台利益,预计将引发激烈博弈 [38]
数据中心互联技术专题:AI变革推动OCS新技术快速发展
国信证券· 2026-02-27 08:45
报告行业投资评级 - 投资评级:优于大市(维持评级) [2] 报告核心观点 - 光交换机(OCS)是一种无需光电/电光转换、直接在光域完成信号路由与切换的新技术,能有效解决传统电交换的带宽瓶颈、功耗和时延问题,可助力AI算力集群及数据中心光互连系统整体功耗降低30%以上 [3][13] - AI变革正推动OCS技术快速发展,其核心应用场景包括AI算力集群、超大规模数据中心的叶脊架构互连及超节点集群高速通信 [3][13] - 目前OCS主要有MEMS、液晶、压电、硅波导四大技术路线,其中谷歌主导的MEMS方案商用节奏最快,在2025年占据市场90%以上份额 [3][14] - 随着谷歌从“自研+代工”模式转向整机采购,以及除谷歌外的云服务商(如微软、Meta、英伟达)开始导入,OCS市场空间正快速释放,预计将从2025年的约4亿美元增长至2029年的超过25亿美元,四年复合年增长率(CAGR)约为58% [4][79][93] - OCS技术目前仍处于产业化初期,随着渗透率提升,相关元器件/材料(如准直器、钒酸钇镜头、透镜等)需求将上升,国内已与海外头部厂商深度合作的器件及整机方案提供商有望受益 [4][93] 根据相关目录分别进行总结 一、 OCS是一种新光电互联集成技术 - **技术定义与优势**:OCS无需光电转换,具有高带宽、速率/协议透明、低延迟、低功耗及灵活部署等优势。其单跳延迟低于100纳秒,整机功耗极低(如Palomar整机约108W),且硬件可支持从40G到未来3.2T的速率演进 [13] - **四大技术路线对比**: - **MEMS方案**:由谷歌主导,商用最快,2025年处于商用阶段。谷歌Palomar OCS的物料清单成本约为25,470美元,其中MEMS阵列成本占比最高,达54.97% [14][27] - **液晶方案**:以Coherent为代表,切换时间较慢(约100毫秒),但可靠性高。其物料清单成本约为50,000美元 [14][36][39] - **压电陶瓷方案**:以HUBER+SUHNER为代表,传输性能优异、可靠性高,但切换时间较慢且端口扩展性差 [14][44] - **硅光波导方案**:以iPronics、德科立为代表,切换速度快(可达微秒级)、集成度高,但插入损耗较高,存在串扰问题 [14][45][49] 二、 OCS面向AI数据中心的应用 - **谷歌TPU的演进与OCS应用**:谷歌自研TPU芯片已发展到第七代(Ironwood)。从TPU v4开始,谷歌在AI算力集群中大规模应用OCS技术 [51][53][64] - **具体部署规模**: - **TPU v4集群**:由4096个TPU芯片组成,需要48台300端口的OCS交换机,总端口需求达12,288个 [64] - **TPU v7(Ironwood)集群**:由9216个TPU芯片组成,需要48台600端口的OCS交换机,总端口需求达13,824个。其使用的600端口OCS交换机成本可能达到5万美元 [71] - **网络拓扑**:谷歌TPU芯片主要采用2D-Torus和3D-Torus(三维环面网络)互联方式,OCS用于实现芯片间的高速、低延迟互连 [56][64] 三、 OCS产业链各环节公司布局 - **市场规模预测**:根据Cignal AI数据,2025年OCS市场规模约4亿美元,到2029年将超过25亿美元。LightCounting预计2029年OCS出货量将突破5万台 [79][93] - **国内产业链相关公司**: - **MEMS工艺**:赛微电子(瑞典Silex)为全球领先的纯MEMS代工厂 [83] - **光学元器件/材料**:腾景科技(提供钒酸钇材料、准直器)、炬光科技(布局透镜、V型槽、准直器等) [83] - **整机方案与子系统**: - 德科立:与iPronics联合研发硅光波导方案OCS,已展示32x32 OCS整机 [83][84] - 中际旭创:子公司TeraHop基于硅光子平台研发64x64 OCS交换机 [83] - 光迅科技:拥有垂直整合能力,在OFC 2024展示MEMS OCS交换机 [83][87] - 光库科技(通过武汉捷普):与Calient协作展示320x320 OCS产品 [83] - **代理与解决方案**:凌云光与压电陶瓷方案厂商Polatis建立长期合作关系 [83] 四、 投资建议 - **核心逻辑**:OCS技术处于产业化初期,未来随着谷歌及更多云服务商采用,市场需求将快速增长,带动上游元器件及整机产业链发展 [4][93] - **关注公司**:报告推荐关注OCS整机方案提供商**中际旭创**和**光迅科技** [93] - **相关公司盈利预测(基于Wind一致预期)**: - 中际旭创:预计2025年净利润105.36亿元,2026年净利润214.93亿元 [95] - 光迅科技:预计2025年净利润10.44亿元,2026年净利润14.85亿元 [95]
24小时环球政经要闻全览 | 2月27日
格隆汇APP· 2026-02-27 08:40
全球股市表现 - 欧美市场涨跌互现,道琼斯工业平均指数微涨0.03%至49499.2点,纳斯达克指数下跌1.18%至22878.38点,标普500指数下跌0.54%至6908.86点 [1] - 欧洲斯托克50指数下跌0.19%,英国富时100指数上涨0.37%,法国CAC40指数上涨0.72% [1] - 亚太市场分化明显,韩国KOSPI指数大涨3.67%至6307.27点,日经225指数上涨0.29%,台湾加权指数基本持平,恒生科技指数则大跌2.87%至5109.33点 [1] - 中国A股市场表现平淡,上证指数微跌0.01%至4146.63点,深证成指上涨0.19%,创业板指下跌0.29% [1] - 其他新兴市场中,越南VNINDEX指数上涨1.10%,泰国SET指数上涨1.16%,印度孟买Sensex指数微跌0.03% [1] 地缘政治与安全事件 - 巴基斯坦与阿富汗边境爆发激烈交火并迅速升级,双方互相指责对方挑衅,阿方称打死55名巴方士兵并夺取15处哨所,巴方则称击毙36名阿方武装人员,巴方于27日凌晨发起空袭,地区安全局势趋于紧张 [2] - 美伊核谈判在阿曼调解下于日内瓦举行并取得重大进展,旨在化解核争端、避免军事冲突,双方将回国磋商后尽快复谈,下周在维也纳开展技术层面讨论,此举有助于缓和当前美国在中东部署大量军力背景下的地区紧张局势 [3] 美国制裁与外交施压 - 美国为在乌克兰和平谈判中向俄罗斯施压,放缓了俄罗斯油气巨头卢克石油海外资产出售进程,美国财政部外国资产控制办公室将交易截止日期由2月28日延长至4月1日,涉及资产达220亿美元 [3] - 美国财政部下属金融犯罪执法网络提出拟议新规,计划切断瑞士MBaer Merchant Bank AG接入美国金融体系的权限,理由是认定该行向俄罗斯、伊朗相关非法行为者提供金融支持,新规若生效将禁止美国金融机构为该行开立或维持代理行账户 [3] 人工智能与科技进展 - DeepSeek联合清华大学、北京大学发布论文,推出DualPath大模型推理系统,该系统采用双路径KVCache加载机制,高效利用集群带宽,使离线推理量最高提升1.87倍,在线服务平均提升1.96倍,旨在攻克智能体推理的I/O瓶颈 [4] - 谷歌推出最新图像模型Nano Banana 2,包括Gemini生态的Nano Banana 2 Flash和企业级的Imagen 4 Fast,生成速度显著提升,部分场景1-2秒即可出图,同时保持高生成质量,将于3月23日在谷歌营销平台推出Gemini Advantage [5] - 博通开始出货业内首款3.5D面对面计算SoC,该产品基于XDSiP平台与2纳米工艺,融合2.5D与3DIC面对面堆叠技术,可提升信号密度、能效并降低延迟,旨在适配大规模AI集群算力需求 [5][6] 半导体制造设备突破 - ASML高管证实,其新一代EUV光刻机已达量产标准,台积电、英特尔等客户可投入大规模生产,该设备能简化复杂工序、降低制造成本,助力产出更强效的先进制程芯片,对AI算力升级与产业发展至关重要 [5] 企业并购与商业动态 - 奈飞宣布拒绝提高对华纳兄弟探索的收购报价,称匹配派拉蒙最新报价将失去财务吸引力,因此退出竞购,同时奈飞重启股票回购计划,受此消息影响,其盘后股价大涨约10% [5] - 长和发布公告称,巴拿马政府依据最高法院裁决与行政法令,强行接管其旗下PPC公司运营的巴尔博亚港及克里斯托瓦尔港,终止特许经营权并迫使PPC停运,长和表示强烈反对并将通过法律程序维护权益 [4]
谷歌生图新王Nano Banana 2深夜突袭,性能屠榜速度飞升,价格腰斩
36氪· 2026-02-27 08:15
产品发布与核心性能 - 谷歌正式发布其最强图片生成和编辑模型Nano Banana 2 (Gemini 3.1 Flash Image),该模型已在谷歌Gemini应用、搜索、AI Studio等全线产品中上线 [1] - 该模型兼具Pro级功能与Flash级速度,在世界知识、图像质量、推理能力和主体一致性等方面实现全面升级 [2] - 在基准测试中,Nano Banana 2大幅超越了GPT-Image 1.5、Seedream 5.0 Lite、Grok Imagine Image Pro等业界领先模型,配合思考模式、文本和图像搜索工具则全面超越Nano Banana Pro [2] 实测性能与关键升级 - 实测显示,Nano Banana 2可在1分钟内生成4K图片,生成图片细节逼真度增强,指令精准执行上表现超出预期 [4][31] - 模型在文字渲染能力和中国传统文化储备方面有提升,例如能较准确地生成“一只大熊猫写毛笔字”的图片,文字笔锋流畅且基本无错别字 [12] - 模型在处理复杂场景方面有明显提升,例如能生成包含多人、反射、多变光照的复杂城市场景,细节密度远超预期 [23] - 模型解决了部分“时钟难题”,能够根据“传统时钟 21:35”的提示词较精准地生成时钟,但面对更复杂的“时钟+满杯红酒”多重难题时,生成仍不准确 [24][28] - 模型在特殊角度透视还原上比较逼真,能准确控制仰视视角下的人物比例和透视关系,形态没有畸变 [14] - 在多人物互动与情感交流的生图体验中,能准确还原场景、动作和表情,但在眼泪折射等极细微流体形状上仍不自然 [17] - 模型具备精准的指令遵循能力,例如能根据多张输入图片,在保持原图一致性的基础上替换指定物体,并符合物理规律 [19] 核心技术升级点 - 先进世界知识:模型调用Gemini的真实世界知识库,并结合网络搜索获取实时信息和图像,能更准确地呈现特定主题,用于创建信息图表、数据可视化等 [32] - 精准文本渲染与翻译:可为营销素材或贺卡生成准确易读的文本,并能翻译和本地化图像中的文字 [32] - 更强创作控制力:在单个工作流中,最多可保持五个角色的形象相似性,以及最多14个对象的特征一致性 [35] - 生产就绪规格:支持从512px到4K的多种分辨率和宽高比,新增了4:1、1:4、8:1和1:8等原生宽高比支持 [35][39] - 画质提升:呈现更鲜艳的光照、更丰富的纹理和更清晰的细节,在保持速度的同时实现高质量画面效果 [35] - 可配置的思考模式:用户可调整思维水平,使模型在渲染前能推理复杂提示,从而提高输出质量和提示遵循度 [39] 定价策略与产品定位 - Nano Banana 2的价格相比Nano Banana Pro不增反降,在谷歌AI Studio平台,输入图片的单价从2美元降至0.5美元,输出图片的单价也从0.134美元减半至0.067美元 [8] - 按照谷歌设计,Nano Banana Pro适合对事实准确性要求最高的专业任务,而Nano Banana 2则适合快速生成、精确指令遵循和图像搜索集成的工作场景 [10][40] - 在谷歌Gemini应用,Nano Banana 2已取代Fast、Thinking和Pro版本中的Nano Banana Pro,但Pro和Ultra订阅用户仍可按需继续选择使用Nano Banana Pro [10][40] 应用场景与生态整合 - 谷歌构建了名为“靠窗座位(Window Seat)”的示例App,利用Nano Banana 2的知识和网络图像搜索来创建受世界各地位置和实时天气数据启发的逼真窗景 [37] - 谷歌开发了“全球广告本地化器(Global Ad Localizer)”演示App,可将广告翻译成不同语言并适配图像中的文字,以适应国际市场 [38] - “宠物护照(Pet Passport)”演示版只需用户宠物的一张照片,即可确保其在生成的不同目的地图片中保持相同的形象 [39][43] - Nano Banana 2已在谷歌全线产品上线,包括Gemini应用、搜索(新增141个国家和地区及8种语言支持)、AI Studio+API、Google Cloud的Vertex AI以及Flow(对所有Flow用户免费) [40] 行业竞争格局 - 全球AI生图赛道竞赛升级,国内字节Seedream 5.0、阿里Qwen-Image-2.0等国产模型密集出击 [42] - 谷歌正将竞争从单纯的画质比拼,引向世界知识集成、精准指令执行和生产效率的综合较量 [42] - 随着Nano Banana 2发布,谷歌图像生成产品矩阵实现更清晰切割,Pro版驻扎专业高地,Flash版以更快、更便宜、足够好的策略抢占规模化应用场景 [42] - AI图像生成的竞赛已从“能不能画”迈入“画得多快、多准、多便宜”的新阶段 [42]
Meta据悉与谷歌达成AI芯片租用协议
新浪财经· 2026-02-27 08:10
核心交易 - 公司已签署协议,租用另一家科技公司的人工智能芯片(张量处理单元)来开发新的AI模型 [1][1] - 该协议是一项为期多年的协议,价值数十亿美元 [1][1] 行业动态 - 科技行业在人工智能基础设施领域出现重要合作,一家头部社交媒体与元宇宙公司向另一家搜索与云计算巨头采购关键算力 [1][1]