AI 自动化
搜索文档
深度解析谷歌版「豆包手机」:Android 的统治者下了一盘什么棋?
36氪· 2026-02-27 09:47
AI硬件形态的演进趋势 - AI正推动智能手机等硬件设备产生新的形态变化,例如智能手机新增独立AI按键,智能眼镜被视为下一代个人终端的潜在形态,小而专注的AI设备在某些场景下比All-in-one设备更可靠,而试图一次性替代手机的激进尝试则遭遇市场冷遇 [1] 三星与Google的Gemini智能体合作 - 三星Galaxy S26系列与Google合作,展示了全新的Gemini智能体能力,用户可通过口头吩咐让Gemini在Uber打车或在DoorDash点外卖,该功能目前处于早期预览阶段,仅在美国和韩国提供 [2][3] - 此合作可被视为全球版的“豆包手机助手”,相关能力后续将推送到Google Pixel 10及更多Android 17设备上 [5] - 与字节跳动“豆包手机”主要依赖系统级权限和读屏的“硬来”思路不同,三星与Google的Gemini智能体结合了AI读屏理解与系统/应用层API双重路径,并已与排名前200的应用开发者大体达成合作 [8] Gemini智能体的核心功能与体验 - Gemini的“自动任务”能力可模仿人类操作手机实现自动化,例如在虚拟窗口中执行打车、订餐等任务,该虚拟窗口是一个沙箱化的“虚拟机”,旨在保护用户隐私 [9] - Gemini具备杀手级能力,能结合读屏与信息抓取功能处理复杂任务,例如从聊天记录中提取披萨订单详情并自动在外卖平台完成添加购物车等操作,甚至在遇到问题时(如披萨店限购)能提供替代解决方案 [13][14][16] - Google高管透露,Gemini并非预编程,而是利用推理能力模仿人类查看屏幕并操作,这意味着其在更多场景具备应用潜力,目前首批主打订餐、叫车等日常场景 [16] Google的Android系统底层AI战略 - Google为Android系统推出了名为“AppFunctions”的框架,允许开发者公开应用特定功能入口供AI助手调用,其逻辑类似苹果的App Intents,旨在通过规范化接口确保兼容性 [20][21][22] - 基于AppFunctions,Gemini无需打开相册或短信应用,即可通过调用对应功能入口完成如“找出特定照片并用短信发送”等任务,效率更高 [23] - 同时,Google正在开发UI自动化框架,允许AI助手模仿人类直接打开App逐步操作,此路径无需应用额外适配,上线即可覆盖大量应用,是“豆包手机”路线的翻版 [24][26][28] - AppFunctions(需应用适配)与UI自动化框架(依赖AI能力,无需适配)是Google为Android Gemini智能体规划的两条互补技术路线 [28] - 这些系统级自动化能力并非Gemini专属,未来手机厂商内置AI助手或第三方应用(如ChatGPT)均可调用,三星Galaxy S26的国行版Bixby助手也已通过替代模型实现类似功能 [28][29] 行业影响与未来展望 - Google手握整个Android生态,其选择“豆包手机”路线并构建系统级自动化样板,为众多新机赋予了化身“豆包手机”的潜力,这标志着AI手机道路并非只有“孤勇者” [31][33] - 此浪潮可能不止于Android阵营,苹果已与Google达成合作,Gemini将成为Siri的技术支持,且苹果的App Intents与Google的AppFunctions非常相似 [33] - Google的愿景是将Gemini智能体扩展至手机以外的硬件,如智能眼镜、AI吊坠甚至汽车,用以完成复杂任务,尽管该场景距离落地尚远 [35] - 行业面临的主要挑战在于手机厂商、AI模型提供商与大平台应用之间围绕AI时代新“入口”的争夺,例如Gemini叫车可能绕过Uber的广告与促销,直接损害平台利益,预计将引发激烈博弈 [38]