Workflow
Google Lens
icon
搜索文档
谷歌将Gemini人工智能助手引入Wear OS智能手表
环球网资讯· 2025-07-10 11:19
来源:环球网 该助手具备跨应用执行任务的能力,例如"总结艾米丽发来的最后一封邮件""把我儿子接下来的五场棒 球比赛添加到日历"等。同时,它还能帮助用户记录重要信息,像"记住我把车停在4层27号位""提醒下 班后买日用品"等。 此外,谷歌对去年推出的Circle to Search(圈选搜索)功能进行了升级。如今,用户通过圈选、高亮、 涂鸦或点击屏幕内容进行搜索时,会直接调用AI Mode的深度推理能力。搜索结果将呈现AI概览,用户 若想追问,可点击"通过AI Mode深入了解",无需切换应用。 谷歌还简化了在Google Lens中使用AI Mode的流程,目前安卓和iOS系统的谷歌应用程序均已支持该功 能。值得一提的是,用户在手机上玩游戏时也能使用"圈子搜索"功能,例如识别新角色或找到制胜策 略。 【环球网科技综合报道】7月10日消息,谷歌近日宣布计划在未来几周内,将Gemini人工智能助手引入 运行Wear OS 4及更新系统的智能手表,涉及Pixel、三星、OPPO、一加和小米等多个品牌。此举是谷歌 用Gemini全面取代Google Assistant计划的重要一步。 用户可通过多种方式启动该功能,包 ...
谷歌IO大会点评
2025-05-21 23:14
纪要涉及的公司 谷歌 纪要提到的核心观点和论据 - **应对竞争增强 AI 搜索产品竞争力**:谷歌通过提升 AI 搜索器比例、推出升级版 AI 模式,使 AI 搜索产品月活跃用户达 15 亿;月均处理 tokens 达 480 万亿,较去年同期增长 50 倍,远超微软同期 50 万亿的处理量;今年资本开支预计 750 亿美元,云业务增速显著[2][3] - **原生多模态技术取得进展**:展示 native language understanding 功能,支持原生语音和音频输出;演示视频和图像生成产品 ImageFour 的更新[2][6] - **Google Lens APP 新增功能**:Project Xtra 改名为 Jennifer Live,实现实时屏幕共享和摄像头演示;增加实时投影、与 AI 助手互动等功能[2][7] - **提升算力支持生态系统**:2024 年等效 H100 算力接近 150 万,2025 年预计达到 450 万,但因生态系统消耗量大,仍需扩展计算能力[2][8] - **推出新的 AI 功能和技术**:推出基于 Gemini APP 的 AI agent(Action Intelligent),能主动操作用户手机并接入 MCP 接口;PC 端推出 agent mode 功能,与 Airbnb 等合作预约;推出 Chrome 浏览器扩展 Gmail on Chrome[9] - **利用生态系统增强 AI 应用**:通过整合安卓设备、Gmail 邮箱、Google 日历等,推出 personal context 功能,利用用户个人信息背景提供个性化服务[4][10] - **推出新的 AI 眼镜**:推出 Android XR AI 眼镜,与三星、高通、时尚眼镜公司合作,具备发短信、拍照、实时对话翻译等功能[11] - **构建下一代模型**:构建世界模型,从模拟世界各方面学习和理解,推动机器人技术发展,使 AI 系统能在现实世界有效运作[4][12] 其他重要但是可能被忽略的内容 - 谷歌提前发布 Jenna 2.5 Pro 预览版本,而非原计划在 520 当天发布[3] - 升级版 AI 模式输出内容更丰富、详细,包含更多图表总结,tokens 数量是传统 AI Overview 的两到三倍[4][5] - 全美范围内全面推出增强现实试穿功能,消费者可通过拍摄全身照片虚拟试穿衣物[5] - 谷歌 JUMPER 2.5 Po 模型 TOKEN 调用量增长最快,微软月均消耗 50 万亿 TOKEN,谷歌达到 48 万亿 TOKEN,供不应求[13] - 谷歌全面武装产品线上的 AI 能力,包括 QQ 浏览器、手机端及 PC 端,以提升整体竞争力[13]
微软CPO专访:Prompt是AI时代的PRD,产品经理的工作方式已经彻底变了
Founder Park· 2025-05-21 20:05
AI时代的产品设计范式转变 - Prompt正在取代传统PRD成为产品构建起点 要求团队在推进新项目时需提供原型和对应提示词集合[1][20] - 自然语言交互(NLI/NLX)成为新UX设计范式 需重新定义对话语法、结构和界面元素等设计原则[14][15] - 产品开发节奏呈现"不均匀"特征:从想法到Demo时间缩短 但从Demo到全面上线周期延长[21] Agent的核心特征与设计原则 - 本质是能自主执行任务的独立软件进程 具备三要素:自主性(任务委托层级)、复杂性(多步骤任务)、自然交互(实时协作)[11][13] - 职场研究型Agent案例展示突破性价值:不仅能节省时间 更能连接用户未察觉的认知突触[6][8] - 交互设计需平衡透明度与效率 包括思考过程展示程度、计划可修改性、智能追问机制等新组件[16][17] 产品经理的能力重构 - "品味"和"编辑能力"成为核心竞争力 需在创意供给爆炸的环境中担任核心决策者[3][25] - 需掌握"AI本能式使用" 通过工具如WWXD(模拟关键人物思维)提升决策质量[26][27] - 角色向"软件指挥者"演变 需保持计算机思维模型但采用更高阶表达方式[22] 从0到1产品的关键方法论 - 区分"解决问题"与"扩大规模"阶段 早期应容忍方向调整避免局部最优陷阱[35][37] - 警惕早期指标的"伪精确性" 定性反馈比CTR/留存率等传统指标更具参考价值[3][36] - 成功产品需至少占据两个转折点:技术飞跃(如LLM)、用户行为变化(如拍照习惯)、商业模式创新[41][42] 企业级AI落地策略 - 采用"双轨制"推进:在确保合规基础上建立Frontier项目让早期采用者先行体验[47][48] - GitHub案例显示系统化优势:代码生成仅是入口 需整合仓库管理、专业领域适配等完整生态[53][54] - Excel的启示:高学习曲线工具可通过复利效应建立护城河 关键在于持续打磨核心价值[55] 未来人机协作趋势 - 将出现"人和Agent共创空间" 重新设计信息流动与任务分配机制[66] - 当前处于"人类驾驶-AI副驾"过渡期 未来自主性将随推理能力提升而增强[4][5] - 产品体验需从单人模式转向多智能体协作 探索异步任务处理等新范式[12][65]
谷歌I/O 2025:Gemini 2.5系列更新,Veo 3支持生成有声视频,还有250刀的AI会员
Founder Park· 2025-05-21 11:40
Gemini 2.5系列模型更新 - Gemini 2.5 Pro在LMArena排行榜中ELO得分1448分,所有类别排名第一,碾压其他模型,支持原生文本到音频生成 [1][10][11] - Gemini 2.5 Pro(Deep Think)在数学、编码、多模态榜单刷新SOTA,在2025 USAMO数学奥赛中取得40.4%高分,比2.5 Pro提升10%以上,LiveCodeBench竞赛级编程得分80.4%,多模态推理MMMU得分84.0% [34][37] - Gemini 2.5 Flash在LMArena得分1424分,仅次于2.5 Pro,生成速度更快、成本更低,评估中使用的token减少20%-30% [24][25][27] 多模态模型Imagen 4和Veo 3 - Imagen 4生图细节逼真,生成速度比Imagen 3快10倍,分辨率最高达2k,完美处理拼写和版式任务 [4][58][60][61][63] - Veo 3首次支持原生音频输出,可生成对白、背景音等,实现音视频融合,在文本/图像生成提示、物理模拟和口型同步等方面表现出色 [4][66][67][68][71] 新产品与服务 - 推出订阅服务Google AI Ultra,费用250美元/月(比ChatGPT Pro贵50美元),可无限访问最新模型,同时推出Pro版20美元/月,支持Gemini 2.5 Pro、Veo 2和NotebookLM [5][7] - 推出全新文本扩散模型Gemini Diffusion,每秒输出1000多个token,性能比Gemini 2.0 Flash-Lite快5倍,擅长编程和数学任务 [39][40][41][43] - 推出创意平台Flow,集成Veo、Imagen、Gemini模型,可无缝创建电影片段、场景和故事 [72][73][74] AI Mode搜索功能 - AI Mode将搜索与AI深度集成,采用专用于Search的Gemini 2.5模型,自动规划搜索结果展现形式(文本、视频、地图等),支持复杂问题解答 [76][77][81][83] - Google Lens支持框选页面信息自动弹出答案,智能购物功能可虚拟试衣并自动下单付款 [85][87][90][91][92] 硬件产品 - 推出Project Moohan头显和XR眼镜,由Gemini加持,对标苹果和Meta产品,预计年内发布 [7][102][104] 行业影响与愿景 - Gemini已成为最好的多模态基础模型,未来将扩展为"世界模型",Project Astra愿景是让AI助手真正帮助人类日常生活 [48][50][51][52][53] - 公司在AI加速科学发现方面取得成就,包括AlphaFold、AIME等,并与Ira公司合作帮助盲人提升独立性 [54][55]
Pinterest CEO Credits AI-Powered Personalization for 16% Revenue Growth
PYMNTS.com· 2025-05-09 09:06
财务表现 - 第一季度营收达8.55亿美元,同比增长16% [1] - 月活跃用户数达5.7亿,同比增长10% [1] 用户增长与战略 - 公司投资人工智能技术,成功吸引Z世代用户,该群体是最大且增长最快的用户群体 [1][3] - 视觉探索与行动能力是核心差异化优势,也是用户选择平台的重要原因 [3] 技术发展 - 2025年将加倍投入多模态AI模型驱动的视觉搜索能力 [3] - 利用增强的多模态技术提升用户个性化体验 [4] - 近期在美国、英国和加拿大扩展视觉搜索功能,专注于女性时尚内容 [6] 行业动态 - 社交媒体平台纷纷增加购物功能,行业投资增加 [5] - 初创公司Aesthetic进入AI驱动的服装识别领域,专注于时尚细节识别 [4][6] - 谷歌与零售商合作,将Lens技术直接集成到应用中 [5] 产品创新 - 新工具允许用户通过图像分解和解码快速搜索和购买喜欢的服装细节,无需文字输入 [7]
苹果高级副总裁埃迪・库伊:考虑在 Safari 浏览器中集成 AI 搜索
搜狐财经· 2025-05-08 00:06
IT之家 5 月 7 日消息,据彭博社报道,苹果公司正积极考虑重塑其 Safari 浏览器,将重点转向由 AI 驱动的搜索引擎。 库伊称 Safari 浏览器的搜索量在上个月首次出现下降,并将此归因于用户转向使用 AI 工具。 苹果公司服务部门高级副总裁埃迪・库伊(Eddy Cue)今日在美国司法部对 Alphabet 公司的反垄断诉讼中作证时透露了这一信 息。该诉讼的焦点是苹果与谷歌之间每年约 200 亿美元(IT之家注:现汇率约合 1441.84 亿元人民币)的协议,从而使谷歌成为 Safari 浏览器的默认搜索引擎。 他表示,包括 OpenAI、Perplexity 和 Anthropic 在内的 AI 搜索提供商,最终可能取代谷歌等传统搜索引擎,预计苹果未来会在 Safari 浏览器中引入这些提供商作为搜索选项。 "我们会将它们添加到列表中 —— 它们可能不会成为默认选项。"他还补充说,这些服务仍需进一步完善。他特别提到,苹果已 与 Perplexity 进行了初步讨论。目前,苹果在 Siri 中将 ChatGPT 作为一个选项,并计划在今年晚些时候引入谷歌的 AI 搜索产品 Gemini。 库伊指出 ...
市场消息:苹果(AAPL.O)与谷歌(GOOG.O)智能镜头(Google Lens)就人工智能功能达成了收入分成协议。
快讯· 2025-05-07 23:14
市场消息:苹果(AAPL.O)与谷歌(GOOG.O)智能镜头(Google Lens)就人工智能功能达成了收入分成协 议。 ...