生成式界面
搜索文档
谷歌今年最成功的两款 AI 应用,都出自他手
Founder Park· 2025-12-24 19:22
核心观点 - 谷歌旗下AI应用,特别是Gemini App和NotebookLM,在2024年实现了用户和市场份额的显著增长,这得益于其负责人Josh Woodward独特的“创业者”气质、快速的产品开发策略以及对用户需求的深刻洞察 [1][4][6] Gemini应用的用户增长与市场表现 - NotebookLM移动端月活跃用户达到800万 [2] - Gemini App月活跃用户从2024年8月的2.66亿增长至11月的3.46亿,净增8000万用户 [2] - 在四个月内,Gemini市场份额上升3个百分点,而ChatGPT市场份额则下降了3个百分点 [2] - 过去一年内,Gemini Pro订阅量同比增幅接近300%,大幅领先于ChatGPT的155%增速 [3] - 在Josh Woodward领导下,Gemini应用的月用户数从3月的3.5亿激增至10月的6.5亿 [9][30] 关键人物Josh Woodward的领导风格 - Josh Woodward被评价为行动迅速、善于打破障碍、执行力强,这些特质使其成为谷歌AI战略的核心 [6] - 其领导风格具有独特的“创业者”气质,体现在快速行动、懂技术且有远见、聚焦用户反馈以及有能力绕开公司官僚体系 [7] - 通过建立名为“block”的内部系统,帮助团队推进项目、打破内部障碍并争取资源 [7][39] - 创立“Papercuts”流程,专门快速响应和解决影响用户体验的细微痛点,并常在社交媒体与用户交流 [40] 产品开发策略与创新理念 - 采用小团队快速开发模式,NotebookLM以5-7人团队在六周内完成原型开发 [7][10][15] - 强调将产品快速推向用户以获取反馈,例如Flow视频创作工具从想法到发布仅用86天 [45] - 认为AI不仅是搜索引擎,更应是帮助用户深度理解与重构知识的伙伴,NotebookLM被设计为一种“新的内容容器” [17] - 提出“生成式界面”的前瞻概念,认为未来AI交互将远超聊天框形式,能动态生成可交互的界面和组件 [34] - 对Gemini应用的最终定位是个人化生活助手,核心是“三个P”:个人化、前瞻性、功能强大 [35] NotebookLM的产品特性与成功因素 - NotebookLM能深度分析用户上传的文档、PDF、音视频,并提供基于原始资料的摘要和洞见,规避“幻觉”问题 [15][17] - 产品设计直观,界面分为原始资料、AI问答互动和丰富的媒体输出(如思维导图)三个区域,保证内容可溯源 [17] - 通过“音频概览”和“视频概览”功能,将海量零散信息提炼成易于消化的精华版本,降低了高质量内容创作门槛 [19][20][21] - 为收集用户反馈,大胆使用外部平台Discord,该频道成员已超过23万 [16][22] - 邀请外部科技作家Steven Johnson加入团队,为产品带来“发现连接”的辅助思考视角 [23] Gemini App的产品突破与功能亮点 - 推出的图像生成功能Nano Banana在技术上解决了AI生图渲染文字和角色一致性的痛点,并通过社交媒体形成病毒式传播 [28][29] - 团队策略是快速观察并简化用户的自发创造力,将高频场景固化为预设提示词或一键功能,极大降低用户参与门槛 [30] - 到9月底,Gemini生成的图像数量突破50亿张,应用在苹果商店榜单上超越了ChatGPT [30] - 强调Gemini模型的原生多模态能力是其实现复杂跨模态创作(如Nano Banana)的根本原因 [33] - 致力于通过“上下文工程”理解用户个人数据,以实现真正的个性化助手体验 [36] 内部管理与文化构建 - 通过“block”系统绕过官僚体系,确保小团队的创新动力,例如为NotebookLM成功争取关键的计算资源 [39] - 在谷歌内部建立快速发布产品的文化,核心是保持小团队规模、优先推向用户、招聘热爱动手的“创造者” [44] - 认为早期产品的成功不能只看数据,更需要与真实用户交流,观察其定性反馈 [41][42][43] - 在招聘时倾向于通过原型表达想法、学习速度快且心态积极的候选人 [49]
谷歌“加码”AI CEO直言“过热”
经济观察网· 2025-11-19 14:15
产品发布与核心能力 - Alphabet旗下谷歌于11月18日深夜推出新一代大型语言模型Gemini 3,并立即部署至谷歌搜索的AI模式、Gemini应用、API接口及VertexAI等核心产品 [1] - 谷歌官方将Gemini 3定义为"通往AGI的重要一步",并强调其是目前世界上多模态理解能力最强、交互最深入的智能体,公司首席执行官称其为"最先进最智能的推理模型" [1] - Gemini 3 Pro具备"原生多模态"核心能力,可一次性处理文字、图片与音频,而非分成不同流程,例如能将菜谱照片整理成食谱,或根据课程视频生成互动抽认卡 [2] - 新模型支持"生成式界面",能以类似数字杂志的方式呈现答案,例如结合梵高生平背景解读其作品时,可为每幅画作生成图文并茂的阐释 [2] - 谷歌同时发布名为"Google Antigravity"的全新智能体平台,允许开发者在更高抽象层级进行任务导向型编程,Gemini 3被描述为最契合"氛围编程"的模型 [2] - 与OpenAI的ChatGPT相比,谷歌强调Gemini 3 Pro的回答不会习惯性"奉承",其表达更聪明、准确、直接,以真正洞见取代客套话 [1] 用户增长与财务投入 - Gemini月活跃用户目前已超过6.5亿,每月处理的Token总量在一年内增长超过20倍 [3] - 在10月发布的财报中,谷歌2025年资本开支上调至910-930亿美元 [3] - 中泰证券指出,谷歌资本开支营收比与经营性现金流占比相比其他云厂商具备提升潜力,预计2026年将继续加大资本投入Gemini [1][3] - 谷歌上月公布了创纪录的收入,并计划在AI建设上继续投入数十亿美元 [3] - Alphabet、Meta、微软和亚马逊均上调了资本开支指引,预计今年合计支出将超过3800亿美元 [4][5] 行业竞争与市场观点 - 尽管谷歌在AI竞赛中起步较慢,但其拥有自研专用芯片、在线搜索约90%的市场份额以及数以百万计的Gmail、Google Docs用户等优势 [4] - 此次发布距离谷歌推出Gemini 2.5仅八个月,距离Gemini 2.0上线仅11个月,而OpenAI已于今年8月发布ChatGPT-5 [4] - OpenAI首席执行官和xAI首席执行官在Gemini 3发布后第一时间向其发来"贺信" [4] - 华尔街对人工智能是否存在泡沫存在大量讨论,美国银行11月全球基金经理调查显示,近20%的投资者认为AI企业存在过度投资,此为2005年8月以来首次 [5] - 围绕OpenAI展开的1.4万亿美元复杂交易,与其不足千分之一投资规模的年度预期营收形成鲜明反差,市场担心重蹈互联网泡沫覆辙 [5] 行业挑战与高管观点 - 公司首席执行官表示,AI行业正经历"非凡的投资增长期",但难逃投资周期中的"过热"问题,存在理性与非理性发展元素 [5] - 当被问及谷歌能否抵御AI泡沫破裂冲击时,公司首席执行官坦言若泡沫破裂没有一家公司可以幸免,但强调公司从芯片到YouTube数据、AI模型与前沿科研的全栈技术布局能帮助应对潜在市场动荡 [1][5] - AI当前全球耗电量占比为1.5%(国际能源署数据),已对能源供应提出巨大考验,可能制约经济发展,并影响公司气候目标推进 [6] - 公司首席执行官仍将AI视为"人类最具深远意义的技术",认为其会引发社会变革与岗位转型,但也会创造新机遇,熟练运用AI工具的人将在行业中脱颖而出 [6]