AI browsers
搜索文档
AI browsers aren’t smart enough yet to take over the internet
The Economic Times· 2025-12-09 18:40
AI浏览器发展现状与挑战 - 当前版本的AI浏览器(如OpenAI的Atlas和Perplexity的Comet)远未使Chrome等传统浏览器过时,它们仍存在偶尔的错误,并且在处理一些看似简单的请求时会遇到困难 [1][23] - AI浏览器将人工智能助手置于核心位置,取代搜索引擎作为预设选项,并提供“智能体浏览”功能,以代表用户执行多步骤任务,如完成购物订单和从未读邮件中提取待办事项列表 [23] - AI开发者的目标是让消费者不仅在自有应用或网站内使用聊天机器人,还能在浏览器和移动操作系统中使用,这可能为广告定位和收入流开辟更多途径,但最先进的功能目前仅限付费层级,因为运行AI智能体功能的成本更高 [1][23] 用户行为与市场接受度 - 两类浏览器正在鼓励不同类型的用户行为,迫使应用开发者、网络服务和出版商重新思考他们的工具是为人类设计还是为爬取网络的机器人设计,以及它们是否可以通过同一产品来服务 [2][23] - Mozilla去年的一项用户调查研究发现,60%的参与者只愿意在低风险事务或他们足够了解、能够轻松验证输出质量和发现错误的事务上使用生成式AI,该调查基于2024年5月对美国1000人和400名Firefox用户的调查 [4][23] - 同一调查发现,节省时间可以鼓励用户用生成式AI替代搜索,但对准确性的需求驱使他们结合两种方法,生成式AI在信息搜索方面更有帮助,因为它可以综合信息并提供用户可以回溯的各种链接 [5][23] - 用户对AI浏览器的需求在增长,例如Comet用户提出的问题数量是常规Perplexity聊天机器人的“6到18倍”,高级用户则要求增加任务调度功能,以便浏览器能定期重复执行任务 [6][7][23] 技术能力与局限性 - AI浏览器在总结长YouTube视频内容、搜索在线信息并将其输入在线文本编辑器和电子表格等简单任务上表现更好 [17][23] - 然而,当前大多数网络仍是为人类构建的,这导致AI浏览器的一些更高级功能受挫,例如Atlas浏览器在处理滚动LinkedIn帖子回复并列出特定行业人员等任务时,会过度思考,花费一两分钟决定方法,最终采用截图并进行图像识别来解读文本,有时甚至会陷入循环无法完成指令 [14][15][16][23] - 在测试中,当使用一些高级智能体功能时,Windows笔记本电脑会发热且风扇噪音增大,尽管浏览器占用计算资源并非新问题,但传统浏览器开发者在解决这些问题上已先行一步 [17][23] 行业竞争与生态演变 - 传统浏览器开发商如谷歌、微软和Mozilla采取了不同策略,在过去一年中保持搜索作为浏览器默认功能,同时添加AI助手功能 [2][23] - 自Atlas于10月首次亮相以来,竞争格局已经发生变化,谷歌最新的Gemini 3模型在许多基准测试中超越了OpenAI的最佳AI系统,这促使OpenAI CEO Sam Altman宣布进入“红色代码”状态以改进其旗舰聊天机器人,同时随着Chrome和微软在其传统浏览器中更广泛地发布AI智能体工具,浏览器竞争领域预计将趋于平衡 [18][23] - 让在线服务提供商开发AI特定版本的服务 largely 是一项吃力不讨好的工作,例如OpenAI今年秋季发布了应用开发者将其服务集成到其聊天机器人的框架,但并未总是获得期望的支持,虽然Zillow、Instacart和Booking.com等服务已在ChatGPT内试点了应用版本,但其功能有限,用户使用原生网站或应用体验更好,一些开发者如Airbnb则表示不急于加入 [19][20][23] 内容与法律障碍 - 包括Reddit Inc、Amazon.com Inc和纽约时报公司在内的其他高流量公司已提起诉讼,反对AI公司利用其内容的方式,纽约时报在对Perplexity的诉讼中特别指出Comet能够提供本应仅限该报付费订阅者阅读的文章摘要 [21][23] - Perplexity已誓言回击其认为来自受AI新贵威胁的传统提供商的霸凌策略 [21][23] - 网站当前的构建方式是一个重大障碍,AI助手提供答案和完成任务的好坏将取决于网站的结构,视觉元素丰富或叙事导向的网站不一定有用,AI需要结构良好、定义明确、可索引的特定数据和见解 [11][12][13][23] - 行业观点认为,未来可能需要网站的“人类”和“机器人”两个版本,机器人版本将提高浏览器作为AI智能体的能力,这是区分AI浏览器与常规浏览器的关键特征,它使浏览器能够根据用户对聊天机器人的指令执行鼠标点击、光标放置和键盘输入 [13][23] 信任与采用障碍 - 对于用户而言,AI浏览器的不成熟性可能构成广泛采用的障碍,AI尚不可信,若想依赖智能体代表用户进行消费,必须大幅提高其可信度 [22][23] - 用户担忧AI深度集成到体验中可能带来的风险,例如在预订航班时,无法确定智能体是否真的提供了最优惠的交易,而不是因为预订了某家航空公司而获得回扣 [22][23]
Inside Amazon's AI and Robotics Push
WSJ· 2025-10-24 23:08
AI浏览器 - 新闻通讯涵盖AI浏览器技术发展 [1] 飞行汽车技术 - 新闻通讯包含飞行汽车技术进展 [1] 虚拟免疫系统 - 新闻通讯提及虚拟免疫系统概念 [1]
美国知名风投 BVP 年度 AI 报告:Memory 和 Context 将是新的护城河
Founder Park· 2025-08-19 21:40
核心观点 - AI行业正在经历快速变革,从证明AI可解决问题转向构建能定义、衡量并解决问题的系统[9] - 记忆和上下文成为AI应用新的护城河,跨时间记忆、适应和个性化能力是关键[9][39] - 垂直领域AI采用速度加快,尤其在长期依赖人工操作、服务密集型行业[42] - 浏览器竞争加剧,下一代Agentic浏览器将嵌入AI实现多步自动化和实时决策[56] - 生成式视频技术将在2026年进入正式可用状态,重塑互联网内容创作[61] 优秀AI创企标准 - 超新星型公司:第一年ARR达4000万美元,第二年1.25亿美元,毛利率25%[16][19] - 流星型公司:第一年ARR 300万美元,第四年达1.03亿美元,毛利率60%[16][19] - 新增长标准Q2T3:连续两年四倍增长,后三年三倍增长[20] - 员工效率:超新星型ARR/FTE达113万美元,是传统SaaS的4-5倍[19] AI基础设施发展 - 模型层由OpenAI、Anthropic等少数企业主导,同时进行垂直整合[25] - 开源模型如Kimi、DeepSeek在特定任务上表现优异[27] - 基础设施进入第二篇章,焦点转向定义问题而非解决问题[30] - MCP协议成为Agent访问外部API的通用标准,简化集成流程[34] 开发者平台与工具 - AI工程成为软件开发不可或缺部分,自然语言成为新编程接口[33] - 最优秀工程团队构建能通过开发循环实现学习的自适应系统[33] - 记忆成为核心产品要素,持久化跨会话记忆仍是挑战[38] - 上下文管理工具如MemOS、LangMem正在解决记忆稳定性问题[38] 垂直领域AI进展 - 医疗健康:Abridge自动完成临床记录,SmarterDx自动化编码流程[43] - 法律:EvenUp生成法律索赔文件,Ivo自动审查合同[51] - 教育:Brisk Teaching帮助教师简化评分和内容创作[51] - 房地产:EliseAI自动化物业管理沟通和租赁审计[51] 消费级AI趋势 - ChatGPT和Gemini周活跃用户分别达6亿和4亿,成为生活习惯[47] - 语音成为重要交互方式,Vapi等平台支持跨语言情感互动[47] - Perplexity成为AI搜索首选工具,推出Agent浏览器Comet[48] - 创作门槛降低,Suno、Runway等工具让消费者成为创作者[48] 2025年五大预测 - 浏览器成为Agentic AI核心交互界面,新浏览器大战开始[56] - 2026年成为生成式视频元年,重塑娱乐、营销等领域[61] - 评估与数据溯源成为AI产品开发关键催化剂[67] - 将出现AI原生社交媒体巨头,可能由AI网红主导[73] - 行业并购激增,医疗、金融等领域迎来整合浪潮[77] 创业启示 - 速度重要但方向更关键,需产品直觉和用户同理心[81] - 聚焦高价值痛点,快速提供10倍价值后逐步扩展[84] - 构建技术和数据壁垒,为战略收购做好准备[83] - 创始人洞察力成为关键竞争优势[84]