微软Edge浏览器Copilot模式发布 - 公司为Edge浏览器推出Copilot模式,标志着其正式进军AI浏览器市场,这是公司为AI时代重新定义浏览器的第一步[1] - 新功能使AI能够阅读和理解网页内容,例如对技术文档进行解读或为Youtube视频生成观看大纲,并可浏览所有已打开的标签页来生成对比表格辅助决策[1] - 模式增加了语音功能,用户可通过语音与AI实时对话,理解网页内容,该功能被描述为更具互动性的体验[1][13] Copilot模式核心功能特点 - 功能包括理解网页内容并提供文档解读或大纲、总结Youtube视频要点、对电商网站商品进行AI总结并提供历史价格走势和比价,但目前对国内电商平台支持有限[6][7][8] - 具备主动能力,如AI tab grouping可自动按主题归类标签页,multi-tab RAG功能可让AI浏览用户所有已打开的标签页内容,辅助比较和决策[9] - 模式整合了对话、搜索和网页导航,可根据用户意图和历史记录预测下一步操作建议,并能阅读PDF文档并针对内容回答问题,接入了OpenAI的文生图能力[6][11] 市场竞争格局与产品定位 - 该模式的许多功能被视为AI浏览器的基础能力,与国内夸克、豆包、QQ浏览器等产品类似,其更显著的区别在于具备一定的主动能力[9][14] - 模式目前处于实验阶段且为限时免费,用户可免费使用部分ChatGPT的付费功能,如DeepResearch,被视为ChatGPT Agent的免费替代版,后者最低月付费为20美元[4] - 与Perplexity Comet浏览器(仅向Max订阅用户开放,月费200美元)和豆包桌面版相比,Copilot Vision在语音互动的反应速度、回答精准度和可实时打断方面体验更佳[13] AI浏览器行业发展与市场前景 - AI浏览器市场正经历混战,从最初内置基础AI对话和总结功能,发展到强调自主执行任务能力的Agent方向,如Dia、Comet、Opera Neoa等浏览器[15] - 大模型重塑了信息获取方式,行业普遍相信浏览器将发生改变,市场调研机构预测全球AI浏览器市场规模将从2024年的45亿美元增长至2034年的约768亿美元,年复合增长率达32.8%[16] - 当前AI浏览器更多被视为对现有体验的增强而非颠覆,是AI Agent的一种中间形态,因模型能力受限而无法完全摆脱传统浏览器框架,用户体验尚未形成质变[20][21] 产品当前局限与行业挑战 - 产品未能打通支付等关键环节,无法实现宣传中的无缝体验如预定酒店、购买商品等,这些功能尚属期货,与市面上多数AI Agent产品面临同样局限[11] - 在功能实测中仍存在错误,例如处理PDF财报时图表数据不准确,完全丢掉了阿里巴巴2024年第一季度业绩,因其只阅读了三个网页[11] - 行业面临隐私安全挑战,AI浏览器需访问用户浏览数据以进行操作,引发用户担忧,此前微软Windows的Recall功能就因类似问题被批评为监控软件[21]
微软进军 AI 浏览器,维持巨头的平庸