Workflow
Perplexity Comet
icon
搜索文档
2025年Perplexity Comet电商选购类任务测试报告
搜狐财经· 2025-08-15 12:06
测试概况 - 该报告于2025年8月12日由郎瀚威、猫猫头及团队完成 评估四款AI工具在电商选购场景的表现 测试五项任务包括亚马逊商品购买及复购 查找最快发货自行车 购买聚会用系列杂物 给定预算选购风衣 指定条件购买冰箱 [1] - 参与测试的四款AI工具为OpenAI Agent Perp Comet Manus Genspark [1] - 报告共计51页 包含流量分析及更新时间线等内容 [3] 性能表现对比 - 平均耗时方面 Perp Comet以318秒最短 OpenAI Agent耗时1193秒最长 Manus耗时408秒 Genspark耗时52秒 [8] - 正确错误比例方面 Perp Comet和Genspark均为5/0全正确 OpenAI Agent和Manus均为4/1 [8] - 亚马逊复购任务中 Perp Comet和Genspark成功完成 OpenAI Agent和Manus失败 [2] - 查找最快发货自行车任务中 仅OpenAI Agent部分成功 其余均成功 Perp Comet耗时仅20秒 [2] - 购买聚会杂物任务中 除Manus部分成功外均成功 [2] - 给定预算选风衣任务中 四款工具均成功 [2] - 指定条件买冰箱任务中 仅Genspark成功 其余部分成功 [2] 能力梯度分析 - 四款工具在1-7级能力均达标 包括意图解析 搜索执行 结果获取 智能筛选 精准匹配 方案整合 实时交互 [9] - 8-9级购物车操作和订单预处理中 Manus表现欠缺 OpenAI Agent Perp Comet Genspark达标 [9] - 10级支付完成中 仅Perp Comet大概率能完成支付操作 [9] 团队测试感受 - 团队成员普遍认为Perp Comet能力最优 其次是Genspark OpenAI Agent Manus相对较弱 [2] - Perp Comet在效率和全流程操作上表现突出 [2] - Genspark在信息整合和执行细节上有优势 [2] - OpenAI Agent虽能完成部分操作但耗时较长 [2] - Manus多停留在方案提供阶段 缺乏实际购买操作能力 [2] - 具体表现为Manus只能给出选购清单报告 没有后续加购物车操作 [12] - OpenAI Agent能进入亚马逊但无法进行后续操作 页面显示错误 [12] - Genspark可实现加购物车和填写收货地址 但需要手动勾选工具 [13] - Perp Comet在绑定账户后可完成付款操作 [13] 电商场景价值 - 电商购物是AI能力的"展示舞台" 最能体现AI对个性化context的理解能力 [14] - 购物场景需要AI记住用户喜好 预算 购买历史 生活习惯和审美品味 [14] - 执行过程复杂 涉及10个层次能力节点的集中展示 [14] - 反馈机制直观 验收标准明确 没有模糊地带 [14] 测试执行详情 - 亚马逊复购任务来源自Alvaro Cintas 要求查找最后购买的肌酸并重新购买 [15] - Perp Comet执行亚马逊复购任务耗时360秒成功完成 [16] - OpenAI Agent执行亚马逊复购任务耗时83秒失败 [16] - Manus执行亚马逊复购任务耗时120秒失败 [16] - Genspark执行亚马逊复购任务耗时612秒成功完成 [16]
终于,AI应用也想预装了,但手机厂商却不乐意……
36氪· 2025-08-04 07:29
行业动态 - 生成式搜索公司Perplexity正游说Android手机品牌预装其AI浏览器Perplexity Comet 以抢占AI终端入口[1] - 手机厂商普遍拒绝外部AI应用预装 因需将用户AI交互截留在自有生态中 包括小米 OPPO 三星 Google等[3] - 行业矛盾本质是AI供应商与硬件厂商对用户入口及数据控制权的博弈[4] 手机厂商战略 - 国产厂商加速自研大模型 如小米MiMO vivo蓝心大模型 荣耀MagicGUI 并融入系统核心入口[8] - 三星通过Galaxy AI与Google Gemini绑定 Google将Gemini拓展至安卓全系统层级[8] - 手机厂商视用户数据为AI核心竞争力 即使初期模型较弱也要保留数据自主权[8] AI供应商困境 - Perplexity等AI应用需通过预装或独立App突破手机系统封锁 但厂商已从渠道方转型为生态运营商[12] - 移动端是AI主战场 但操作系统控制权仍掌握在手机厂商手中[12] - 外部AI应用深度预装提案被厂商视为"争权"而非合作 类似CarPlay Ultra的遭遇[16] 历史类比 - 当前AI手机竞争态势类似汽车行业"去CarPlay化" 车企曾因智能座舱能力不足接受CarPlay 后因数据主权意识觉醒自建OS[13] - 手机厂商正重走车企老路 从依赖外部AI转向系统级自研大模型[16] 入口争夺本质 - 浏览器入口争夺实质是定义权的转移 涉及用户行为习惯与认知结构的重构[17] - 厂商拒绝外部AI定义用户体验 如同微信小程序架空iOS应用分发形成独立生态[18] - AI时代核心竞争目标是让用户形成使用依赖 入口控制决定长期商业价值[17][18]
OpenAI传闻中的浏览器能成为Chrome的“终结者”吗?
36氪· 2025-07-22 19:07
OpenAI浏览器产品规划 - 公司计划最早下周推出AI网页浏览器 与Perplexity Comet和Dia竞争并挑战Google Chrome [1] - 浏览器将基于Chromium框架开发 支持现有网站/扩展程序/网页应用 降低开发难度 [3] - 产品整合GPT-4o能力 支持AI生成文章/视频/PDF摘要 具备图像/语音/文件交互功能 [3] - 浏览器将实现智能表单填写和任务调度 根据用户意图自动选择服务账号 [3] 战略价值与商业模式 - 通过浏览器获取用户行为数据 减少流向Google等第三方平台的数据量 [5] - 数据获取能力将成为公司商业模式核心 与Google形成直接竞争 [5] - 产品战略定位为"数字Agent" 目标覆盖用户从早到晚的工作与娱乐需求 [6] 市场竞争格局 - Perplexity Comet定位专业研究浏览器 主打摘要生成/来源引用/跨标签页自动化 [7] - Dia采用底层重构方案 以AI为默认交互模式 提供工作空间操作系统 [7] - Google采用渐进式策略 在Chrome中集成Gemini对话AI 提供月费20-250美元订阅服务 [7] - Microsoft Edge原生集成Copilot 通过侧边栏和地址栏提供实时AI辅助功能 [9] - Windows系统深度融入AI Copilot Vision可实时查看屏幕内容辅助工作 [9] 用户行为分析 - 不同年龄段用户对ChatGPT使用方式存在差异:老年人作为Google替代品/20-30岁群体作为人生顾问/大学生作为操作系统 [2] - 浏览器集成AI符合用户工作习惯 减少独立程序使用需求 [2] - 现有ChatGPT Agent需通过可视化浏览器在独立设备运行 处理复杂任务需网页交互能力支持 [1]
月费200刀的AI浏览器,Perplexity Comet的真实体验如何?
Founder Park· 2025-07-14 21:34
AI浏览器行业动态 - AI浏览器行业竞争加剧,从Arc重塑交互到Opera Neon展示代理能力,再到OpenAI传闻中的浏览器,重量级参与者纷纷入场重新定义互联网入口 [1] - Perplexity推出AI Agent原生浏览器Comet,定位为"从浏览到思考"的新型工具,目前仅限每月200美元的Max订阅用户和邀请码用户使用 [1][2] - Comet采用候补名单机制逐步扩大用户范围,尚未在社交媒体引发广泛关注 [1] Comet产品特性 - 核心理念是解决信息"理解"和"运用"难题,通过连接信息孤岛形成统一智能体,界面设计类似智能手机桌面而非传统浏览器 [3][6] - 核心功能Comet Assistant具备情境感知和代理执行两大能力,可跨页面整合信息并执行复杂任务 [7][12] - 支持本地化AI Agent操作,实现批量网页操作、自动化表单等任务,无需依赖云端虚拟环境 [20] - 需要获取用户日程、邮件等敏感权限以实现个性化服务,但承诺数据本地处理保障安全 [19][21] 产品差异化定位 - 浏览器行业出现三大演化路径:工具增强派(Chrome+Gemini)、代理执行派(初级AI助理)、环境重构派(Comet) [23][24] - Comet选择最激进的环境重构路径,旨在将浏览器转变为可深度对话的思考伙伴,重新定义人机信息关系 [25][29] - 基于Chromium开发保证扩展兼容性,同时通过AI实现前台简洁交互与后台智能处理的结合 [29] 市场挑战 - 200美元高额订阅费引发Pro用户不满,被批评为"精英主义",限制早期用户生态建设 [27] - 面临用户习惯改变难题,Arc浏览器的教训显示过度创新可能导致用户因学习成本过高而放弃 [28] - 需要证明其会话式浏览体验能带来远超传统工具的效率提升,才能说服用户适应新交互方式 [28][30] 行业意义 - Comet代表下一代互联网入口雏形:智能环境+主动执行能力,提出浏览器形态的未来命题 [29][30] - 产品命名寓意彗星,象征Perplexity希望其在市场中快速崛起,但也暗示可能面临短暂生命周期的风险 [31][32]
五月AI产品上新:设计Agent刷屏,汪源的笔记产品霸榜Product Hunt
Founder Park· 2025-05-13 21:07
AI设计工具 - Lovart是全球首个设计Agent,能完成从创意拆解到专业交付的全流程,内置GPT image-1、Flux pro、OpenAI-o3等多家图片生成、视频及音乐模型,支持自然语言设计和批量出图[4][8][9] - 产品在AI设计和设计圈刷屏,Founder Park分享的10个邀请码引发99+条求码消息[5][10] AI笔记与效率工具 - remio是前网易副总裁开发的AI Native笔记工具,结合AI搜索与笔记功能优化工作流程,改变用户捕捉、整理和利用信息的方式[10][13] - YouMind是语雀创始人推出的笔记产品,主打"万物化稿,稿生万物",支持多种素材转化为可编辑稿件并生成最终内容形式[55][59][60] - 快手推出的"喵记多"笔记产品采用拟人化"喵仔"AI助手,支持文字、图片、文件等格式收藏和对话式分类[46][48][49] 播客与内容创作工具 - Castwise是Podwise团队新品,能快速将播客音频处理成shownotes、公众号文章、小红书笔记等社交媒体素材,提高内容分发效率[14][17][18] - Nooka是重新定义听书体验的App,以20分钟音频播客解读非虚构书籍,支持用户打断提问并分享对话片段[41][42] AI搜索与知识管理 - 夸克浏览器上线"Deep Search"功能,主打先思考再搜索,具备多模态处理能力,可解读上传图片[19][20][23][24] - 秘塔推出知识讲解产品"今天学点啥",支持个性化拆解文章、视频或书籍,并上线针对家长的"讲题"功能[43][45] AI演示与视频工具 - Deckspeed是Product Hunt日榜第一的AI PPT产品,支持对话式内容创作、实时反馈、视觉优化与多工具联动[25][27][28] - Veogo AI是视频流量预测工具,能分析小红书热门视频并生成定制化脚本模板,提供流量趋势预测等功能[29][31][32][33] AI游戏与社交应用 - 萌爪派对是前字节AI Lab研究员开发的AI养宠社交游戏,玩家可培养千人千面的AI萌宠并体验多种互动方式[51][53][54][56] - Splitti是专为ADHD人群设计的日程管理软件,通过AI帮助用户拆解任务并降低启动难度[34][35][39] 其他AI产品 - Perplexity Comet是即将发布的AI浏览器,自带Agent功能可执行复杂操作如推特回复[50] - Qwen App是通义千问发布的国际版产品,提供Qwen 3模型及语音对话功能[61][62]