Workflow
Fellou
icon
搜索文档
Chrome危!AI浏览器新品大爆发,OpenAI都来抢饭碗
量子位· 2025-07-10 14:51
浏览器市场竞争格局 - AI时代浏览器成为兵家必争之地,英伟达投资的Perplexity推出AI浏览器Comet,挑战谷歌垄断领域 [1][2][3] - OpenAI也将在未来几周内发布AI浏览器,与谷歌Chrome展开直接竞争 [4][33][34] - 谷歌Chrome目前占据2/3浏览器市场份额,地位难以撼动 [6][39] Perplexity的AI浏览器战略 - Comet定位为超级智能助手,通过浏览器入口连接用户日常操作 [8][9] - 已面向每月200美元的Max订阅用户和部分受邀者开放 [12] - 以侧边栏形式出现,能接管浏览器中的各项任务,自动识别浏览内容上下文 [15][18][19] - 在处理简单任务时表现良好,但复杂任务仍有局限 [20][21] - 需要授予对谷歌账户的大量访问权限来完成复杂操作 [22][23] Perplexity的市场优势 - 5月搜索查询量达7.8亿次,月环比增长率超过20% [30] - 通过现有用户为Comet引流,扩大用户群体 [31] - 因被谷歌拒绝设为默认搜索引擎而决定自主开发浏览器 [25][26][27] 新兴竞争者动态 - Dia浏览器:首个AI原生浏览器,可直接与任意网页对话 [36] - FellouAI浏览器:集成了传统浏览器、智能体和自动化工作流 [36] - 国内百度、夸克、360等浏览器也在通过AI功能争夺市场 [40][41] 行业发展趋势 - 下一代"超级入口"的争夺集中在浏览器领域 [42] - 谷歌通过Gemini迭代和Chrome智能升级巩固市场地位 [39] - OpenAI挖角谷歌前资深副总裁加强浏览器开发能力 [33] - 数据收集渠道成为AI浏览器竞争的关键因素 [34]
为什么AI浏览器可以聚集一切
虎嗅· 2025-07-01 10:31
当人们进入互联网时代时,围绕信息的生产、分享与消费的需求,走出了一条网页-浏览器-门户-搜索-社交网络的相对线性的发展路径。站在这条路 径基础上,人们在拥抱AI时代的过程中,不同的企业和开发者以此为参照,同时在不同节点寻找着AI化的可能性。 其中,浏览器是互联网时代的第一个全民级应用。比尔·盖茨在三十年前发布的著名备忘录《互联网浪潮》中写道:我们相信,在未来 20 年,计算机将对 工作、学习和游戏产生根本性的影响。出色的软件产品对于实现这些进步至关重要。微软由此开始争夺浏览器这个作为入口的软件。 AI浪潮中,AI浏览器成为AI应用中竞争最为激烈的节点之一。AI浏览器的竞争参与者众多,从明星创业者到互联网元老,从国内巨头到海外新秀,都纷 纷投身其中。Fellou、Dia、Opera都在寻找原生AI浏览器的最佳实现路径,Chrome、QQ浏览器中也都置入了AI助手能力,OpenAI和Perplexity也都要发布 自己的浏览器产品。 入口是浏览器给到人们的最直接诱惑。每一次主流浏览器的更迭,都是一次入口的易手。微软与网景围绕浏览器展开了互联网时代的第一次平台之争,微 软的胜出使其通过Windows+IE的组合,进 ...
如何定义智能体价值?容错性与自主性为核心考量指标
21世纪经济报道· 2025-07-01 08:41
智能体行业发展现状 - 2025年被称为"智能体元年",AI发展从对话生成跃迁到自动执行,智能体成为最重要的商业化锚点和下一代人机交互范式 [1] - OpenAI将AI发展分为L1-L5阶段,L3阶段的智能体具备对话能力、推理能力、长记忆和工具调用四项核心能力,其中工具调用是最关键区分要素 [2] - 智能体市场划分为通用型和垂直型,通用型跨领域提供基本认知能力,垂直型专注特定领域深度融合专业知识,目前垂直型更易形成可持续商业模式 [4] 智能体商业化进展 - 编程场景已诞生ARR突破5亿美元的产品Cursor,成为最短时间突破1亿美元ARR的软件产品 [6] - 垂直智能体在办公软件(WPS、钉钉、飞书)、金融(支付宝、微信风控)、法律(通义法睿、金山晓法)等领域开始落地 [4] - 2025年AI手机渗透率预计达34%,端侧模型精简和芯片算力升级推动AI手机向中端价位渗透 [12] 智能体产业链格局 - 产业链分为基础层(大模型与基础设施)、平台层(开发工具与平台)、应用层(应用与场景) [7] - 科技巨头以大模型为底座布局智能体平台和生态,创业团队在核心能力做颠覆性创新,终端厂商依靠设备入口差异化竞争 [8] - MCP协议通过提供统一通信标准推动智能体行业互联互通,降低集成门槛 [10] 智能体技术演进方向 - 多模态基础模型和强化学习训练方法已发展到相对成熟阶段,能理解视觉信息和训练Agent与环境交互 [9] - 智能体正从AI手机扩展到AI浏览器,将对话交互方式植入搜索页面实现实时唤起和多轮对话 [13] - 通用智能体挑战"上限"和"广度",垂直智能体夯实"下限"和"深度",两者发展方向各有价值 [4] 智能体评估框架 - 从"容错性"和"自主性"两个维度建立智能体价值生态评估模型,X轴容错性衡量错误后果严重程度,Y轴自主性衡量决策执行能力 [14] - 医疗等低容错性场景需要更准确信息捕捉和稳定执行,写作创意等高容错性场景错误后果轻微可控 [14] - 不同象限的智能体产品需适配对应的安全风险准则 [14]
华创资本王道平:很多AI产品刚上线就被用户抛弃,非常残酷
36氪· 2025-06-26 07:17
AI行业趋势与创业机会 - AI技术仍处于快速发展阶段,尚未进入收敛期或定型期,技术及应用形态存在不确定性 [6] - 创业方向从2022年底的大模型转向2023年的中间层工具(如Dify)、2024年的智能体和AI+硬件(如Even眼镜、机器人)[6][8][10] - AI原生产品与新交互范式(如多模态助手、原生硬件)最可能诞生"一人独角兽"[2] 投资逻辑与赛道选择 - 更关注通用型、市场化程度高的行业(如消费、ToB工具),而非医疗/教育/金融等门槛高、合规复杂的领域[11] - 早期投资核心看团队对AI的洞见、产品化能力和赛道理解(如AI眼镜创始人兼具产品能力与赛道判断)[12][13] - 明确不投大模型方向:资金消耗大、商业模式模糊、大厂优势显著[15][16] AI创业环境变化 - 用户容忍度极低,产品需即时见效,试错空间小于移动互联网时代[18][19] - 大厂跟进速度快,竞争压力空前,创业者需快速差异化并规模化[3][19] - 商业化验证关键:需证明产品"work"且有用户,闭环跑通优先(如出海应对付费习惯差异)[22][23] 融资与商业化挑战 - 资金供给减少,政府背景基金占比提升,融资逻辑转向政策导向[25][26] - 创业者需更早创造收入,团队规模缩小降低启动成本,产业投资成选项[27][28] - 部分领域(如AI硬件)短期难盈利,需平衡融资与生存[29] 智能体(Agent)发展 - 智能体应用在ToB/ToC领域快速演化,标志性案例Manus出现[8][9] - 流量分发逻辑可能颠覆:从争夺用户时长转向调度资源/意图[32] - 行业机会取决于创业者理解力,非预设赛道(如多邻国证明教育领域潜力)[30][31]
深度拆解:为什么通用 Agent 的下一站是 Agentic Browser?
Founder Park· 2025-06-14 10:32
核心观点 - 行业正经历从通用Agent向Agentic Browser的范式转移,浏览器因其内容通用性、用户习惯和跨应用能力成为通用Agent的天然载体 [13][17][20] - Agentic Browser的核心是"代替用户行动",而不仅是"辅助用户浏览",其终极目标是成为全新的AI操作系统并催生定制化硬件生态 [13][31][41] - 未来AI之争的本质是对用户跨应用、全链路"上下文"控制权的争夺,浏览器凭借其深度与广度兼备的上下文获取能力成为关键战场 [21][25][28] 概念定义 - 通用Agent:具备自主理解、规划、执行能力的智能实体,强调自主性和通用性,代表产品包括ChatGPT、豆包等 [17] - AI搜索:利用AI技术改进搜索结果相关性和呈现方式,代表产品包括Perplexity、秘塔搜索等 [17] - AI浏览器:传统浏览器集成AI功能如侧边栏助手、内容总结等,代表产品包括QQ浏览器、夸克等 [17] - Agentic Browser:以浏览器为载体使Agent具备深度上下文感知和跨应用操作能力,代表产品包括Comet、Fellou等 [17][18] 行业驱动力 - 操作系统厂商通过生态霸权限制第三方AI创新,如谷歌阻止摩托罗拉预装Perplexity,微软深度绑定Copilot [9] - 传统浏览器同源策略形成数据孤岛,使通用Agent无法获取用户真实行为数据执行跨网站任务 [10] - 反垄断诉讼为突破生态封锁创造机会,如美国司法部强制谷歌剥离Chrome的提案促使Perplexity开发Comet浏览器 [11] 技术载体优势 - 上下文控制:浏览器可获取用户全维度数据包括浏览时长、交易信息、跨站点行为等,远超单一APP的数据维度 [25][27] - 本地OS控制:通过混合影子空间技术实现本地即时响应、虚拟化执行和云端协同,具备操作系统级资源调度能力 [30][34] - 跨应用连接:支持跨网站工作流自动化如自动关注Twitter博主、电商比价加入购物车等复杂操作 [35][36] 未来演进路径 - 短期:通过Agent Store构建开放生态,如Fellou的VIEP技术和Eko框架实现任务动态规划 [27][35] - 中期:发展为AI优先操作系统,重构资源调度和交互设计围绕任务执行为核心 [31][43] - 长期:催生定制化硬件如AgentBook,在芯片层面集成AI计算单元和先进传感器 [41][43]
腾讯研究院AI速递 20250604
腾讯研究院· 2025-06-03 22:49
微软Bing Video Creator - 微软发布由OpenAI Sora技术支持的Bing Video Creator,可通过自然语言生成多种类型视频 [1] - 该服务免费提供快速和标准两种生成模式,初始有10次快速生成机会,生成视频长度为5秒 [1] - 系统内置安全保障措施并为视频添加内容凭证和溯源信息,目前国区未开放 [1] Manus幻灯片功能 - Manus新幻灯片功能可在10分钟内生成8页专业PPT,支持导出为Google Slides [2] - 实测显示功能支持自动搜索资料、规划结构、生成内容,但存在页面显示不完全问题 [2] - 与Genspark对比速度更快(10分钟vs20分钟),被网友评为当前PPT制作最佳工具 [2] Character.ai AvatarFX - Character.ai推出AvatarFX功能,使静态图片人物能说话唱歌并支持多轮对话 [3] - 基于DiT架构实现高保真度和强时间一致性,复杂场景中表现稳定 [3] - 同步推出沉浸式叙事体验Scenes、动画聊天Imagine Animated Chat等新功能 [3] Fellou 2.0智能体 - Fellou 2.0作为Agentic Browser实现AI任务7x24小时批量化生产 [4] - 新版本速度提升1.2-1.5倍,成功率从31%升至80%,支持多任务并行处理 [5] - 基于Eko 2.0架构,未来将推出Windows版本并取消邀请码 [5] YouWare氛围编程平台 - YouWare让非程序员通过AI将创意转化为网页并一键上线分享 [6] - 平台实现"所想即所见"体验,由自研AI Agent和Sandbox技术支撑 [6] - 建立类似Instagram的创作社区,设计"Knot"奖励机制鼓励优质内容 [6] 智源Video-XL-2模型 - 智源开源轻量级Video-XL-2模型,单卡可处理长达万帧视频 [7] - 模型采用四阶段渐进式训练方法,编码2048帧视频仅需12秒 [7] - 在主流评测中超越所有轻量级开源模型,适用于影视分析和异常监测 [7] Salesforce收购Moonhub - Salesforce收购AI Agent平台Moonhub,团队将开发Agentforce平台 [8] - 目标2025年底通过Agentforce开发十亿个智能体,现有3000家企业客户 [8] - Moonhub招聘智能体功能将与Salesforce HR智能体形成互补 [8] 李飞飞Forge渲染器 - World Labs开源Forge渲染器,可在普通设备流畅渲染AI生成3D世界 [10] - 作为Web端3D高斯泼溅渲染器,支持多摄像头及实时动画编辑 [10] - 关键技术包括高效画家算法和可编程数据流水线 [10] ChatGPT模型选择 - 卡帕西建议简单问题用GPT-4o,复杂任务用o3,代码完善用GPT-4.1 [11] - 使用场景分配:40%日常问题用4o,40%重要问题用o3 [11] - 选择原则基于任务重要性和响应速度需求 [11] ChatGPT记忆机制 - 记忆系统由保存记忆和聊天历史(含会话历史/对话历史/用户洞察)构成 [12] - 技术实现涉及向量空间索引和聚类优化算法,用户洞察贡献占比或超80% [12] - 机制使模型从被动应答转向主动理解,显著提升智能感 [12]
Fellou 浏览器 2.0 发布:速度提升、支持多任务并行、任务成功率提升至 80%
Founder Park· 2025-06-03 15:30
核心观点 - Fellou 2.0版本在任务执行速度、任务多样性和成功率上实现显著提升,任务成功率从31%提升至80%[3][14][31] - 公司以打造类Jarvis的通用智能体为目标,通过Agentic Browser架构实现自动化任务处理,覆盖跨应用生产力、创意设计、监控等多样化场景[8][23][28] - 开源基础设施Eko 2.0是关键突破,支持多Agent协作和DOM状态监听,推动任务成功率提升至行业领先水平[34][35] 产品升级 Agentic Browser架构 - 首创Browser + Workflow + Agent架构,支持自动拆解复杂任务,如市场调研、3D设计、跨平台营销等[8] - 实现多任务并行处理能力(Alpha阶段),例如同时生成网站和账单分析,速度较竞品快1.2-1.5倍[13][20][21] 性能提升 - 任务执行速度优化:生成3D场景耗时1分20秒(竞品4分30秒),摩斯密码转换耗时1分30秒(竞品2分30秒)[15][16] - 成功率提升至80%(原31%),覆盖生产级场景如跨境电商谈价、社媒运营闭环[14][29][31] 多样化交付 - 支持文本、音频、视频、PPT等12类交付物,例如智能家居音效设计(含16种波形音频文件)和城市Logo生成[24][26] - 超长上下文管理支持无限步长监听任务,如Gmail自动回复、Slack消息监控[27][28] 技术突破 - Eko 2.0开源框架提供Multi Agent协作和Workflow规划能力,在Online-Mind2web基准测试中达到SOTA表现[34][35] - 新增DOM状态变化监听和Loop Tasks管理功能,强化GUI Agent的稳定性[35] 未来规划 - 即将推出Windows版本并取消邀请码机制,加速用户覆盖[36] - 优化交互体验:增强多轮对话记忆、浏览器性能及迁移工具等配套功能[36] - 模型智能持续升级,扩展交付物类型和任务覆盖范围[36]
2025,AI Agent赛道还有哪些机会?
虎嗅· 2025-05-26 16:16
AI Agent行业动态 - OpenAI以30亿美元收购编程工具Windsurf [1] - 编程工具Cursor母公司Anysphere获9亿美元融资 估值达90亿美元 [1] - 中国通用AI Agent项目Manus获Benchmark领投7500万美元融资 [1] - OpenAI推出具备浏览器能力的Operator和复杂任务处理产品Deep Research [1] 技术演进 - 2025年AI Agent技术实现跃迁 结合强化学习与推理模型能力 [8] - RFT(强化学习微调)技术推动Agent具备自主学习能力 [8] - 大语言模型达到"AlphaGo时刻" 能自主探索解题路径 [15] - 环境理解成为关键 Devin构建包含四个子界面的综合开发环境 [21] 产品分析 - Cursor从编程工具向通用平台转型 积极接入MCP接口 [31][55] - Windsurf内置context engine 环境理解能力突出 [19] - Devin创新性加入笔记系统 支持长期开发过程管理 [21] - Manus依赖Claude Sonnet 3.7模型 面临API稳定性挑战 [33] 创业机会 - 通用Agent领域被大厂占据 创业者机会集中在垂直场景 [23] - 服务型Agent面临被整合风险 如Operator覆盖上百个场景 [22] - 个人化Agent可能成为新方向 类似自媒体网红模式 [24] - 评估机制(Evaluation)成为构建竞争力Agent的关键 [40][43] 技术路线 - RFT相比SFT性能提升25% 但成本高出数倍 [47] - Manus采用SFT技术调优外围执行模块而非核心模型 [48] - MCP协议发展缓慢 行业采纳面临商业化障碍 [72] - 代码层成为数字世界操作的关键中间层 [28] 垂直领域案例 - Vantel为保险经纪人节省80%重复工作时间 [58] - Sweet Spot服务中小企业申请政府资助 用户体验优异 [59] - Gamma革新PPT制作流程 模块化设计获长期用户认可 [61][62] - Replit和Fellou在人机交互设计上表现突出 [49][52] 行业趋势 - 产品开发节奏加快 执行优先于计划 [65] - 环境侧建设滞后 MCP生态渗透需以年计 [68] - 编程Agent可能发展为通用型平台 [31][56] - 用户需求理解仍是待解难题 [69]
每个有野心的AI浏览器,都想成为新的操作系统
创业邦· 2025-05-22 11:04
浏览器行业AI化趋势 - 传统浏览器市场长期被巨头垄断,功能趋同且创新停滞,用户习惯固化[3] - AI技术正在颠覆浏览器底层逻辑,从被动网页容器转向主动智能代理[4][5] - 新兴AI浏览器目标是通过深度上下文理解和任务自动化重构人机交互方式[5][15] 创业公司创新实践 The Browser Company (Dia) - 提出"AI作为新计算环境"理念,浏览器成为智能交互层核心[5] - 核心功能包括自然语言指令执行(如文件检索+邮件发送)、跨标签页任务整合[6][13] - 差异化策略强调极致上下文建构(tripling-down on context),但早期版本被质疑为"ChatGPT+Chrome"混合体[6][9][11] Fellou - 定位"世界首款代理式浏览器",主打Agentic Deep Action技术[19] - 支持跨平台私有数据操作(如电商账号登录+商品检索),生成可视化报告[19][21] - 实现本地自动化任务(小红书评论发布),但执行稳定性存疑[22][24][27] Perplexity (Comet) - 集成核心搜索功能至侧边栏,支持标签页管理/邮件处理等场景[29][30] - 数据本地存储策略,长期规划构建"浏览器即操作系统"生态[31] - 商业模式涉及用户画像构建与定制化广告,引发隐私争议[31] 科技巨头应对策略 - 微软通过Copilot全面增强Edge,采用生态系统整合策略提升粘性[35][39] - 谷歌Chrome采取保守路线,AI能力优先融入搜索/广告等核心业务[37] - OpenAI探索Operator远程浏览器代理方案,瞄准操作系统级AI管家[40] 行业底层变革逻辑 - 浏览器设计范式正从"文档中心"转向"原子化信息+动态交互"[43][44] - AI驱动浏览器向操作系统功能演进,成为个性化数字助理平台[42][45] - 技术同质化风险显现,创业公司需与OpenAI等巨头争夺入口控制权[45][46]
AI不只有大模型?Agent凭什么成为2025年度风口|对话刘志毅
36氪· 2025-05-14 20:45
互联网产品格局变化 - 过去十年国内诞生上千万款互联网产品,目前仅44款月活过亿,其中9款诞生于近十年,字节跳动占一半以上,腾讯占两款 [1] - DeepSeek成为历史上首款未花营销费用、上线一个月下载量破亿的应用软件,打破字节在To C产品的统治地位 [2] - 深度求索公司打破持续十年的大厂垄断局面,为行业带来新竞争格局 [2] AI Agent市场发展 - DeepSeek推动大模型推理能力进步,促进AI Agent发展,Manus发布2天预约超120万,后续增长至260万 [4] - Manus验证市场对Agent的热情,百度心响、Genspark、Fellou、Coze空间等竞品涌现 [4] - Manus完成7500万美元融资,估值暴涨五倍,行业巨头OpenAI和微软均看好Agent未来 [5] AI Agent技术特性 - Agent具备自主规划、工具调用和多模态能力,推动AI从被动响应升级为主动执行 [9] - Agent依赖基础模型进步,推理能力提升是关键,但存在响应速度慢、易出幻觉等不足 [5][11] - 智能体发展需突破跨组织协同、物理世界交互能力及开源生态成熟三大技术节点 [14] AI Agent应用场景 - 当前成熟场景包括智能客服、金融投顾、医疗辅助诊疗等垂直领域 [12] - 深圳福田区部署70个基于DeepSeek的"AI数智员工",覆盖240个场景,一次解答精准率近90% [17] - 文旅和房产管理是潜力行业,涉及多模态交互和招商管理等场景 [18][19] 行业竞争格局 - 基础模型领域已形成巨头垄断,难容纳新创业公司 [3] - Agent公司分为技术框架、垂直应用和开放协议三类流派 [13] - 国内市场可能超越SaaS规模,因发展空间大且共识未形成 [22] 职场影响与人才需求 - Agent将催生"超级个体"与智能体集群模式,出现AI训练师等新职业 [16] - 企业用人标准转向AI协同能力,需具备二次改造智能体的技能 [20] - 管理者角色转变为"认知架构师",需掌握人机协同思维 [16][21] 技术发展趋势 - DeepSeek推出R1模型开源成果,标志开源生态发展 [14] - 智能体需解决动态检索和模态关联问题,减少执行幻觉 [11] - 物理仿真平台和世界模型生成技术是未来突破方向 [14]