Pokee 的 AI agent 产品

搜索文档
对谈 Pokee CEO 朱哲清:RL-native 的 Agent 系统应该长什么样?|Best Minds
海外独角兽· 2025-08-01 20:04
AI Agent范式转向 - AI Agent正从预训练语言模型套壳转向以强化学习(RL)为核心的目标导向系统 其关键在于多步决策、目标导向、持续学习和高效探索能力而非模型规模[3] - Pokee采用RL-native架构 围绕目标评估、自我训练和记忆检索进行系统设计 训练方式采用"少样本高目标密度"模式 相比传统方法显著降低推理成本并提升泛化能力[3] - 该范式代表三个转变:从预训练LLM套壳转向目标驱动的RL系统、从静态提示词转向具备长期记忆的智能体、从token预测引擎转向任务决策机器[3] 技术架构创新 - 预训练仅提供基础理解能力 真正的推理必须依赖RL实现 因工作流自动化缺乏现成数据集 需通过self-play和self-evaluation实现能力迭代[14][15] - 在线RL训练不可或缺 离线RL增益有限 Meta广告系统案例显示在线迭代才能实现显著效果 完全依赖离线数据仅能获得0.x%的微幅提升[15][17][20] - 探索(exploration)能力是开放世界Agent的核心 通过量化状态不确定性解决复杂路径规划问题 避免陷入局部最优解[38][39][40][43] 应用场景进展 - 编码领域Agent已成熟 具备多步推理和执行能力 可产生副作用并接收真实反馈 达到大规模应用条件[8] - 工作流自动化领域Pokee表现突出 用户反馈显示其比Zapier节省大量手动操作 比Langchain等代码定义流程更易用[9] - 创意类Agent处于起步阶段 存在流程断层问题 如设计输出无法返回Figma编辑 视频生成无法分层导入AE 预计2025-2026年将迎来爆发[11][12] 商业化路径 - Pokee成本优势显著 处理30个任务仅需0.1-0.2美元 相比竞品单任务1.5-2美元的成本具备10倍以上优势[36] - 企业服务是主要盈利方向 采用"瑞士模式"保持中立 可接入竞争平台API 同时支持本地部署满足合规要求[51][52][53] - 当前避免大规模推广 专注产品打磨 Beta版发布后已产生数千个workflow和数十万task执行 验证高频使用特性[37] 行业发展趋势 - 浏览器可能被Agent取代 未来交互以Agent为核心 前端或退化为标准化数据库 呈现方式完全动态个性化[55] - 销售自动化、RPA和编程工程师是未来2-3年最看好的落地场景 电商和客服领域存在应用瓶颈[58][59] - 视频生成长内容、AI支付安全、自动化数据库对接等方向存在创业机会 均具备独角兽潜力[63][64]