Pearl(生产级强化学习平台)
搜索文档
锦秋被投企业Pokee AI 创始人朱哲清:一个强化学习信仰者的十年|Jinqiu Spotlight
锦秋集· 2025-12-30 18:29
以下文章来源于甲子光年 ,作者苏霍伊 甲子光年 . 甲子光年是一家科技智库,包含智库、社群、企业服务版块,立足中国科技创新前沿阵地,动态跟踪头部科技企业发展和传统产业技术升级案例,推动人 工智能、大数据、物联网、云计算、新能源、新材料、信息安全、大健康等科技创新在产业中的应用与落地。 「Jinqiu Spotlight」 追踪锦秋基金与被投企业的每一个光点与动态, 为创业者传递一线行业风向。 Pokee AI 的价值,并不在于为大模型简单"加一层能力",而在于利用 RL 的主动探索能力,让 Agent 真正具备 在未知工作流中"边做边学"的能力,实现数千种工具的连接。 以下是「甲子光年」对 Pokee AI 创始人朱哲清的对话。在这篇文章中,你将看到一位技术理想主义者,如何在 现实约束中押注一条"慢但正确"的路径。 原文|甲子光年 作者| 苏霍伊 编辑|王博 在强化学习(Reinforcement Learning,简称 RL)的世界里,每一个智能体(Agent)都遵循同一条冷静而残酷的准则:在不确定的环境中,最大化长 期的期望回报。 在大模型不断刷新能力上限的同时, 强化学习这 条技术路线也在悄然回归。 2 ...