Workflow
o3 深度解读:OpenAI 终于发力 tool use,agent 产品危险了吗?
海外独角兽·2025-04-25 19:52

作者:cage, haozhen 我们在 2025 年 Q1 的大模型季报 中提到,在 AGI 路线图上,只有智能提升是唯一主线,因此我们持 续关注头部 AI Lab 的模型发布。上周 OpenAI 密集发布了 o 系列最新的两个模型 o3 和 o4-mini,开 源了 Codex CLI,还推出了在 API 中使用的 GPT 4.1。本文将着重对这些新发布进行解读,尤其是 o3 agentic 和多模态 CoT 新能力。 我们认为 OpenAI 在数次平淡的更新后,终于拿出了有惊艳表现的 o3。融合了 tool use 能力后,模型 表现已经覆盖了 agent 产品常用的 use case。Agent 产品开始分化出两类路线:一类是像 o3 那样把 和 o3 的发布模式一样, OpenAI 的 reasoning model 都是先训练出一个 mini reasoning 版本,再 scale 到 一个 long inference time、full tool use 能力的模型上。 而之前 GPT 模型总是先训练出最大的模型,再蒸 馏到小模型上。这个策略值得探讨其原因,我们的猜测是 RL 算法比较脆弱, ...