Workflow
上下文工程(in-context learning)
icon
搜索文档
OpenAI会杀死Manus们吗?
创业邦· 2025-07-22 11:02
核心观点 - OpenAI发布ChatGPT Agent,通过专用模型实现任务规划、跨工具调用和文档生成等复杂流程,显著提升AI Agent能力 [5][9] - 初创公司如Manus和Genspark通过工程优化和上下文设计在响应速度、任务完成度和用户体验上暂时领先,但面临底层模型能力差距 [13][21][27] - AI Agent市场快速增长,预计从2024年51亿美元增至2030年471亿美元(CAGR 44.8%),巨头与初创公司技术路线分化 [45][46] 技术对比 - **OpenAI技术路线**:端到端训练的统一模型(o3系列),在《人类的最后考试》测试中得分41.6%(pass@1),SpreadsheetBench性能达投行分析师1-3年经验水平 [9][29][32] - **初创公司技术路线**:依赖上下文工程(如Manus的KV缓存设计),首个token生成成本降低10倍,通过提示工程优化使数学题正确率从27%提升至49% [36][37][40][42] 行业竞争动态 - Manus在OpenAI发布后3小时内发布10条对比测试,展示更优的行程海报、财务分析PPT等任务完成度 [13][15][20] - Genspark宣称其24人团队在响应速度、成本和质量上"领先OpenAI好几倍",并发布9个对比案例 [21] - OpenAI承认当前ChatGPT Agent速度较慢(部分任务需20分钟),但强调后台持续推理能力(最长2小时) [24] 市场影响 - 微软CEO称20%-30%代码由AI生成,Klarna的AI Agent替代700名客服,显示AI Agent已实质性改变劳动力结构 [45] - OpenAI计划整合支付系统向商家收取佣金,商业化步伐加速 [49] 产品差异 - **OpenAI**:强调底层模型能力,输出标准格式文件(如Excel/PPT),用户需二次加工 [24][32] - **初创公司**:提供现成模板和设计(如Manus的行程海报、Genspark的图表总结),降低用户使用门槛 [13][21][27]