Workflow
OpenManus
icon
搜索文档
OpenManus 00后主创现场演示,Agent开发的“快”与“痛” | 万有引力
AI科技大本营· 2025-04-11 17:49
项目背景 - OpenManus 复刻 Manus 核心功能,以开放姿态在不到一个月内于 GitHub 获超 42.2k Star 关注[2] 开发者经历 - 梁新兵和向劲宇因 MetaGPT 黑客松活动接触 Agent 领域,确定研究方向[8][9] - 梁新兵科班出身,向劲宇从物理转行,两人在合作中优势互补[8][9] 开发工具与工作流 - 开发者日常借助 Kimi、Repo Mix、Cursor 等 AI 工具学习新技术、提升编程技能,提高工作效率[11][14] - OpenManus 很多代码由 AI 辅助编写,但需人工审查和修改[15] 项目诞生与反响 - 向劲宇预判复刻 Manus 并开源会火,两人利用业余时间快速搭建 OpenManus,发布后 Star 数疯涨[18][19] - 开源目的主要是科普和推广简洁实现理念,让初学者易理解 Agent 核心逻辑[18][19] 项目设计与实现 - OpenManus 架构含 planning tool、Agent 和 tool 模块,采用 react 模式执行任务[24][27] - 定义 Agent 关键要素为工具和提示词,核心工具约 10 个,工具粒度较大[28][32][38] 开源社区贡献 - AWS 官方提交适配 Bedrock API 的代码,社区贡献者完善 Web Search 功能[43][44] - 因审核困难和缺乏测试用例,开发者会慎重考虑修改大量代码的 PR[46] 项目演示与挑战 - 演示 OpenManus 制定旅行规划时出现启动慢、卡住等问题,可能与上下文长度和代码 Bug 有关[52][53][55][56] MCP 协议 - MCP 是统一协议,目标是让大模型以统一方式使用工具,OpenManus 已实现部分支持[60][61][64] 未来规划 - 进行强化学习微调模型,基于 Agent Gym 开发 OpenManus RL 扩展项目[66][67] - 完善多 Agent 协调、MCP 协议支持、工具集成和测试用例建设等工作[68] 学习与借鉴 - 开发者通过 RepoMix 抓取代码,借助大模型理解代码逻辑和架构,将精华部分整合到项目中[69][72][73]
开发 Agent 简单,让它好用难;如果大模型成为流量入口;英伟达的推理故事丨AI 月报
晚点LatePost· 2025-04-03 14:20
全球AI重要趋势 - 开发Agent简单但做好难,底层模型、框架、工具生态正在成熟,OpenAI、Anthropic等公司提供了模型API,调用浏览器、文件、搜索等组件已经有开源标准 [5] - Anthropic推出的Model Context Protocol(MCP)正在被更多公司接纳,规范了Agent如何与外部工具对接,OpenAI也已加入 [5] - 大模型自身局限:幻觉严重、逻辑跳跃、长文本处理能力不足、模型训练数据不够新鲜等,仍需要RAG(检索增强生成)等技术兜底 [7] - 系统设计难:难以精确引导模型行为,执行复杂任务容易陷入死循环;任务链越长,误差累积越多 [7] - 持续测试模型如何使用工具,观察模型犯的错误,然后不断迭代改进 [7] Agent开发与模型优化 - OpenAI的Deep Research用强化学习的方式在o3的基础训练一个新模型,让它具备搜索的能力,而不是调用外部的工具、增加提示词或者编排任务 [8] - 目前大多数Agent产品都是工作流(Workflows)产品,它在垂直场景有价值,但要实现重大突破,必须重新设计模型 [8] - 基础模型迭代仍是Agent性能提升的重要影响因素,基础模型迭代的速度持续放缓,一方面来自于预训练Scaling Laws边际效应递减 [9] - 大模型的发展,会推动垂直头部应用厂商升级,而非颠覆垂直应用的市场格局 [9] - 与互联网与移动互联网时期一样,大模型推动的智能应用时代,正在从通用技术的发展向应用能力提升过渡 [9] 大模型成为流量入口 - OpenAI CEO山姆·阿尔特曼设想了一个OpenAI成为互联网世界入口的未来:用户用OpenAI账户,能带着使用额度、定制模型等,自由使用任何集成了OpenAI模型API的第三方服务 [10] - Adobe Analytics分析了美国电商零售网站超万亿次访问后发现:近四成人正在使用大模型辅助购物,过半人计划今年这么做 [11] - 许多电商或本地生活应用的核心收入都是站内的推荐广告,如果访问这些网站的是AI,而不是人,这些广告系统还能起效吗 [11] - 沃尔玛美国业务的首席技术官哈里·瓦苏德夫提出应对策略:开发自己的Agent与其他的Agent互动,推荐产品或提供更多商品信息 [11] 算力投资与英伟达 - 3月,算力投资的分歧持续,英伟达股价持续波动:月初10天下降13%,随后反弹,然后又跌了下来 [12] - 参数更小的模型性能提升,Google开源的270亿参数模型Gemma 3模型,在Chatbot Arena上得分超过老版DeepSeek-V3 [12] - 2024年9月以来,大模型应用带来的流量每两个月翻一番;去年末两个月,这类流量同比增长1200% [13] - 英伟达CEO黄仁勋讲了关于推理的新故事:能够推理的AI,将问题一步步分解,可能以几种不同的方式接近并选择最佳答案,生成的Token数量轻松达到百倍以上 [16] - 2026年将推出的Vera Rubin架构芯片,会在B系列基础上再次大幅提升——消耗相同的电,可以生成更多Token [16] 投融资风向 - 3月宣布的大额并购交易超过前三月总和,6起金额超过1亿美元的交易公开,另有多起仍在谈判中 [19] - 英伟达3.2亿美元收购合成数据公司Gretel、正在洽谈数亿美元收购阿里前副总裁贾扬清创办的AI推理服务公司Lepton AI [19] - 3月,融资超过5000万美元的AI公司达31家,比上月增加8家 [21] - 基础模型方向,头部公司融资惊人:OpenAI又融资400亿美元,累计融资额达到586亿美元,最新估值超过3000亿美元;Anthropic又融资35亿美元,累计融资额达到180亿美元,估值达到615亿美元 [21] - 人形机器人创业公司迎来融资高潮,单月出现7笔大额融资,创近年新高 [21] 大模型内部机制研究 - Anthropic发布两篇论文,尝试用"AI显微镜"技术追踪模型内部运作机制,研究自研的大模型Claude如何识别指令、组织语言、执行推理 [22] - Claude具备多语言能力,依赖一个共享的跨语言抽象机制,在不同语言中提问"小的反义词"时,Claude激活的是相同的"小"与"相反"概念 [24] - Claude在写诗时并非逐字生成到末尾才凑韵,而是提前规划,具备语言规划能力和灵活性,能够根据目标调整生成策略 [24] - Claude并非靠死记硬背或模拟标准算法,而是用并行路径完成计算:一条估算总和,另一条精确确定末位数字,最终合成答案 [24] - 大语言模型天生会有"幻觉",即使不知道答案也必须输出下一个词,Claude训练中学会在不确定准确答案时默认拒答 [24]
00后程序员当道!下班3小时“爆肝” OpenManus背后的故事
AI科技大本营· 2025-04-02 16:11
文章核心观点 - Manus凭借云端自主执行、多智能体协同、持续学习与记忆等核心能力成为全球首个通用AI智能体,迅速引爆AI圈 [1] - DeepWisdom的MetaGPT团队在3小时内复刻Manus并开源OpenManus,上线不到一个月GitHub获40.4k Star和6.8k Fork [1] - OpenManus由00后开发者主导,完全基于兴趣驱动,体现技术信仰与开源精神 [2][3] - 直播活动将揭秘00后程序员开发OpenManus的过程及对通用Agent的思考 [7][11] 行业技术动态 - Manus具备写代码、查资料、智能浏览网页、操作应用等全能AI能力,显著降低人工干预需求 [1] - 开源项目OpenManus实现零门槛访问,打破Manus邀请码限制,推动智能体技术普及 [1] - 团队开发效率惊人:从复刻到上线仅用3小时业余时间,展现极强执行力 [1] 开发者生态 - 00后开发者群体以兴趣为导向,项目开发不受KPI或商业利益约束 [2][3] - OpenManus核心作者梁新兵为MetaGPT开源核心贡献者,研究方向聚焦AI Agent技术推广 [9] - 向劲宇等年轻研究者兼具学术与工程能力(ICLR 2025 oral论文作者),代表新生代技术力量 [10] 开源社区表现 - OpenManus GitHub仓库热度持续攀升,主分支访问量显著(tree/main路径显示活跃开发) [4] - 项目技术讨论涵盖强化学习微调、通用Agent可行性等前沿方向 [7] 行业活动 - CSDN《万有引力》栏目将深度解析OpenManus开发历程与技术细节 [11] - 直播话题包括开源协作模式、00后程序员工作方式及Agent技术实践 [5][7]
独家|专访吴承霖,PH周榜冠军Coding Agents完成亿元融资,零推广月收百万美金,开源OpenManus
Z Potentials· 2025-03-25 10:34
公司融资与产品表现 - DeepWisdom完成亿元级融资 旗下智能体产品mgx dev以零推广首月实现百万美元ARR 连续四周占据Product Hunt全球榜首 [1] - MGX产品ARR增长速度可能是中国历史最快 未投入任何宣传费用 [3][45] - 团队开源项目MetaGPT OpenManus等总star数超过13万 [1] 创始人背景与理念 - 创始人吴承霖高中时期受哲学思考驱动 转向计算机领域追求"通用求解器"目标 [4][6][7] - 早期实践包括用自动机器学习构建金融交易机器人 大学阶段实现经济独立 [6] - 在华为期间推动核心产品贡献 参与Open vSwitch等开源项目 其母公司Nicira以12 6亿美元被收购 [8] 技术架构与产品定位 - MGX定位为自然语言编程平台 解决MetaGPT产品化问题 架构分为智能体操作系统 IDE 应用生产分发三层 [23][24][25] - 应用场景包括个人网站搭建 临时需求解决(如活动策划 数据分析) 未来可能取代固定APP模式 [27][28] - Benchmark显示MGX优化版得分90+ 显著高于竞品Bolt(20分)和Lovable(20分) [46][47] 开源与学术循环机制 - OpenManus由4名本科毕业生3小时内完成 体现团队学术循环效能 [3][14][40] - 学术循环依赖三大要素:批判性思维 内在驱动力 标准化流程(SOP) [12] - 开源被视为文明最大杠杆 通过原子化增量改进推动技术进步 [9][10][15] 行业趋势与竞争分析 - AI短期内将影响数据分析师 前端工程师等岗位 但不会颠覆大型软件公司 [11][54] - 自然语言编程可能使结构化思维取代特定语言技能成为编程核心 [54] - 对比Claude和DeepSeek开源模型 指出后者R1版本存在幻觉控制难题 [53] 团队管理与文化 - 组织架构极度扁平 无固定职级 决策由团队协商推进 [48][51] - 管理核心强调无权威文化 鼓励批判性思维 以"谁行谁上"为原则 [50][51] - 当前挑战在于人才稀缺 需高自驱力与批判性思维兼备成员 [56][57] 发展路线与规划 - Foundation Agents论文将定义几十项核心任务 目前完成5项 [55] - 面临组织带宽限制问题 需优化资源配置提升并发处理能力 [55] - 长期目标是通过代码和强化学习优化系统效果 打造最佳问题解决机器 [54]
3小时复刻传奇,OpenManus一作梁新兵:通用Agent的构建与赋能
AI科技大本营· 2025-03-20 17:07
2025全球机器学习技术大会(ML-Summit 2025) - 大会将于4月18-19日在上海虹桥西郊庄园丽笙大酒店举行 [2] - 汇聚50余位重磅嘉宾包括院士、IEEE Fellow及企业技术专家 [2] - 专题涵盖智能体、联邦学习、多模态大模型等前沿技术领域 [2] - 设置AI创新展区展示产业链优秀企业技术方案 [9][11] OpenManus项目 - 开源框架采用模块化架构结合Computer Use和MCP执行机制 [7] - 突破传统function calling模式实现智能任务拆解与工具协同 [7] - 具备自主规划能力与策略自适应特性 [7] - 已在数据分析、信息处理等场景实现落地应用 [7] 梁新兵技术贡献 - MetaGPT核心贡献者主导OpenManus项目开发 [5][6] - 团队仅用3小时完成对Manus的复刻并在GitHub走红 [5] - 研究成果包括Data Interpreter/Self-Supervised Prompt Optimization论文 [5] - 将分享通用Agent构建的技术创新与实践经验 [7]
Manus引爆智能体复现潮!DeepSeek已被整合,项目挤满开源榜,海外大V排队求码
量子位· 2025-03-09 12:45
智能体赛道发展 - Manus的发布带动了整个智能体赛道的热度,引发开源复现潮和商业闭源产品的竞争[1] - 两个开源项目OpenManus和OWL在Manus发布当天就推出了复现代码[2] - OWL项目由国内CAMEL-AI团队开发,整合了DeepSeek模型到多智能体协作框架中[3][4] OWL项目表现 - OWL在GAIA基准测试验证集上平均分排名第3,在开源项目中排名第1[5] - Level 1分数达到81.13%,超过OpenAI的Deep Research,接近Manus的86.5%[6] - Level 2和Level 3分数仍有差距,但团队表示有信心提升[7] 开源社区动态 - GitHub热榜上Agent相关项目占据主导,MetaGPT和AutoGPT位列前排[8] - Camel-AI和OpenManus使用的代码库browser-use受到关注,金融、编程领域垂直智能体也备受瞩目[9] - MetaGPT项目获得50,504星标,AutoGPT项目获得172,643星标,显示社区高度关注[10] Manus海外扩张 - Manus通过发放邀请码成功打入海外市场,吸引大量用户试用并付费[13][14] - 海外用户反馈Manus在个人信息收集、网站部署、编程任务等方面表现优异[18][19][20][21] - 用户主要抱怨集中在速度较慢和邀请码短缺[23] GAIA基准测试 - GAIA测试由450+复杂问题组成,分为三个难度级别,评估智能体工具使用和自主性[25][26][27] - 人类在Level 2和Level 3的成功率分别为92%和87.3%,GPT-4得分仅为9.7%和0%[28] - Manus在Level 3分数达到57.7%,领先优势明显[29] 行业趋势 - GAIA基准测试正成为智能体产品的必争之地,类似ImageNet在深度学习时代的作用[24][32] - 行业从BERT时代的CLUE基准转向ChatGPT时代的MMLU和ChatBot Arena,现在聚焦GAIA[30][31] - 未来可能出现AgentArena智能体竞技场,进一步推动行业发展[32]