AI科技大本营

搜索文档
OpenManus 00后主创现场演示,Agent开发的“快”与“痛” | 万有引力
AI科技大本营· 2025-04-11 17:49
项目背景 - OpenManus 复刻 Manus 核心功能,以开放姿态在不到一个月内于 GitHub 获超 42.2k Star 关注[2] 开发者经历 - 梁新兵和向劲宇因 MetaGPT 黑客松活动接触 Agent 领域,确定研究方向[8][9] - 梁新兵科班出身,向劲宇从物理转行,两人在合作中优势互补[8][9] 开发工具与工作流 - 开发者日常借助 Kimi、Repo Mix、Cursor 等 AI 工具学习新技术、提升编程技能,提高工作效率[11][14] - OpenManus 很多代码由 AI 辅助编写,但需人工审查和修改[15] 项目诞生与反响 - 向劲宇预判复刻 Manus 并开源会火,两人利用业余时间快速搭建 OpenManus,发布后 Star 数疯涨[18][19] - 开源目的主要是科普和推广简洁实现理念,让初学者易理解 Agent 核心逻辑[18][19] 项目设计与实现 - OpenManus 架构含 planning tool、Agent 和 tool 模块,采用 react 模式执行任务[24][27] - 定义 Agent 关键要素为工具和提示词,核心工具约 10 个,工具粒度较大[28][32][38] 开源社区贡献 - AWS 官方提交适配 Bedrock API 的代码,社区贡献者完善 Web Search 功能[43][44] - 因审核困难和缺乏测试用例,开发者会慎重考虑修改大量代码的 PR[46] 项目演示与挑战 - 演示 OpenManus 制定旅行规划时出现启动慢、卡住等问题,可能与上下文长度和代码 Bug 有关[52][53][55][56] MCP 协议 - MCP 是统一协议,目标是让大模型以统一方式使用工具,OpenManus 已实现部分支持[60][61][64] 未来规划 - 进行强化学习微调模型,基于 Agent Gym 开发 OpenManus RL 扩展项目[66][67] - 完善多 Agent 协调、MCP 协议支持、工具集成和测试用例建设等工作[68] 学习与借鉴 - 开发者通过 RepoMix 抓取代码,借助大模型理解代码逻辑和架构,将精华部分整合到项目中[69][72][73]
“MCP 意味着工具平权!”
AI科技大本营· 2025-04-10 16:40
以下文章来源于CSDN ,作者唐小引 CSDN . 成就一亿技术人 MCP 最大的意义并不在于技术本身,而是「工具的平权」,和包括头部模型在内的厂商们 愿意一起去制定统一标准,才会促生真正的 Agent 应用。 作者 | 唐小引 出品 | CSDN(ID:CSDNnews) 大模型相关的技术发展实在是太快了,前面还格外抢手的 RAG、Function Call 已被打上了 昨日黄花的标签。MCP 则是正当时,各种 MCP 资源库层出不穷,比如在一些平台上已经 有近万的 MCP Servers 了。 许多人称 MCP 是一个万能插座,但我其实一直没搞明白 MCP 的爆火及其本质。MCP 实现 了在 AI 应用与本地或远程资源之间安全、受控的交互。其核心是一个 client-server 架 构,MCP 主机应用程序可以连接到多个服务。一个开放的协议,将 Host 与 Server 分离 开,作为服务的提供方,可以去专注地开发自己的原子能力,而作为 Host 的开发者,不用 再考虑要实现什么功能,需要做很多的开发工作。通过 MCP,打破原子能力之间的壁垒, 快速实现多原子能力的融合。 技术维度之外的生态发展方面, ...
当AI成了同事,程序员还能做什么?
AI科技大本营· 2025-04-10 16:40
"AI 可以生成代码了,人类程序员过往能写代码的核心竞争力没了,还能做些什么?" 最近,随着 AI 大模型能力的进一步精进, GitHub Copilot、Cursor、Devin、Manus、 Claude 等工具密集刷新登场,程序员圈子里越来越多的人开始发出这样的疑问。 要知道,过去调 Bug、查文档、撸代码,样样都得亲力亲为,如今只需对着屏幕说句话, 或敲一句自然语言,AI 就能唰唰唰地帮你把项目生出来。比如你随口一句" 用 JavaScript 写个贪吃蛇 ",或许咖啡还没凉,一个能跑的网页游戏就已经搭好了;又比如,前 OpenAI 大佬 Andrej Karpathy 不久前在社交平台 X 上展示的:哪怕完全不会 Swift,也能靠 AI 在 一小时内搓出个 iOS 应用 。 Karpathy 把这种方式叫作 "氛围编程"(Vibe Coding)——听起来有点玄,其实就是"和 AI 唠嗑写代码"。不管是开发者还是普通爱好者,都不用死磕语法、也不再纠结框架配置, 直接说:"我要一个自动登录的按钮"、"这里加个缓存",AI 就一行一行替你敲好。听起来 像开挂一样,但问题也随之而来:代码是能跑没错,可你 ...
2025全球机器学习技术大会最新最全日程来了,一键Get参会指南!
AI科技大本营· 2025-04-09 10:00
与此同时,大会将聚焦以下十二大专题,全面呈现当前最具突破性与实践价值的 AI 研究与 应用成果:大语言模型技术演进、大模型应用开发实践、大模型驱动的软件开发变革、多模 态大模型前沿、GenAI 产品创新与探索、AI Infra 大模型基础设施、大模型工程与架构、 具身智能与智能硬件、算力基建与性能优化、DeepSeek 技术解析与行业实践、AI 智能 体、大模型 + 行业落地实践。无论你是科研学者、技术专家,还是行业从业者,都将在这 里收获前沿洞见和实践经验,共同推动 AI 时代的技术变革与应用落地。 官网:https://ml-summit.org/ 2025 全球机器学习技术大会·上海站全日程正式发布,邀您一同见证 AI 的真实进化轨迹, 抢先布局智能时代的新增长引擎。 最新最全的日程来了 AI Agent 将成为各行各业的"虚拟同事"。 OpenAI CEO Sam Altman 直言,强大智能的 Agent 使用成本正以指数级下降,快速融入各类工作场景。AI 正在从"工具"走向"搭档", 正式从信息助手跃升为任务执行者,开始重塑"人-机"关系。计算力演进、强化学习落地、 Agent 架构普及、多模态技 ...
Claude深度“开盒”,看大模型的“大脑”到底如何运作?
AI科技大本营· 2025-04-09 10:00
近 日 , Claude 大 模 型 团 队 发 布 了 一 篇 文 章 《 Tracing the thoughts of a large language model》(追踪大型语言模型的思维),深入剖析大模型在回答问题时的内部机制,揭示它 如何"思考"、如何推理,以及为何有时会偏离事实。 如果能更深入地理解 Claude 的"思维"模式,我们不仅能更准确地掌握它的能力边界,还能 确保它按照我们的意愿行事。例如: 为了破解这些谜题,我们借鉴了神经科学的研究方法——就像神经科学家研究人类大脑的运 作机制一样,我们试图打造一种"AI 显微镜",用来分析模型内部的信息流动和激活模式。 毕竟,仅仅通过对话很难真正理解 AI 的思维方式—— 人类自己(即使是神经科学家)都无 法完全解释大脑是如何工作的。 因此,我们选择深入 AI 内部。 Claude 能说出几十种不同的语言,那么它在"脑海中"究竟是用哪种语言思考的?是否 存在某种通用的"思维语言"? Claude 是逐个单词生成文本的,但它是在单纯预测下一个单词,还是会提前规划整句 话的逻辑? Claude 能够逐步写出自己的推理过程,但它的解释真的反映了推理的实 ...
强制员工“带薪休假”1年?谷歌DeepMind竞业条款遭炮轰:宁可花钱白养,也不肯放人!
AI科技大本营· 2025-04-08 18:27
整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 如果有一天,你的老板突然告诉你:"未来一年你不用来上班了,工资照发,但不准跳槽去 对手公司。"——这听起来像天上掉馅饼,还是职场"金手铐"? 而在 AI 行业,这正在真实发生。 据外媒 Business Insider 最新爆料,谷歌旗下 DeepMind 为了阻止核心 AI 人才流向 Open AI、 微软等竞争对手,竟使出了一记狠招:与部分员工签订长达 12 个月的竞业禁止 协议,期间强制他们带薪休假(Garden Leave)。 换句话说:宁可白养你一年,也不让你为对手干活! 什么是"Garden Leave"?AI 界的"软封印" "Garden Leave"翻译成中文叫"花园假",最早起源于英国,原意是指公司允许员工在离职 交接期间回家"养花种菜",避免他们接触敏感数据或挖走团队成员。在谷歌 DeepMind, 这个机制被用到了极致——甚至是延长版的"高级 花园 假":最长可达一年。 作为谷歌最核心的 AI 实验室之一,DeepMind 诞生了 AlphaFold、Gemini 等重量级成 果 , 很 多 员 工 参 与 的 AI 项 ...
AI 已学会「阳奉阴违」——OpenAI 研究发现:罚得越狠,AI 作弊就越隐蔽
AI科技大本营· 2025-04-08 18:27
AI 的"狡猾"程度正在超出人们的想象。 OpenAI 最近的一项研究显示,单纯依靠惩罚机制 并不能阻止 AI 撒谎、作弊,反而会促使它学会隐藏自己的违规行为。 而这项研究带给产业 界的启示远超技术层面: 如果 AI 的" 道 德 "只是伪装给人类看的表演,那么现有安全框架 是否在自掘坟墓? 原 文 链 接 : https://www.livescience.com/technology/artificial-intelligence/punishing-ai- doesnt-stop-it-from-lying-and-cheating-it-just-makes-it-hide-its-true-intent-better-study- shows 作者 | Ben Turner 翻译 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 根据 ChatGPT 创建者 OpenAI 最近发布的一项研究显示,为防止 AI 模型发生撒谎或作弊 的行为而设置的一些惩罚机 制,并不能真正阻止它的不当行为——反而只会迫使它学会如 何更好地隐蔽自己的欺骗手段。 (CSDN 付费下载自视觉中国) 大模型的"作弊基因 ...
蚂蚁清华联手放大招!彻底开源RL框架AReaL-boba,人人可复现QwQ
AI科技大本营· 2025-04-03 10:16
责编 |梦依丹 出品丨AI 科技大本营(ID:rgznai100) 3 月的最后一天,由蚂蚁与清华大学交叉信息研究院吴翼老师团队联合推出的开源强化学习框架 AReaL 发布了里程碑版本——AReaL boba,正如其 昵称"boba"(珍珠奶茶)所寓意的那样,AReaL 团队希望他们的工作能像美味且平易近人的奶茶一样,普惠整个 AI 开发社区,让每一位开发者都能 轻松驾驭强大的推理模型。 就像 AReaL 介绍里说的那番,他们将 完全致力于开源,发布所有重现所需性能模型的训练细节、数据和基础设施。 AReaL boba 不仅把模型、代 码、数据及实现细节通通开放出来,而且还提供非常详细的教程, 真正实现了"人人可手搓顶尖大模型"的愿景。 集成 SGLang 框架,效率大幅提升! AReaL boba 是首个全面拥抱 xAI 公司高性能推理框架 SGLang 的开源训练系统。 通过引入 SGLang 并进行一系列工程优化,AReaL v0.2 在 7B 模型 上的训练速度相较于 v0.1 提升了 1.5 倍,端到端训练性能提升高达 73%。如下图所示: 官网提供的表格进一步展示了 AReaL-boba 在不同资 ...
警惕!AI 已学会「阳奉阴违」——OpenAI 研究发现:罚得越狠,AI 作弊就越隐蔽
AI科技大本营· 2025-04-03 10:16
【CSDN 编者 按】 AI 的"狡猾"程度正在超出人们的想象。 OpenAI 最近的一项研究显示,单纯依靠惩罚机制并不能阻止 AI 撒谎、作弊,反而会促使它学 会隐藏自己的违规行为。 而这项研究带给产业界的启示远超技术层面: 如果 AI 的" 道 德 "只是伪装给人类看的表演,那么现有安全框架是否在自掘坟墓? 原 文 链 接 : https://www.livescience.com/technology/artificial-intelligence/punishing-ai-doesnt-stop-it-from-lying-and-cheating-it-just-makes-it-hide-its- true-intent-better-study-shows 自 2022 年底面向公众推出以来,大语言模型(LLM)已屡次暴露出令人不安的行为模式:从常规的说谎作弊、隐藏操纵行为,到更极端的威胁要杀 人、窃取核武器密码,甚至还策划了一场致命的疫情……这些 AI 的"恶劣"行为,可谓层出不穷。 现在,OpenAI 的新实验证明,在训练过程中清除这些不当行为可能比最初设想的更加困难。 在这项实验中,研究人 ...
00后程序员当道!下班3小时“爆肝” OpenManus背后的故事
AI科技大本营· 2025-04-02 16:11
更意想不到的是, 推动 OpenManus 诞生的核心开发者,竟是一群 00 后 ! 这些年轻的程序员 完全出于兴趣和热爱 ,利用自己的时间写代码,探索 AI 的更多可能,只为让智 能体工具触手可及。 没有 KPI,没有商业利益驱动, 只有纯粹的技术信仰——Just for Fun 。 本月初, Manus 横空出世,迅速爆火!它凭借云端自主执行、多智能体协同、持续学习与记忆等核 心能力,无需过多的人工干预,就能直接交付完整的成果,也可以灵活调用各类工具,不仅能 写代 码、查资料、智能浏览网页 ,还能 操作各类应用 ,俨然一位"全能选手"。 因此,Manus 被不少人称之为"全球首个通用 AI 智能体",瞬间点燃了 AI 圈众人的热情。无数开发 者看到 Manus 的惊艳 Demo 后迫不及待想要体验。然而, 邀请码成了最稀缺的"硬通货" ,一码难 求,让许多人望而兴叹。 也就在 此时,国 内专注于多智能体系统的技术公司 DeepWisdom 的 MetaGPT 团队迅速行动, 复 刻 Manus 并开源,推出了 OpenManus,直接把门槛打了下来—— 无需邀请码,所有人都能免费 用! 同时,从复刻到上线 ...