Workflow
GAIA
icon
搜索文档
Bitget Launchpool 上线 GAIA,提供超 470 万枚代币奖励
Globenewswire· 2025-07-30 13:43
核心观点 - Bitget宣布在其Launchpool上推出去中心化计算基础设施Gaia (GAIA)并开放现货交易,GAIA/USDT交易对将于2025年7月30日09:00 (UTC)开盘 [2] - Gaia是一个去中心化人工智能网络,基于区块链技术构建,允许用户托管、拥有自主人工智能代理并与之交互,同时确保数据主权与隐私 [4] - Bitget通过上线Gaia拓展其产品体系,标志着其在拥抱去中心化人工智能创新方面迈出重要一步,为用户提供更强的数据隐私掌控权并支持下一代Web3应用 [6] 产品上线与交易 - GAIA/USDT交易对将于2025年7月30日09:00 (UTC)正式开盘 [2] - Bitget的GAIA Launchpool活动总计提供4,741,300枚GAIA作为奖励,用户可通过锁定BGB代币参与,活动时间为2025年7月30日09:00至8月1日09:00 (UTC) [2] - 在BGB锁定池中,用户可锁定5至50,000枚BGB,最高锁定限额由用户的VIP等级决定,并有机会瓜分3,858,300枚GAIA代币 [2] 营销活动 - Bitget启动CandyBomb活动,奖池总额为633,000枚GAIA,其中211,000枚分配至新用户交易池,422,000枚分配至现有用户交易池,活动时间为2025年7月30日09:00至8月6日09:00 (UTC) [3] - Bitget举办X平台抽奖活动,750名用户将有机会瓜分125,000枚GAIA,活动时间为2025年7月30日09:00至8月1日09:00 (UTC) [3] - 社区活动额外提供125,000枚GAIA,由750名用户瓜分,活动时间为2025年7月30日09:00至8月6日09:00 (UTC) [4] Gaia技术特点 - Gaia基于区块链技术构建,确保每个人工智能节点独立运行,同时为更广泛的互联生态系统贡献力量 [4] - 用户可部署Qwen2 0.5B Instruct等先进模型,并利用个人或企业数据对其进行定制,打造个性化的人工智能服务 [4] - Gaia开创了去中心化人工智能开发与变现的全新模式,其用户友好型基础设施让个人能够轻松安装节点软件、配置模型,并参与基于领域的人工智能协作 [4] Bitget公司概况 - Bitget成立于2018年,是全球领先的加密货币交易所和Web3公司,在150多个国家和地区为超过1.2亿用户提供服务 [7] - Bitget Wallet前身为BitKeep,支持超过130条区块链和数百万种代币,可直连超过20,000个去中心化应用程序 [7] - Bitget目前上线逾800种加密货币交易对,并承诺将交易对数量扩展至900对以上 [6] 战略合作 - Bitget是西班牙足球甲级联赛(LALIGA)在东亚、东南亚和拉美市场的官方加密货币合作伙伴 [7] - Bitget与联合国儿童基金会(UNICEF)合作,计划在2027年前为110万人提供区块链教育支持 [8] - Bitget是MotoGP™的独家加密货币交易所合作伙伴 [8]
Agent KB:经验池让Agents互相学习!GAIA新开源SOTA,Pass@1性能最高提升6.66
机器之心· 2025-07-25 15:15
Agent KB框架核心创新 - 通过构建共享经验池和两阶段检索机制实现AI Agent间的经验共享,显著提升复杂推理和问题解决能力[1] - 采用「Reason-Retrieve-Refine」方案和Teacher-Student双阶段检索机制,实现不同层次的历史经验学习与应用[5] - 解决了现有记忆系统中不同Agent框架经验无法共享的根本性限制,避免新任务需从零开始探索的问题[4] 技术架构与工作流程 - 知识构建阶段从多元化数据集提取可泛化的问题解决模式,转化为结构化知识条目[21] - 推理阶段采用Student Agent和Teacher Agent协作机制,分别负责宏观策略规划和微观执行优化[22][23] - Student Agent通过Reason-Retrieve-Refine循环提供整体解决方案框架,Teacher Agent提供精细化改进建议[22][23] GAIA基准测试表现 - 在GAIA验证集165个测试用例中,GPT-4.1模型Pass@1指标从55.15%提升至61.21%,Claude-3.7从58.79%提升至65.45%[12][13] - Level 1基础任务中Claude-3.7达到75.47%准确率,Level 2中等复杂度任务达66.28%,Level 3高难度任务保持38.46%[12] - 采用简单smolagents框架验证,排除复杂框架带来的性能增益,清晰展示经验共享机制本身效果[12] 跨领域应用验证 - 在SWE-bench软件工程数据集上,o3-mini模型50次迭代成功率从23.00%提升至31.67%,100次迭代从29.33%提升至33.67%[16][17] - 蛋白质数据库案例显示,传统方法计算O-H距离错误为0.961 Å,Agent KB增强后正确提取骨架原子对报告1.456 Å[19] - 所有测试模型包括DeepSeek-R1、GPT-4o等均显示一致性改进趋势,证明方法普适性[15] 关键技术组件分析 - 消融实验显示Refine模块最关键,移除后整体准确率从61.21%降至55.15%,Level 3任务从34.62%降至30.77%[27][28] - Student Agent缺失使Level 1任务从79.25%降至75.47%,Teacher Agent缺失使Level 1从79.25%降至73.58%[27] - 采用文本相似度、语义相似度和混合检索三种核心方法,最优策略因任务类型而异[30][31] 错误分析与改进机制 - GPT-4.1纠正25个基线特有错误,净减少10个错误实例 Claude-3.7纠正22个基线错误,净改进11个实例[35] - 检索错误从24减至20,规划错误从13减至10,格式错误显著减少,显示结构化经验的优化效果[35] - 改进具有选择性,49个错误在基线和Agent KB中均出现,表明模型固有局限[35]
Manus引爆智能体复现潮!DeepSeek已被整合,项目挤满开源榜,海外大V排队求码
量子位· 2025-03-09 12:45
智能体赛道发展 - Manus的发布带动了整个智能体赛道的热度,引发开源复现潮和商业闭源产品的竞争[1] - 两个开源项目OpenManus和OWL在Manus发布当天就推出了复现代码[2] - OWL项目由国内CAMEL-AI团队开发,整合了DeepSeek模型到多智能体协作框架中[3][4] OWL项目表现 - OWL在GAIA基准测试验证集上平均分排名第3,在开源项目中排名第1[5] - Level 1分数达到81.13%,超过OpenAI的Deep Research,接近Manus的86.5%[6] - Level 2和Level 3分数仍有差距,但团队表示有信心提升[7] 开源社区动态 - GitHub热榜上Agent相关项目占据主导,MetaGPT和AutoGPT位列前排[8] - Camel-AI和OpenManus使用的代码库browser-use受到关注,金融、编程领域垂直智能体也备受瞩目[9] - MetaGPT项目获得50,504星标,AutoGPT项目获得172,643星标,显示社区高度关注[10] Manus海外扩张 - Manus通过发放邀请码成功打入海外市场,吸引大量用户试用并付费[13][14] - 海外用户反馈Manus在个人信息收集、网站部署、编程任务等方面表现优异[18][19][20][21] - 用户主要抱怨集中在速度较慢和邀请码短缺[23] GAIA基准测试 - GAIA测试由450+复杂问题组成,分为三个难度级别,评估智能体工具使用和自主性[25][26][27] - 人类在Level 2和Level 3的成功率分别为92%和87.3%,GPT-4得分仅为9.7%和0%[28] - Manus在Level 3分数达到57.7%,领先优势明显[29] 行业趋势 - GAIA基准测试正成为智能体产品的必争之地,类似ImageNet在深度学习时代的作用[24][32] - 行业从BERT时代的CLUE基准转向ChatGPT时代的MMLU和ChatBot Arena,现在聚焦GAIA[30][31] - 未来可能出现AgentArena智能体竞技场,进一步推动行业发展[32]
一手体验:首款通用Agent产品Manus,效果如何?
虎嗅APP· 2025-03-06 18:23
Manus产品能力 - 首款通用Agent产品Manus在GAIA评分上超越OpenAI的DeepResearch成为第一[7][8] - 整合OpenAI的DeepResearch和Claude的Computer Use功能并能自主编写代码[5] - 具备复杂任务拆解、规划和执行能力可自动在云端运行[23][24] - 交互设计优秀提供实时进度同步和可视化任务步骤[36][37][39] 技术性能 - GAIA测试包含466个多步骤实际问题分为三个难度级别[11][12] - 2023年人类在GAIA测试成功率90%而GPT-4仅15%[14] - 支持PDF转PPT、发票整理、股票分析等复杂任务[25][42][55] - 任务执行时间从几分钟到30分钟不等[40][52][63] 应用案例 - PDF转PPT案例展示完整任务拆解和执行流程[26][27][28][29][30][33][34] - 发票整理案例实现OCR识别和Excel自动生成准确率接近100%[42][43][44][45][49][50][53] - 股票分析案例生成交互式图文报告质量超越OpenAI[56][57][58][59][60] - 开源模型时间线案例展示30分钟生成能力[62][63] 行业影响 - 代表中国团队在AI领域的技术突破[69][70][71] - 将Agent工程推向新高度可能改变行业格局[65][69] - 需要清晰具体的prompt以获得最佳执行效果[66][67] - 2025年3月6日被视为AI发展重要里程碑[68][69]