基础智能体
搜索文档
IBM专家:企业级智能体规模化依赖专用模型,智能体「Shopify时刻」尚未到来
36氪· 2025-12-04 12:12
文章核心观点 - IBM专家认为,AI智能体技术目前处于早期阶段,距离消费级大规模应用尚有距离,其普及的关键在于解决可靠性、成本效益和基础设施等核心挑战,并期待出现能够大幅降低使用门槛的“Shopify时刻”平台化解决方案 [1][3][8] AI智能体技术发展现状与挑战 - 消费级智能体短期内难以爆发,现有技术无法稳定处理真实世界中复杂、长链条的任务,从原型开发到大规模部署存在巨大鸿沟 [1] - 智能体技术目前类似2018年的大语言模型,已走出纯研究范畴,但尚未出现类似ChatGPT的“杀手级”封装产品,只有一些概念验证演示 [4][5] - 自然语言直接生成并运行智能体是大众化的终极愿景,但当前直接赋予大模型过多工具权限易导致行为“脱轨”,可靠的系统仍需依赖规划模块来结合创造性与确定性 [2][10] - 生产级智能体需要“先规划、后执行”的确定性框架,以防止模型跳步、产生幻觉或错误累积,这类框架目前仍需开发者自行搭建,并非开箱即用 [10][11] 规模化部署的关键瓶颈与所需条件 - 智能体规模化部署需解决三大问题:1) 可靠性与控制,需要成熟框架和“护栏”技术;2) 成本效益,需实现成本指数级下降以取代人工;3) 基础设施与生态,需要简化部署运维的“智能体云平台” [3] - 当前开发者生态在创意实验阶段已有多种工具,但真正的瓶颈在于“搬出去”部署,缺乏“一键搞定”的现成方案,部署、扩容、分享均需自行搭建技术栈 [6][7] - 阻滞普及的核心原因之一是缺乏“拿来即用”的智能体解决方案,真正的“Shopify时刻”尚未到来,即任何用户无需编程知识即可通过自然语言描述生成并运行智能体 [7][8] - 智能体要大规模落地,生产级框架必须被集成到平台或下沉到模型层,以真正降低使用门槛 [11] 未来市场格局与竞争关键 - 未来智能体市场的主导权可能取决于两大核心能力:在模型层面提供最佳推理与规划能力,以及在基础设施层面实现极致的成本优化 [3] - 智能体领域的赢家可能是能够率先实现“流程可复制”的玩家,通过定义“基础智能体”将通用规划与执行能力预置好,使市场从手工作坊走向平台规模 [14] - 另一种可能的路径是,专注于深耕某一具体用例并做到极致的玩家,通过复用其中的模块或架构,最终演化出平台型产品 [14][15] - 竞争力在于成本优化竞赛,需要基础设施将单任务成本压低10-100倍,使智能体能够处理更多低价值或原本无人处理的环节,像水电一样无处不在 [13] - 明年可能会看到专门构建的“规划模型”出现,专注于把规划做对,以降低对昂贵前沿模型的依赖 [12] IBM公司表现与相关实践 - IBM今年以来股价上涨41.2%,跑赢了纳斯达克综合指数15.2%和标普500平均13.2%的涨幅,公司目前市值约2829亿美元 [1] - IBM 2025年第三季度营收增长9%,达到163亿美元,其中基础设施板块营收增速达17% [1] - IBM内部已在试验将流程和业务描述直接从自然语言转成LangFlow可执行文件,探索“用自然语言描述问题就能自动生成智能体”的路径 [7]
阿里巴巴(09988)组建机器人和具身智能团队 探索让AI从虚拟世界走向物理世界
智通财经网· 2025-10-09 15:49
公司战略与投资 - 阿里巴巴通义千问大语言模型负责人宣布已组建机器人和具身智能的小型团队 探索让模型从虚拟世界走向物理世界 使其从语言模型向能够在现实世界中行动的智能体迈进 [1] - 阿里巴巴集团于9月8日领投机器人科技企业"自变量机器人"1.4亿美元融资 用于加速其人工智能与机器人核心技术研发、产品迭代及商业化落地 [1] - 阿里巴巴计划在云计算、AI平台、供应链、全球化渠道等方面与自变量机器人深度协同 未来合作或率先落地于智能制造、仓储物流、家庭服务机器人等场景 [1] 行业趋势与资本开支 - 阿里巴巴CEO表示未来五年全球AI投资总额将加速增长到4万亿美元 [2] - 公司此前已公布未来三年为云和AI硬件基础设施投入3800亿元 并计划在此基础上追加投入 [2]
原力无限签订2.6亿元具身智能单笔订单;阿里通义已建立机器人和具身智能的小型团队丨智能制造日报
创业邦· 2025-10-09 11:23
荣耀Magic8系列及AI手机发展 - 荣耀宣布将于10月15日举办Magic8系列及MagicOS 10发布会,新机定位为“自进化AI原生手机” [2] - 新机搭载独家AI实体侧边键,支持短按快速进入影像界面、长按唤醒YOYO智能体 [2] 具身智能在文旅领域的商业应用 - 原力无限智能科技与时华文旅控股集团签署2.6亿元人民币战略合作协议,创下全球具身智能单笔金额最大商业订单纪录 [2] - 双方合作围绕“机器人+文旅”战略,旨在打造全国首批具身智能智慧景区样板工程,覆盖智能导览、互动体验、运营服务及数字管理等环节 [2] 商业航天与可重复使用火箭融资进展 - 美国可重复使用火箭开发商Stoke Space完成5.1亿美元D轮融资,由美国创新技术基金领投 [2] - 此轮融资使公司总融资额达到9.9亿美元,资金将用于加速可重复使用运载火箭Nova的研发及产能扩张 [2] 科技巨头在机器人及具身智能的布局 - 阿里通义千问大语言模型负责人林俊旸表示已建立机器人和具身智能小型团队,认为多模态基础模型正转变为基础智能体 [2] - 基础智能体可利用工具和记忆通过强化学习进行长视野推理,并应从虚拟世界走向物理世界 [2]
世界知名研究机构:基础智能体的进步与挑战研究报告,从类脑智能到进化、协作和安全系统
欧米伽未来研究所2025· 2025-04-07 16:37
文章核心观点 《基础智能体的进步与挑战研究报告:从类脑智能到进化、协作和安全系统》由多位学者完成,20多家国际知名研究机构联合发布,探讨基于大型语言模型的智能体发展,为下一代智能体发展提供全面路线图,智能体技术发展将改变生活和工作方式,未来要确保技术发展与道德考量并重,实现人类与人工智能协同工作、共同繁荣 [1] 从人脑到人工智能:模块化的智能体设计 - 现代智能体设计从人脑中汲取灵感,采用模块化设计方法,将复杂智能行为分解为互相协作的功能模块 [4] - 智能体核心是认知模块,还包括感知系统和行动系统,认知系统内部又细分为记忆、世界模型、情感、目标和奖励等子系统 [4] - 记忆系统对智能体持续学习和适应性至关重要,世界模型让智能体理解和预测环境变化,情感和奖励系统为智能体提供动力和目标导向 [4][5] 自我进化:走向持续学习的智能体 - 现代智能体发展出自我提升能力,能通过自我反思、经验积累和反馈学习不断完善自己 [7] - 记忆系统在自我进化中扮演关键角色,自动机器学习和LLM驱动的优化策略使智能体适应新任务需求或环境变化 [7] 集体智慧:多智能体系统的协作与进化 - 多智能体系统通过集体协作解决单个智能体无法解决的复杂问题,由多个具有不同专长和职责的智能体组成 [8] - 多智能体系统结构包括层级结构和网络拓扑,智能体之间通过通信协作,应用范围广泛 [11] - 随着技术发展,多智能体系统社会性增强,展现出类似人类社会的特征,增强了与人类的协作能力 [11] 安全与伦理:构建值得信任的AI系统 - 研究报告提出全面安全框架,将智能体面临的威胁分为内在威胁和外在威胁两大类 [12] - 研究人员开发各种防御机制应对威胁,“超级对齐”技术也在研究中,确保AI系统与人类价值观一致 [12] - 安全与能力存在复杂关系,构建安全、有益的AI系统是技术和伦理挑战,需要多学科合作和深思熟虑的设计 [13] 未来展望:智能体技术的发展方向 - 未来智能体将具备更强的跨域整合能力、更深层次的自主学习能力、更复杂的社会协作能力和更强的安全保障 [17]
是炒作还是真突破?Manus的真实面目是什么?
21世纪经济报道· 2025-03-08 22:56
核心观点 - AI智能体产品Manus引发资本市场狂欢,自称全球首个通用AI智能体,性能超越OpenAI的Deep Research,能独立执行复杂任务并交付成果[1][4][6] - 市场对Manus的评价两极分化,既有"智能体的ChatGPT时刻"的盛赞,也有质疑其技术突破和营销炒作的争议[2][7][8] - 行业技术人士认为Manus产品体验良好但技术未突破业内共识,其核心逻辑为多智能体系统结合工具使用[12][13][14] - 头部科技公司和模型厂商正加速布局AI智能体领域,可能挤压Manus等初创公司的市场空间[16][17] - 2025年被普遍视为AI智能体爆发元年,垂直领域应用、协作工具和基础设施层被视为关键机会[16][20][21] 产品与技术分析 - **产品定位**:Manus定位为通用AI智能体,区别于聊天机器人和AI助手,具备自主规划、决策和学习能力,可执行简历筛选、股票分析等复杂任务[4][5][6] - **技术框架**:采用多智能体系统,通过PlanningTool生成线性任务计划,以ReAct循环调用工具(计算机/浏览器/规划使用)动态执行任务[14][15] - **性能表现**:在GAIA Benchmark测试中取得SOTA成绩,宣称单任务运行成本低至2美元[6][15] - **竞品对比**:MetaGPT团队早于Manus推出多智能体产品MGX,并在Manus发布次日推出开源复刻版,认为其技术未超越行业共识[3][9][10] 市场反应与争议 - **资本影响**:Manus发布当日A股相关概念股集体爆发,港股科技股走强,邀请码被炒至数万元[7][8] - **真实性争议**:技术圈对其泛化能力存疑,认为特定场景表现依赖预定义流程,且未公布技术文档[11][12][13] - **公司回应**:蝴蝶效应合伙人否认饥饿营销,称系统容量有限将逐步释放邀请[8] 行业趋势展望 - **发展方向**:AI智能体被视为大模型后的关键里程碑,可能成为通向AGI的路径,基础智能体(Foundation Agent)概念受关注[16][21] - **竞争格局**:OpenAI、谷歌等巨头凭借模型优势加速入场,初创公司先发优势易被抹平[17][18] - **落地挑战**:需解决跨平台兼容性、知识产权、数据安全等问题,垂直领域专精应用更具前景[20][21]