Workflow
AutoGPT
icon
搜索文档
AI Agents与Agentic AI 的范式之争?
自动驾驶之心· 2025-09-06 00:03
AI智能体技术演进历程 - ChatGPT于2022年11月发布彻底改写AI发展轨迹 引发AI Agents和Agentic AI搜索热度飙升[2][4] - 早期专家系统如MYCIN(70年代)依赖符号推理和预设规则 缺乏学习能力和环境适应性[10] - 多智能体系统(MAS)和BDI架构(1999年)实现分布式问题解决 但仍受预编程限制[11] - 2023年AutoGPT等框架标志AI Agents落地 结合LLM与外部工具实现多步骤任务自主执行[12] - 2023年底CrewAI等系统推动进入Agentic AI阶段 多专业智能体协同分解复杂目标[12] - 谷歌2025年推出A2A协议 制定五大核心原则解决智能体互操作问题[12] AI Agents核心技术架构 - 定义为LLM和LIM驱动的模块化系统 填补生成式AI"只会说不会做"的空白[13] - 具备三大核心特征:自主性(无需人工干预) 任务特异性(专注单一领域) 反应性(适应动态变化)[16][17] - LLM作为推理决策中枢 承担目标解析 步骤分解和工具调用协调功能[21] - LIM扩展视觉感知能力 例如果园巡检AI实时识别病果和断枝并触发警报[21] - 工具集成通过"调用-结果整合"流程解决LLM知识滞后和幻觉问题[19] - ReAct框架实现推理与行动交替进行 例如ChatGPT网页搜索先判断知识缺口再调用工具[19] - Anthropic的"Computer Use"项目实现目标-行动-观察循环 控制鼠标键盘完成软件测试等任务[18] Agentic AI系统级创新 - 实现从孤立执行到协同决策的范式转变 核心在于多智能体协作解决复杂任务[24][27] - 与AI Agents关键差异体现在:广泛自主性 复杂任务协调 多智能体信息共享和跨环境学习能力[28] - 智能家居案例展示系统级智能:天气预测 能源管理和安防智能体协同实现全局目标[29] - 架构依赖两大支柱:协调层(元智能体负责任务分配和冲突解决) 共享记忆(存储任务进度和上下文)[33][36] - 动态任务分解将高级目标拆分为子任务 分配给专业智能体避免效率低下[33] - 科研助手AutoGen框架实现多智能体分工:检索 总结 整合 写作和引用智能体协同撰写综述[37] - 医疗决策支持系统集成监测 病史 治疗和协调智能体 降低误判风险并减少医生认知负担[38] 应用场景与典型案例 - AI Agents适用于客户服务 邮件筛选 内容推荐和日程管理等标准化任务[41] - Agentic AI在科研 农业 医疗和网络安全等复杂动态环境中展现优势[43] - 果园采摘场景实现多机器人协同:无人机测绘 采摘机器人 运输机器人和路径规划智能体联动[37][43] - 自动化基金申请书撰写通过多智能体协同完成文献分析 合规匹配和格式规范[43] - 企业网络安全事件响应由智能体分别处理威胁分类 合规分析和缓解方案制定[43] - ICU临床决策支持系统同步执行诊断 治疗方案制定和EHR分析 提升医疗安全性[43] 技术挑战与解决方案 - AI Agents存在因果推理缺失 LLM幻觉 知识滞后 提示敏感性和长期规划弱等痛点[50] - Agentic AI新增误差传递 协调瓶颈 涌现行为不可预测和可解释性差等挑战[50] - 十大解决方案包括:RAG提供实时外部知识 ReAct框架强化推理行动循环 因果建模区分相关性[49][52][53] - 共享记忆架构解决信息同步 元智能体协调避免混乱 工具验证机制自动修正错误[53] - 反思机制赋予自我批判能力 监控审计pipeline记录决策日志 治理架构防范安全风险[53] 未来发展方向 - AI Agents进化重点:提升主动推理能力 深化工具集成(结合机器人硬件) 强化因果推理[57] - Agentic AI突破方向:规模化多智能体协作(支持上千智能体) 领域定制化 伦理治理[57] - Absolute Zero框架探索零数据学习 实现自我驱动式的科研假设生成和验证[57] - 终极目标是从自动化工具进化为人类协同伙伴 适应高风险领域共同决策[58] - 需突破因果推理深度化 可解释性透明化和伦理安全体系化三大瓶颈[59]
生成式 AI 的发展方向,应当是 Chat 还是 Agent?
自动驾驶之心· 2025-07-11 19:23
Chat与Agent的区别 - Chat是主要由"大脑和嘴"构成的智能体,专注于信息处理和语言交流,如ChatGPT这样的系统,能理解查询并给出连贯回答但不直接执行任务 [1] - Agent是具有"手、脚"的智能体,能进行思考、决策并执行具体任务 [2] - Chat强调"说",Agent强调"做" [3] 技术发展趋势 - 人类对"让机器替人干活"的需求持续存在,OpenAI通过plugin、Function Calling、Assistant API等动作推动LLM从纯对话向任务执行扩展 [4] - 智能音箱发展路径类似:从基础语音功能(如播放音乐)逐步扩展到支付互通、智能家居控制、儿童教育等场景,成为智能生态核心 [4][5] - AI+RPA技术推动智能客服向数字员工进化,体现AI从单一对话到"说做结合"的融合趋势 [5] - 未来生成式AI将融合Chat和Agent特点,形成兼具高质量对话与复杂任务执行能力的自动化系统 [6] AI Agent的技术变革 - 颠覆传统软件开发模式:从预先定义逻辑转向由LLM自主支配运行,实现运行时学习与调优 [7] - 核心模块包括Memory(记忆)、Tools(外部工具)、Planning(计划)和Action(行动) [7] - 当前学习路径分为OpenAI技术路线和开源技术路线,建议技术人员选择一条深入实践 [9] 典型AI Agent项目案例 - AutoGPT:可拆解用户目标为子任务,通过搜索、脚本执行等方式自主完成任务 [11][12] - JARVIS:采用"模型选择"机制,调用Huggingface专家模型处理多模态任务 [13][15] - MetaGPT:模拟软件公司结构,分配产品经理、工程师等角色协作完成编码任务 [16] 开发者生态与机会 - 工具/平台成熟为个体开发者提供新舞台,使AI原生应用开发门槛降低 [16] - 自动驾驶领域已形成近4000人社区,覆盖300+企业与科研机构,涉及30+技术栈(如BEV感知、SLAM、轨迹预测等) [19][21]
红杉AI峰会六大关键议题解读(3):智能体觉醒,AI从任务执行者迈向经济行为主体
海通国际证券· 2025-05-13 21:44
报告行业投资评级 未提及 报告的核心观点 - 2025年红杉AI峰会上“智能体经济”成高频话题,AI智能体正从单一任务执行者演进为经济行为主体,开启人机共生新阶段 [3][9] - AI正从功能工具演化为经济参与者,智能体获“身份”和“意图表达”能力,成可参与经济活动的“半自主个体”,摆脱人类操作控制台 [4][10] - AI智能体核心特征是具备决策、执行和协作三重能力,协作模式超传统软件模块分工,接近人类项目小组工作流程 [5][11] - 智能体催生新工作分配逻辑,推动“AI雇佣AI”经济生态形成,未来竞争力在于管理智能体网络而非人力配置 [6][12] - 智能体经济加速AI商业应用落地,重构企业内部生产结构,企业借助AI构建“任务执行网络”,组织结构向“任务制”过渡 [6][13] 根据相关目录分别进行总结 事件 - 2025年红杉AI峰会上“智能体经济”成高频讨论话题,AI智能体从单一任务执行者演进为经济行为主体,开启人机共生新阶段 [3][9] 点评 - AI从功能工具演化为经济参与者,过去“AI智能体”多为执行单一任务插件,如今智能体获“身份”和“意图表达”能力,成“半自主个体”,可自行规划路径、决策、追踪结果并协作,摆脱人类操作控制台 [4][10] - AI智能体核心特征是决策、执行和协作三重能力,以Claude Code或OpenAI的AutoGPT等系统为例,能理解需求、拆解目标等,不同Agent可互为上下游,协作模式接近人类项目小组工作流程 [5][11] - 智能体催生新工作分配逻辑,推动“AI雇佣AI”经济生态形成,未来开发场景中AI可组成“虚拟团队”,分布式智能架构提升效率,挑战现有流程,竞争力在于管理智能体网络 [6][12] - 智能体经济加速AI商业应用落地,重构企业内部生产结构,企业借助AI构建“任务执行网络”,智能体自动识别瓶颈等,提升效率,助组织结构向“任务制”过渡,AI参与企业资源协调等 [6][13]
海内外大厂拥抱MCP,一场争夺Agent生态话语权的预备役
第一财经· 2025-05-09 14:46
行业动态与趋势 - 人工智能行业存在隐性"鄙视链",模型公司、Agent公司、提示词公司之间存在层级差异,但随着MCP协议普及,行业更注重产品效果而非技术层级 [1] - 行业从早期模型刷榜阶段转向解决实际问题,具备规划执行功能的Agent成为重点,MCP协议成为生态构建关键 [1] - 全球AI Agent市场规模预计从2024年52.9亿美元增长至2035年2168亿美元,复合年增长率40.15% [3] MCP协议发展与应用 - Anthropic公司提出MCP协议,旨在建立大模型与外部工具的统一接口,被形容为"AI万能插头" [4] - OpenAI宣布Agent SDK支持MCP服务协议,将其提升至类似HTTP的基础设施地位,Cursor、Winsurf等平台相继接入 [5] - 国内厂商百度、腾讯、阿里、字节跳动密集布局MCP协议,分别构建"千帆平台"、"知识引擎"、"支付MCP Server"、"扣子空间"等应用场景 [6] - 谷歌推出A2A协议与MCP形成竞争,两者分别侧重工具调用标准和多Agent协作,未来可能存在融合可能性 [7] 市场需求与行业共识 - 开发者面临多工具调用和模型协同的复杂问题,MCP协议通过统一标准降低适配成本,市场需求显著 [8] - 行业类比互联网早期HTML和HTTP协议,认为统一开放的MCP协议将加速AI Agent生态发展 [9] - 埃森哲全球副总裁俞毅指出,MCP协议的生命力取决于开源特性和市场需求,目前行业仍处早期演进阶段 [10] Agent技术挑战与前景 - Agent需解决意图识别等核心问题,例如"讨价还价"场景的实现将推动商业化应用 [11] - 涂鸦智能CEO王学集认为AI Agent可降低用户使用门槛,未来可能通过对话框集成主流Agent服务 [11] - 海外市场侧重MCP应用构建,国内聚焦流量入口争夺,但最终需回归解决实际问题的应用场景 [12]
你真的会用DeepSeek么?
搜狐财经· 2025-05-07 12:04
AI Agent行业趋势 - AI行业正从单一模型应用转向多Agent协作网络,形成"AI互联网"新范式 [7][8][27] - 2025年起行业需求从"驱动单个模型"升级为"设计智能体协作系统",从业者角色需从使用者转变为组织者 [21][27][29] - 字节跳动、阿里、腾讯等国内平台加速布局MCP协议基础设施,海外谷歌A2A协议与Anthropic MCP协议推动跨系统协同标准 [36][37][38][39] 技术架构变革 - Agent通信依赖结构化协议(MCP/A2A)而非自然语言Prompt,意图表达、任务链图谱取代传统Prompt工程 [14][27][29] - 平台化趋势显著:阿里百炼5分钟搭建MCP服务,百度推MCP插件商店,OpenAgents支持自然语言发布Agent能力 [16][38] - 开源框架LangGraph、AutoGen、CrewAI等提供多Agent编排工具,支持状态机、DAG等协作建模 [33][35][41] 企业动态与产品 - 字节跳动2025年4月推出"扣子空间"内测平台并开源Agent TARS项目,支持任务规划与多工具调用 [16][39] - 阿里云百炼上线全生命周期MCP服务,集成高德、无影等50+能力模块,提供零部署Agent构建体验 [38] - 腾讯云发布"AI开发套件"聚焦企业级调度中台,火山引擎OS Agent整合MCP协议实现"一句话开发" [38][39] 从业者转型路径 - 工程岗需转向智能体系统开发:学习LangGraph状态机、MCP协议结构、平台接口设计,目标成为Agent基础设施构建者 [33] - 运营/产品岗需掌握业务需求拆解为多Agent意图的能力,熟练使用AutoGen Studio等平台进行协作设计 [34] - 创业者应聚焦生态构建:将工具服务注册为Agent节点,参与制定意图协议标准,搭建私域Agent网络 [35] 行业基础设施进展 - 海外A2A协议覆盖50+巨头企业,专注跨平台Agent通信标准,MCP协议则强化任务调度与状态传递 [36][37] - 国内形成平台+开源双轨发展:阿里/腾讯提供企业级MCP服务,LangGraph等框架降低多Agent系统构建门槛 [38][41] - 协议层创新类比TCP/IP,MCP/A2A可能成为未来智能体互联网的底层秩序 [42]
一堂「强化学习」大师课 | 42章经
42章经· 2025-04-13 20:01
强化学习(RL)基础概念 - 强化学习是机器学习中解决多步决策问题的算法框架 其特点在于没有标准答案 通过最终反馈机制评判结果好坏[6] - 与传统监督学习不同 RL不需要标注数据 而是通过环境交互获得奖励信号 更接近人类解决问题的逻辑[6][7] - 典型应用场景包括游戏(如乒乓球)和复杂任务(如行程规划) 每个决策步骤会影响最终结果[6] RL与LLM的结合发展 - OpenAI首次在InstructGPT中将RL与LLM结合 解决大模型指令遵从问题 衍生出RLHF技术[10][11] - RLHF通过人工标注数据训练奖励模型 使LLM输出更符合人类需求 但本质是对齐而非增强模型能力[12][13] - RL实现"慢思考"机制 通过延长推理过程(token量增加)提升LLM准确性 形成inference time scaling范式[14][15] 行业技术路径分化 - OpenAI聚焦Agent范式 实现多轮交互和虚拟世界操作 完成从单轮到多轮的跃迁[20][21] - Anthropic专注编程能力 在简单问题快速响应与复杂问题深度思考间取得平衡[17][30] - DeepSeek探索通用泛化能力 通过理科训练与文科调校结合实现平衡输出[18][31] 技术实现关键要素 - 基建框架决定迭代效率 7B模型训练周期从7天缩短至2天可提升3倍试错机会[33] - 数据质量比数量更重要 针对性训练数据可显著提升模型性能[33] - 理解能力依赖LLM预训练 决策能力依赖RL 二者形成乘法效应缺一不可[23][24] 行业应用与人才现状 - RL人才稀缺源于技术门槛高 论文引用量比NLP/CV少一个数量级 工业级应用场景有限[39][40] - 开源框架AReaL-boba实现7B模型SOTA性能 推动RL技术普及[43] - 创业公司需把握技术窗口期 在终局到来前快速验证产品 而非追求长期技术优势[37][38] 企业组织架构建议 - 预训练与后训练团队需紧密协作 成员需具备跨领域知识避免能力盲区[36] - 按目标划分专业团队(多模态/RLHF等) 同时保持技术路线的灵活性[36] - Agent公司需储备RL人才 尽管当前技术门槛较高但未来可能成为标配能力[37]
ECARX(ECX) - 2024 Q4 - Earnings Call Transcript
2025-03-12 01:08
财务数据和关键指标变化 - 第四季度和全年营收分别增长4%和18%,毛利率分别为21.2%和20.8% [10] - 全年总营收达56亿人民币,同比增长18%;毛利润12亿人民币,同比下降9%,毛利率20.8% [34] - 第四季度EBITDA实现盈亏平衡,调整后EBITDA收益为7400万人民币,去年同期亏损2.36亿人民币 [33] - 第四季度每股亏损0.11人民币,去年同期为0.89人民币 [33] 各条业务线数据和关键指标变化 - 第四季度商品销售收入15亿人民币,同比增长16%,主要受计算平台需求推动 [29] - 第四季度软件许可收入9000万人民币,同比下降3%,环比增长7% [30] - 第四季度服务收入3.26亿人民币,同比下降31%,环比大幅增长102% [30] 各个市场数据和关键指标变化 - 2024年全球汽车销量约9100万辆,增长约2%,其中乘用车6400万辆 [8] - 2024年中国乘用车销量增长6%至2800万辆,新能源汽车销量飙升36%至3000万辆,占比超40% [8] 公司战略和发展方向和行业竞争 - 聚焦加强和拓展前沿、高性价比解决方案组合,巩固全球汽车智能解决方案领先地位 [7] - 优化产品成本,提高运营效率,平衡营收增长、盈利能力和资本投资 [32] - 深化吉利及吉利生态系统渗透,拓展全球汽车制造商客户群 [36] - 投资研发,把握中长期增长机会,加速构建中国和全球市场闭环系统 [36] - 行业竞争激烈,汽车制造商差异化竞争战场拓展至ADAS和车辆智能领域 [23] 管理层对经营环境和未来前景的评论 - 全球汽车市场增长缓慢且环境挑战加剧,但软件定义汽车市场势头良好,公司前景乐观 [7] - 2025年目标实现全年EBITDA为正,对未来增长前景充满信心 [14] 其他重要信息 - 2024年总出货量达200万台,创历史新高,同比增长33%,第四季度出货超70万台,环比增长10% [11] - 道路上搭载ECARX技术的车辆超810万辆 [11] - 与大众集团达成新项目,全球客户群扩展至18家汽车制造商、28个品牌 [12] - 上季度发布AutoGPT车载AI大语言模型应用,并集成多LMS多模态 [13] - 截至2024年12月31日,全球拥有692项注册专利和723项专利申请 [24] 总结问答环节所有的提问和回答 问题1: 公司的全球生产产能布局以及未来几年全球订单的实施节奏 - 2024年在中国大力提升制造能力,富阳工厂持续扩大产能,将是中国地区的主要生产基地 [42] - 全球扩张时,可能会与EMS或合同制造伙伴合作,同时继续拓展工程服务和能力 [44] 问题2: 公司目前ADAS或AD产品的计划、合作客户以及与吉利合作的增长机会 - 已推出Skyline Pro产品,应用于领克08和07等车型,支持高速公路NLP功能,也是GD - ADAS路线图的一部分 [45] - 持续研发Skyline Pro和Skyline平台,与5G公司共同发布AD1000 SoC平台,预计未来两年投入生产 [46] 问题3: 公司未来3 - 5年的总体战略路线图和发展目标 - 未明确提及具体内容,但强调将继续专注于为汽车制造商提供独特价值,多元化全球客户群,应对地缘政治挑战,改善成本结构 [37] 问题4: 2025年的营收、毛利率和盈亏平衡点的指引 - 2025年首要目标是实现盈亏平衡,营收增长为次要目标,以确保健康的现金流和财务状况支持全球扩张 [53] - 2025年将继续优化成本和规模经济,加速营收增长,提高运营效率,预计运营费用与营收比率将进一步优化至20%以上 [60][63] 问题5: 2024年按客户划分的营收明细以及未来5 - 10年客户组合的展望 - 2024年大部分营收仍来自吉利,但已开始向非吉利业务拓展,目前吉利及相关生态业务占比近80%,非吉利业务占比20% [83] - 2025年将大力支持一汽红旗,2026 - 2028年红旗和大众业务量将逐步增加,预计到2027 - 2028年,吉利和非吉利业务占比将达到50% [74] 问题6: 作为吉利品牌最大的智能座舱供应商,是否会受益于吉利的供应链整合以及在吉利品牌中的份额上限 - 吉利品牌中,Antora平台是关键架构元素,未来将继续在更多车型中部署,与吉利的合作将不断深化 [72] 问题7: 吉利在2024年的营收贡献占比 - 2024年近80%的营收来自吉利及相关生态业务,20%来自非吉利业务 [83] 问题8: 领克与极氪合并对公司业务的影响 - 公司作为领克的重要供应商,合作不受太大影响,领克08和07车型成功,客户对Flyme Auto系统体验满意,未来仍将是重要合作伙伴 [86] 问题9: 吉利银河E8使用高通8295芯片是否采用公司的Pikes计算平台 - 银河E8使用Flyme Auto软件,由公司提供,但硬件8295来自其他供应商,公司为其提供Skyline ADAS系统及高速公路NLP功能 [88]