Agent(智能体)

搜索文档
忘掉《Her》吧,《记忆碎片》才是 LLM Agent 的必修课
Founder Park· 2025-07-29 16:05
行业趋势演变 - AI行业叙事从Chatbot(聊天机器人)转向Agent(智能体)成为主流 讨论焦点从"意图识别"和"多轮对话"变为"任务分解"、"工具调用"和"自主规划" 行业热度堪比2016年移动互联网爆发期 [4] - 电影《Her》定义了Chatbot范式的终极形态 而《记忆碎片》的主角莱纳德被视为Agent的完美隐喻 展示系统如何在信息不完整环境下为目标思考与行动 [5] Agent系统架构 - 上下文工程是围绕LLM有限注意力窗口设计的信息管理技术栈 目标是为每个决策点提供恰到好处的信息 决定Agent成败 [5] - 莱纳德的记忆系统对应LLM三大特征:长期记忆如同训练数据(静态知识库) 短期记忆如同上下文窗口(15分钟记忆限制) 行动驱动类似Agent任务导向 [9] 上下文工程三大支柱 外部知识管理 - 拍立得照片系统对应RAG技术 实现知识管理闭环:选择性记录任务关键信息 而非存储所有数据 避免检索时信息过载 [17][20] - 完整流程包括信息采集固化(拍照)、上下文标注(背面笔记)、按需调用(匹配检索) 体现RAG核心价值 [23] 上下文提炼结构化 - 将信息从照片升级到纹身 代表信息提炼压缩过程 只保留经过验证的核心断言(如"事实5") 并物理结构化确保读取优先级 [22][29] - Agent需成为信息炼金术士 对冗长信息进行压缩总结 在有限Token预算内最大化信息密度 避免"大海捞针"困境 [25] 分层记忆管理 - 三层架构:核心任务层(不可变纹身)、情景工作层(可读写照片)、瞬时处理层(易失性大脑记忆) 实现高效记忆调度 [30] - 需明确定义信息层级 区分宪法级指令、任务日志和临时缓存 防止Agent迷失在海量操作日志中 [28] Agent系统风险 - 上下文投毒风险:外部恶意输入可能导致Agent将错误信息当作真理输出 呈现"垃圾进真理出"现象 [32] - 自我强化认知牢笼:Agent在多步任务中可能将前序错误结论当作事实 缺乏独立审查机制导致偏差放大 [33][34] 系统优化方向 - 缺失反思模块是当前Agent核心缺陷 需建立验证机制比对行动结果与预期差距 生成误差报告指导后续行动 [35] - 构建可靠行动系统比单纯追求自主性更重要 需防止创造高效但永不怀疑的"莱纳德军队" [36]
直击WAIC 2025 | 当“如何落地”成AI高频问题 中国电子云:“懂业务”比单纯技术优势更重要
每日经济新闻· 2025-07-27 21:03
公司战略与定位 - 中国电子云在2025年正式将AI纳入战略核心,从"尝试性投入"转向"战略级布局" [2][4] - 公司依托央企身份和自主计算体系,聚焦高安全算力基础设施、数据创新服务和AI应用 [2] - 核心竞争优势在于"懂业务",尤其在能源、交通、政务等关键行业积累深厚 [4][5] 市场需求与痛点 - 企业客户普遍面临AI"如何落地"的困惑,技术理解与场景应用存在脱节 [1][4] - 央国企客户对数据安全高度敏感,信任央企背景的服务商 [4] - 行业需求从标准化云服务转向"云数智一体化"解决方案 [4] 技术路径与行业布局 - AI能力布局集中在平台层,长期规划指向行业应用深水区,聚焦能源、医疗等关键领域 [5] - 采用"小模型大数据"策略,灵活匹配场景需求(如7B/9B参数模型用于简单场景) [10] - 与国产GPU厂商(昇腾、沐曦等)完成适配,推理性能提升2-3倍且不降低精度 [8] 数据治理与安全 - 数据标注需与行业深度绑定,公司参与国家数据标准制定以推动可信数据空间建设 [6] - 构建全流程安全防护体系,覆盖数据、模型和应用安全,满足央国企专项需求 [7] 合作案例与商业化进展 - 与能源央企合作从数据湖建设延伸至AI文书处理项目,依托业务理解优势胜出 [5] - 与侨银股份开发城市公共服务"智慧体",整合物联网、数字孪生等技术 [8] - 已与5家国家实验室、10家央企达成高质量数据集合作意向 [9] 行业趋势判断 - 认为MCP(模型控制面板)将成为工业标准交付媒介,但传统行业普及需时间 [10] - Agent是AI终极形态,但当前落地限于工作流编排的限定场景 [11] - 国内数据标注行业增长受限,主因数字化基础薄弱和应用未爆发 [6]
DeepSeek流量下滑,周鸿祎称梁文锋就没想认真做to C的App
21世纪经济报道· 2025-07-23 17:41
DeepSeek的战略定位与行业影响 - DeepSeek创始人梁文锋专注于AGI和大模型技术研发,未重视to C端App的日活、融资等指标,导致官网流量下滑但第三方云服务商上的大模型使用流量保持高位[1] - 公司免费开源世界一流模型,成为国内众多企业(包括360智能体基座)的基座模型供应商,行业渗透率达"每家公司至少1-2个DeepSeek模型"[1] - 近半年未更新模型,可能筹备重大升级(R2版本),需对比同期Kimi、千问等竞品的性能提升[1] 对中国大模型产业的贡献 - 终结"百模大战"资源内耗,推动行业转向基于开源模型的Agent开发,加速大模型商业化落地[2] - 验证中国开源路线的可行性,形成对美国封闭生态的差异化竞争优势,与千问、Kimi共同构建国产开源生态[2] 行业竞争格局 - 国内形成DeepSeek、千问、Kimi等开源阵营,国际对标美国多公司交替演进模式[2] - 第三方云服务商(火山云、阿里云、腾讯云、英伟达云)成为大模型流量主要承载平台[1] 注:文档3-4为无关内容已跳过
周鸿祎评DeepSeek流量下滑:梁文锋一心扑在AGI上
21世纪经济报道· 2025-07-23 15:05
DeepSeek的业务模式与战略 - DeepSeek创始人梁文锋专注于AGI和大模型技术研发,未在to C的App上投入精力,导致官网流量下滑 [1] - 即便在流量高峰期,公司也未优化网站速度,反映出对to C业务的轻视 [1] - DeepSeek大模型在火山云、阿里云、腾讯云及英伟达云等第三方云服务商上的使用流量保持高位 [1] - 众多国内公司基于DeepSeek的模型进行改造,包括360的智能体基座模型 [1] - DeepSeek将世界一流模型免费开源,对中国大模型产业贡献显著 [1] DeepSeek的行业影响 - DeepSeek的开源模型被广泛应用于Agent开发,几乎所有做Agent的公司都使用其1到2个模型 [1] - 公司通过开源消除了"百模大战",避免行业资源浪费,推动Agent发展 [2] - DeepSeek证明了中国开源开放路线的价值,可能在生态上形成对美国垄断封闭道路的优势 [2] - DeepSeek、千问、Kimi等构成中国开源界团队,只要保持国际一流水平就对中国发展有利 [2] DeepSeek的未来发展 - 周鸿祎认为DeepSeek可能在"憋大招",但对其R2是否会在下半年推出表示不了解 [1] - 近半年DeepSeek未更新模型,而国外引擎及国内Kimi、千问等能力已提升,能否再次发力尚待观察 [1]
梁文锋发愁
投资界· 2025-07-15 15:55
DeepSeek流量表现 - 官网流量从年初7.5%峰值下滑至3% [3] - 移动端月活跃用户从3月1.94亿降至5月1.69亿,流失2500万用户,但仍为国内AI工具用户量第一 [3] - 90天内API和网页服务在线率超99%,解决2月以来的卡顿问题 [9] 公司战略与定位 - 创始人梁文锋聚焦AGI技术,认为当前是"技术创新期而非应用爆发期",目标构建技术生态 [4] - 被视作中国版OpenAI,拥有最强底层模型和最大C端用户量,但面临阿里、腾讯追赶 [4] - 团队约130人,以2002-2003年后出生的年轻技术人才为主 [11] 产品迭代与优化 - 5月28日升级R1至"0528"版本,新增拍照识文字、文件上传功能,优化对话历史展示 [8][9] - 6月新增微信扫码登录功能(需绑定手机号) [8] - 5个月内苹果商店更新25次,版本迭代速度与豆包(20次)、腾讯元宝(25次)相当 [9] - 安装包仅42.4MB,小于豆包(240.1MB)、腾讯元宝(165MB)和Kimi(84.1MB) [10] 行业竞争与商业化 - 同行加速布局Agent应用:豆包6月上线DeepResearch,Kimi推出Kimi-Researcher [10] - 初创公司面临融资压力,"AI六小虎"中阶跃星辰、MiniMax、月之暗面进入B轮阶段 [13] - 行业认为DeepSeek有幻方量化资金支持,商业化压力相对较小 [14] - 信通院指出超级APP需结合深度功能才能构建数据飞轮,Agent可能形成用户壁垒 [14] 生态建设与长期目标 - 参照OpenAI模式,通过"迭代部署"哲学推进AGI研发 [6] - 4月紧急招聘产品设计及全栈工程师,为智能体产品做准备 [5][10] - 对标谷歌安卓生态,需长期投入构建完整技术应用体系 [15][16]
Agent开始“卷”执行力,云厂商的钱包准备好了吗?
第一财经· 2025-06-20 11:32
大模型与Agent技术进展 - Minimax发布通用智能体MiniMax Agent 能够完成长程复杂任务 具备多步规划专家级解决方案能力[1] - OpenAI CEO透露GPT-5将整合o-Series与GPT-Series 构建跨模态跨任务的通用执行层 强调强执行与高算力需求属性[1] - 行业对大模型的期待从性能转向执行能力 Agent将自然语言转化为具体指令 使AI从被动响应升级为主动执行[4][5] - 智源研究院预测2025年更通用自主的智能体将重塑产品形态 多智能体系统加速场景落地[5] - Agent被类比为移动互联网时代的APP 成为产业界重点发力领域[6] 算力需求与基础设施投入 - OpenAI Stargate项目首期占整体计划10% 总投资规模达5000亿美元 旨在提前锁定训练窗口期避免算力荒[1][9] - 北美四大云厂商2025年AI基础设施投入计划:亚马逊超1000亿美元 微软800亿 谷歌750亿[2] - 全球云基础设施服务支出Q1达940亿美元同比增23% 北美四大云厂商资本开支合计765亿美元同比增64%[10] - 阿里宣布未来三年基础设施投入超过去十年总和 腾讯通过GPU部署AI技术已开始创收[10] - 火山引擎预测以GPU为基础的AI云服务将占云市场至少50%份额 通过降价策略加速Agent普及[11] 行业竞争格局演变 - OpenAI合作版图多元化 与甲骨文 CoreWeave AMD Google等建立合作 打破微软独家云服务供应商地位[9] - 大模型行业竞争加剧头部与中腰部云厂商差距 独立分析师认为云服务行业正重塑竞争格局[9] - 国内厂商快速集成先进模型如DeepSeek R1 加速AI部署与商业化落地[10] - 云行业仍处增量市场 厂商通过低价策略争夺客户 但需警惕数据中心建设超需求风险[11] 技术融合与商业化 - Agent与深度思考推理结合大幅提升算力需求 多Agent协作实现复杂任务执行[7] - 多模态技术发展及AI与传统业务融合成为算力需求增长重要驱动力[9] - GPT-5架构变革反映AGI定义演进 强调自主发现新科学及提升工具使用能力[4]
Agent开始“卷”执行力,云厂商的钱包准备好了吗?
第一财经· 2025-06-19 21:55
大模型行业发展趋势 - 大模型行业从一级市场高估值转向底层算力基础设施建设 [1] - Agent技术热度持续,Minimax发布可完成长程复杂任务的通用智能体MiniMax Agent [1] - OpenAI CEO透露GPT-5将整合o-Series与GPT-Series,搭建跨模态、跨任务的"通用执行层" [1] - GPT-5强调强执行与高算力需求,反映AGI定义从认知能力转向自主发现新科学的能力 [4] - 行业认为大模型真正价值始于Agent为人类工作,AI能力从被动响应升级为主动执行 [4] - 智源研究院预测2025年更通用、更自主的智能体将重塑产品形态,多智能体系统广泛落地 [4] 算力需求与基础设施投入 - OpenAI Stargate项目首期占计划的10%,5000亿美元规模基于未来算力增长预测 [1][6] - 北美四大云厂商中,亚马逊计划2025年AI基础设施投入超1000亿美元,微软与谷歌分别计划800亿与750亿美元 [2] - 全球云基础设施服务支出2025年一季度达940亿美元,同比增长23% [7] - 北美四大云厂商资本开支合计765亿美元,同比增长64% [7] - 阿里巴巴未来三年基础设施投入将超过去十年总和,腾讯加码GPU与AI技术部署 [7] - OpenAI与甲骨文、CoreWeave、AMD、Google等合作,缓解算力压力并重塑云服务竞争格局 [6] Agent技术进展与商业化 - Agent将自然语言转化为具体指令并实际操作,提高任务准确率 [5] - 多Agent协作群体智能逐步商用化,可处理复杂、多步骤任务 [5] - 智源研究院院长称Agent相当于移动互联网的APP,产业界可重点发力 [5] - 火山引擎通过降价策略推动AI智能体普及,预计GPU为基础的AI云服务将占云市场一半份额 [8] 行业竞争与市场动态 - 云厂商依靠低价策略争夺客户,火山引擎豆包系列模型价格进一步下探 [8] - 大模型行业竞争或拉大头部与中腰部云厂商差距 [6] - DeepSeek R1以低成本接近GPT-4o性能,头部云厂商加速集成与AI部署 [7]
腾讯推出Agent开发工具,来抢字节阿里的B端客户
搜狐财经· 2025-05-24 09:21
大模型与Agent发展趋势 - 基于不断提升的大模型能力,Agent成为今年大模型领域各家厂商最关注的方向,大厂大模型的B端客户战也随之打响 [1] - 字节推出Agent开发平台Coze,百度和阿里也有千帆平台、百炼平台,专为服务企业用户 [1] - 腾讯推出腾讯云智能体开发平台,整合腾讯云行业领先的RAG技术、全面的Agent能力,帮助企业定制专属智能体 [1] 腾讯大模型战略布局 - 腾讯首次全景亮相大模型战略,从自研混元大模型、AI云基础设施,到智能体开发工具、知识库及场景应用,全面升级大模型矩阵产品 [1] - 腾讯云已推出大模型知识引擎,以RAG技术为核心帮助企业构建大模型应用,积累了一批企业级用户 [1] - 腾讯提出"四个加速"战略:加速大模型创新、加速智能体应用、加速知识库建设、加速基础设施升级 [3] 腾讯组织架构调整 - 通过近期架构调整,腾讯已将旗下与大模型相关的AI产品和应用聚集到同一个事业部(CSIG) [3] - 今年1月AI助手腾讯元宝从TEG转入CSIG,2月QQ浏览器、搜狗输入法等更多AI应用也被转入CSIG [3] - CSIG成为腾讯AI产品落地核心部门,同时面对个人用户与企业客户 [3] 腾讯Agent生态建设 - 腾讯提出基于微信构建Agent生态的想法,QQ浏览器上线名为"Qbot"的Agent,可帮助用户执行文件格式转换等任务 [4] - Qbot会与腾讯内部其他产品合作,成为类Manus的通用Agent [4] - 腾讯云智能体开发平台实现零代码支持多Agent转交协同,降低智能体搭建门槛 [4] 行业应用前景 - 不同场景需要不同Agent,企业业务复杂度高、知识密度强、人力成本高的行业应考虑用Agent重构 [4] - 腾讯将在提高C端用户留存率的同时,争夺B端客户 [4] - 用户可让Agent自主拆解任务和规划路径,主动选择和调用工具 [4]
微软发完谷歌发,AI编程这个月“热爆了”
第一财经· 2025-05-21 17:23
AI编程行业趋势 - Agent(智能体)成为海内外大厂高频提及的关键词,AI编程智能体是重点投入方向,OpenAI、微软、谷歌I/O大会均有相关发布 [1] - 大模型能力整体提升和AI编程市场需求明确,推动编程领域率先找到PMF(产品与市场契合度) [1] - 除大厂外,Cursor、Windsurf、Poolside等创业公司AI编程项目被二级市场密集提及 [1] 主要厂商动态 - 微软GitHub Copilot用户突破1500万,Visual Studio系列产品用户超1500万,Copilot迈入"智能体时代",可独立执行开发任务 [2] - 2024年微软内部20%-30%代码由Copilot生成,2025年发布Copilot Agent功能支持自主修复漏洞、重构代码 [2] - OpenAI发布Codex智能体,用户可分配复杂任务,与GitHub深度整合后能完成更高阶工作 [3] - 谷歌Gemini 2.5 Pro Preview提升编码能力,支持代码语言转换与优化,AI代理Jules可自主读取生成代码并集成至现有代码库 [3][4] - 国内厂商布局:阿里云通义灵码、字节跳动Trae、百度文心快码、快手KwaiPilot、腾讯CodeBuddy [4] 市场规模与并购 - 2024年全球生成式AI编程助手市场规模2590万美元,预计2030年达9790万美元,六年CAGR 24.8%,中国市场CAGR 23.5% [5] - OpenAI拟以30亿美元收购AI编程助手开发商Windsurf,Cursor完成9亿美元融资后估值达90亿美元,2024年ARR为2亿美元 [8] 技术应用与效率提升 - GitHub Copilot缩短企业构建AI应用时间20%-30%,Autodesk使用后工作效率提高近30% [8] - Cursor通过自然语言生成和重构代码,支持Agent自主完成多步骤任务,但依赖外部平台和开源模型 [9] - Stripe数据显示工程师单位时间内代码合并请求量增长30%,AI工具显著减少基础编码时间 [10] 行业核心观点 - AI编程工具已成为开发刚需,但代码质量仍存风格不一致、性能不稳定等问题,复杂工程依赖关系处理能力有限 [9][10] - 需重新定义开发效能标准,聚焦"有效产出"而非"速度表象",工程师的逻辑思维与创造力不可替代 [10][11]
绿洲资本张津剑:如果你认为AI和具身的机会是星辰大海,那就没有泡沫
投中网· 2025-04-20 13:34
AI技术变革与社会影响 - AI不仅是一次技术变革,更是一次深刻的社会变革,将重塑社会结构、产业价值链和人际关系 [2][3] - 变革速度呈现30倍级加速:采集文明(30万年)→农耕文明(1万年)→工业文明(300年)→AI文明(预计10-15年) [5] - 编程行业将发生量级重构:全球六七千万从业者可能缩减至百万量级,体现产业链智能化重塑的深度 [6] 工业文明与AI文明对比 - 工业革命催生现代商业体系:剩余劳动力→商品→渠道→营销→品牌,形成300年来的商业认知框架 [5] - 教育体系变革:1870年全球教育改革以识字率为核心,培养产业工人;AI时代需重新定义教育价值 [5] - 行业增长历史参照:英国纺织业增长26万倍/交通业2万倍/钢铁业800倍,预示AI时代将压缩150年发展周期至5-10年 [5][6] 投资与商业机遇 - 世界500强格局将剧变:2018年后新创企业或占据50-100个席位,窗口期集中在未来10-15年 [6] - 投资视角转换:泡沫论取决于机遇量级认知,星辰大海论认为当前是浪潮而非泡沫 [3][4] - 创业者核心能力转变:从脑力劳动转向心力劳动,强调预见性、勇气和信念的价值 [5][6] 社会个体应对策略 - 人类角色进化路径:体力劳动者(工业革命)→脑力劳动者→心力劳动者(AI时代) [3][6] - 个体需重新定位核心能力:在AI生产力工具普及背景下,"天道酬勤"法则部分失效,需发掘不可替代性 [6] - 企业家生命力成为关键:持续进化能力和坚韧特质是应对快速变革的核心竞争力 [6] 技术发展现状与认知 - 行业认知滞后:2023年7月已提出Agent是AI最大机会而非大模型,但至今仍未触及变革核心 [4] - 教育领域已现冲击:教授面临角色重构,从知识权威转变为资源提供者 [5] - 社会准备度不足:需思考如何用10-15年消化工业革命300年的变革强度 [5][6]