Workflow
AI Agent
icon
搜索文档
告别天价账单:端云协同与记忆革命,让 Agent 告别「烧钱时代」丨 GAIR Live 029
雷峰网· 2026-05-03 11:33
文章核心观点 - 当前AI Agent行业正经历从“算力竞赛”向“工程突围”的叙事转变,其大规模普及面临安全、成本与智能的“不可能三角”挑战,核心障碍是“Token焦虑”[2][3] - Token焦虑的根源在于当前低效的生产模式:为维持对话连贯性需反复加载数万字上下文,导致不可预测的高昂账单,并引发数据隐私风险[2][21] - 解决Token焦虑的关键在于系统工程的全面优化,而非等待大模型单价下降,破局点在于通过“空间分流”(端云协同)与“时间管理”(记忆工程)重构AI Agent的成本价值秩序[4][17] - 未来的发展方向是“智能体力资源管理”时代,需要根据任务难度、隐私等级和成本敏感度,在分布式节点中合理分配智能资源,使Agent成为成本可控、随处可得的基础设施[17][50] 从“聊天框”到“任务操作系统”的范式跃迁 - 行业正处于从“对话模型”向“任务执行系统”跨越的关键期,OpenClaw等产品的爆红标志着“智能体操作系统”雏形的出现,但面临高昂成本账单[6][22] - 目前的Agent处于“蒸汽机时代”,虽能拉动生产力,但因频繁加载背景信息产生巨大资源浪费,例如一句简单的“你好”可能因重复加载背景信息而消耗五六万Token[6][22] - 要让Agent具备真正的“生产力”,必须从单一任务执行向跨领域协作跃迁,前提是解决安全、成本与复杂度三座大山[6] 空间破局:端云协同与隐私物理分级 - EdgeClaw提出“端云协同”架构,从空间维度切断无效Token损耗,将端侧定义为处理隐私与日常任务的“个人秘书”,云侧定义为处理高难度复杂逻辑的“行业专家”[8][23] - 通过三级隐私分级路由(公共级S1、脱敏级S2、本地级S3),Agent自主决定数据流向,在端侧预处理、脱敏和精简,大幅减少发往云端的“废料Token”[8] - 从财务角度看,一台高性能端侧显卡的采购成本仅相当于高频调用三四个月云端顶级API的费用,本地硬件正从“变动费用”变为“固定资产”,任务迁移至本地后边际成本趋近于零[8][9] - 在图文内容创作等场景下,EdgeClaw可将综合成本降低约80%[24] 时间管理:从“提示词工程”到“记忆工程” - MemTensor倡导“记忆工程”,将行业视野从暴力堆砌上下文转向精细化的记忆分层管理,核心观点是“在Agent的账单里,回忆比记住更烧钱”[11][12][32] - 记忆工程对记忆进行三层管理:明文记忆(快速写入,读取成本高)、参数化记忆(通过训练内化知识,读取快但写入代价大)、激活记忆(优化计算中间态,提升响应速度)[12][26][27] - 通过“Agentic抽取”模式,系统主动识别信息完备性,例如对“老地方”进行溯源补全,能将原本需要召回的10K上下文压缩至6K的精准片段,实现成本极限下探[12][35] - MemOS系统在云服务端的月调用量已突破3500万次[27] 价值重构:记忆作为未来的“数字资产中心” - 记忆管理不仅是降本手段,更是未来AI商业模式的基石,可催生“记忆市场”,参数化、结构化的记忆包本身是具有商业价值的数字资产[14] - 本地模型拥有私有数据和持续交互,会自发进行“蒸馏”和“对齐”,实现“越用越聪明、越用越便宜”的成长性,这是云端通用模型无法提供的核心护城河[15] - 记忆产业的演进分为三阶段:能力收费的Memory as a Service阶段、作为“长期状态中枢”的基础设施层阶段、以及“生态与价值变现”阶段[47] - 记忆所有权属于用户,平台计划打造“Memory Store”,允许用户将高价值记忆包(如资深律师的思辨逻辑)上架,实现数字分身商业化[48] 技术实践与成本优化 - EdgeClaw采用“分段判别”策略平衡路由判断的复杂性与成本,将判断逻辑锚定在Agent与Sub-agent的交互节点,在“小红书内容创作”场景下能将原本10美元以上的任务成本压缩至2美元左右[31] - MemOS通过训练面向记忆领域的“专有微型模型”来执行记忆管理任务,以极低成本的计算替代高价值Token的上下文筛选工作,实现“大小模型分治”[41] - 优化收益与任务复杂度正相关:低频短会话收益不显著;长程复杂任务中,精准调度能将10K上下文压缩至6K核心片段,带来指数级Token节约[42] - 端云协同与记忆管理是互补关系,架构重构(算力协同)与系统优化(状态协同)共同构成未来智能体7×24小时无缝存在的底座[42][43][44] 未来展望与商业模式演变 - 到2027年,本地模型可能实现“永远在线”的端侧模式,Agent能主动利用闲置算力进行深度调研和优化,这不仅依赖模型蒸馏技术,更需工作流和记忆机制的底层重构[46] - Token焦虑的破局点在于“使用模式的突破”和“结果密度”,需要杀手级应用教育市场,让用户明确Agent的性价比边界,并将Token压力从用户侧转嫁给厂商[48][49] - 未来的产品形态可能演变为用户发布指令,多个Agent竞标给出结果,用户只为认可的结果付费,这将促使厂商提升效能比[49] - 解决Token焦虑的“智能体力资源管理”逻辑具有跨领域(如自动驾驶、游戏NPC、金融风控)通用性,旨在根据任务属性在分布式节点中合理分配智能资源[50]
在大厂,token用少了不“健康”
AI前线· 2026-05-03 10:00
公司AI资源投入与员工管理 - 科技公司普遍为员工提供AI算力补贴,例如阿里巴巴为全体员工发放专属token额度,腾讯为员工配置年度价值约22万元的AI token套餐,字节跳动则宣布工作场景AI工具不限额度,员工业余时间AI产品体验费用公司报销50% [2] - 公司开始将AI工具使用情况与员工绩效评估深度绑定,例如微软要求各级主管评估绩效时必须考量AI工具使用情况,Meta和OpenAI内部设有员工token使用排行榜,Shopify将AI使用情况纳入绩效考核并作为团队申请增员的先决条件 [3] - 有公司正依据token使用量作为员工转正、晋升及裁员的依据之一,AI使用能力不足可能面临被优化的风险 [2][3] AI技术应用趋势与业务模式变革 - AI应用正从简单的工具使用转向“万物皆可蒸馏”的Skill化模式,例如有开源项目能将历史或公众人物的思维方式、决策逻辑蒸馏成可复用的AI技能模块,目前已支持乔布斯、马斯克等17位知名人物 [3] - 有公司开始进行“Skill化”用人模式的落地尝试,例如国内一家游戏传媒公司将离职员工训练成AI数字人,继续承担咨询、邀约、制作PPT等简单工作 [5] - 企业提效的核心增量正从传统的AI内容生成工具转向AI编程和Agent,前者对产业效率提升极高,后者对业务流效率提升显著 [12] - 公司管理层基于AI能力重构业务流的趋势明显,从“为马车修路”转向“为汽车修路”,这种基于AI能力特征的重构被视作更本质的提效 [10] AI提效的实际效果与成本分析 - 在研发场景,AI提效效果显著,例如值得买公司一个正常项目的交付周期能比以前缩短一半 [10] - AI编程效率提升非常明显,有员工一个月token消耗约1000美元,但“一个人能干两个人的活” [11] - AI的token消耗成本被频繁拿来与员工薪资对比,例如Claude Code产品负责人称,某些功能开发进度从6个月缩短到1个月甚至一天,背后的token成本仍远低于工程师的平均薪资 [6] - 飞猪公司为员工报销工作场景产生的AI相关服务采购费用,额度最高1000元/月,并观察到从idea到落地的周期缩短,以及跨工种、跨角色并行推进带来的协同损耗下降 [11] AI实施中的挑战与管理误区 - 在AI提效过程中,出现员工被迫花大量时间给AI纠错、因提效标准拔高而加班更多等现象,有人反馈“有了AI,我反而更忙了” [13] - 并非所有岗位都能快速受益于AI,例如运营、审核等业务岗初期效率提升快但想更进一步较难,核心原因在于原有业务流程是为人的特点设计,对AI并不友好 [13] - 企业对AI存在两种极端认知误区:一是把AI当“许愿池”,认为它什么都能干;二是苛刻地认为它什么都干不了,目前前者显现得更多 [14] - 价值判断错位是另一典型误区,例如仅因场景标准化程度高就想让AI承接,而未充分评估幻觉风险的影响 [15] 实现AI良性循环的关键与未来展望 - 实现AI提效良性循环的关键在于“协同进化”,即通过调度和控制一堆AI Agent协同工作来提升生产效率,从而将人的精力投入到高附加值的“突破与创新”中 [18] - 当前AI提效再上一个台阶的最大瓶颈被认为是算力,token成本会成为现实的硬约束,规模化全自动化意味着如流水一般的token消耗 [16] - 健康的AI提效状态可通过token消耗、交付周期、质量稳定性及关键业务指标综合衡量,若token持续投入的同时交付更快、质量更稳、业务指标有改善,则说明AI已进入核心业务流程 [17] - 理想的AI提效状态是人与AI明确分工,有些事情完全由人完成,有些事情完全由AI完成,各自在完整的业务单元中发挥长处 [18] - AI带来的深层影响是构建新产品和新业务增长通道,企业需考虑如何将自身业务能力优化给AI使用,以及如何整合分散在不同渠道的企业内部上下文信息,为AI提供支撑 [19]
中国赛博药神变了
虎嗅APP· 2026-04-30 08:36
公司2025年业绩与市场反应 - 公司2025年总营收约8亿元,同比增长超200%,净利润首次转正,达到2.58亿元,账上现金超过70亿元 [4] - 尽管业绩亮眼,但二级市场反应冷静,部分原因是公司收入高度依赖单一客户,仅美国制药公司DoveTree的合作大单就贡献了总营收的45% [5][7] - 公司实现盈利与其谨慎选择不贸然进入成本高昂、周期漫长的自主药物临床试验阶段有关,选择和时机是关键 [13] 公司发展历程与商业模式转型 - 公司成立于2015年,由麻省理工学院三位物理学博士后创立,技术路线独特,融合AI、量子物理与机器人自动化,旨在解决药物研发的底层物质结构问题 [7] - 公司在IPO前累计融资超过50亿元,为全球同类企业首位,背后有腾讯、红杉、谷歌等投资方支持,上市后市值曾达400多亿港元,并通过新发可转债融资25.4亿元人民币 [8] - 公司商业模式已从轻资产的算法平台,转向“软硬件兼修”的AI基础设施供应商,重点发展自动化实验室等硬件设施以形成数据闭环 [13][15] 自动化实验室作为核心战略与数据优势 - 自动化实验室及相关硬件业务是公司的真实底盘,该业务在2024年同比增长87.8%,2025年同比增长62.6%,营收达2.65亿元,扣除大客户订单后已成为实际核心支柱 [11][14] - 公司认为高质量、可复现的研发数据是AI在生物医药领域规模化落地的关键瓶颈,自动化实验室作为“数据挖矿机”,能大规模产生高精度数据,支撑算法平台能力 [15][16] - 硬件投入导致公司合同履约成本同比增幅近70%,高通量实验耗材成本达1.49亿元,这使其利润率低于纯算法公司,但被视为构建长期竞争力的必要投入 [15] 行业趋势与竞争格局 - AI制药已成为行业热捧目标,2025年中国新药BD总金额1300多亿美元中约36%来自AI制药相关交易,2026年Q1已出现多项首付款上亿美元的合作签约 [11] - 行业呈现基础设施竞赛趋势,制药巨头如礼来与英伟达达成10亿美元生物超算项目,罗氏计划引入2176块Blackwell GPU,拥有GPU总数超3500块 [12] - 尚无一款AI发现的药物真正上市,导致投资者对技术信服度两极分化,投资界整体转向看重产业落地能力 [4] 公司未来战略与资金使用计划 - 公司手握超70亿元现金,计划用于持续研发投入、自动化实验室建设、围绕高附加值物质的生态布局以及巩固技术领先地位的并购 [17][20] - 并购策略包括收购具有成熟商业利润的实体以扩大营收和获取海外客户,以及收购AI、AI Agent及具身智能相关的早期团队以维持算法领先地位,范围将扩大至欧洲、加拿大等地 [21] - 新任CFO周斐然的到任,被视为公司在出海、并购方面将有大动作的信号 [21] 业务多元化拓展与生态系统构建 - 公司定位为“物质搜索界的谷歌”,目标是从药物发现拓展至能源、大健康消费品等新材料领域,创始人认为新材料发现的市场规模会超过制药 [22] - 在热门分子胶领域,公司已预测约1000个潜在靶点;其多肽、siRNA研发平台也在持续商业化 [22] - 通过投资或合作(如莱芒生物、希格生科等),公司构建生态系统,以更低的前期合作溢价换取更高的里程碑付款和销售分成,弥补了不做自研管线的利润想象空间,并持续沉淀数据 [23] 在新材料领域的挑战与应对 - 新材料领域存在专利保护不足、行业数据稀缺、竞争激烈等问题,AI加持下创新产品高溢价窗口期缩短 [24] - 为应对挑战,公司引入强绑定的联合开发模式,例如与光伏龙头晶科能源合作打造AI高通量叠层太阳能电池实验线,共担风险,共享数据与收益,实验线预计达1000片/天通量,实现效率百倍级提升 [25] - 全球AI材料市场竞争激烈,预计到2030年市场规模突破1200亿元,年复合增长率27.3%,有60多家AI for science公司及谷歌、巴斯夫等巨头参与角逐 [26]
数码视讯(300079):业绩逐步改善,AI+超高清战略持续深化
中邮证券· 2026-04-29 13:33
报告投资评级 - 首次覆盖给予“买入”评级 [8][9] 核心观点 - 公司业绩逐步改善,AI+超高清战略持续深化,利润增速远超营收,盈利能力大幅增强 [4][5] - AIGC与AI Agent实现业务实质性落地,公司自主研发的AI技术已深度融入广电等实际业务 [6] - 公司是超高清视频与国产化替代的领跑者,核心主业壁垒深厚,深度参与自主标准体系并拥有全场景解决方案,紧跟国家战略享受政策红利 [7] 公司基本情况与业绩表现 - 公司最新收盘价为5.45元,总市值78亿元,流通市值70亿元,市盈率为233.91,资产负债率为9.3% [3] - 2025年全年实现营收7.33亿元,同比增长9.61%;实现归母净利润0.33亿元,同比增长35.97%;扣非后归母净利润为0.14亿元,同比减少19.78% [4] - 2026年第一季度实现营收1.22亿元,同比减少7.32%;实现归母净利润1028.97万元,同比增长32.62%;扣非后归母净利润为369.05万元,同比减少41.82% [4] - 2025年第四季度实现营收2.68亿元,同比减少9.33%,环比增加33.56%;实现归母净利润855万元,同比大幅增加310.35%,环比增加8.00%;毛利率为44.64% [5] - 公司推出了每10股派发现金红利0.2元(含税)的利润分配预案 [5] 分业务表现 - 2025年,视频技术产品及服务实现营收3.14亿元,同比增长11.25%,毛利率为52.64%,同比减少5.49个百分点 [5] - 2025年,信息服务终端实现营收1.92亿元,同比增长35.46%,毛利率为6.41%,同比增加5.88个百分点 [5] 行业前景与公司战略 - 根据国家政策,到2027年新一代智能终端、智能体等应用普及率目标超70%,到2030年目标超90%,智能经济将成为重要增长极 [6] - 国家广播电视总局将2025年确定为“超高清发展年”,行业实现全链条升级 [7] - 公司在超高清领域深度参与并推动了AVS3、HDR Vivid、Audio Vivid等自主标准体系的完善、认证与规模化商用 [7] - 公司支持了包括北京卫视、广东卫视、深圳卫视等多家4K超高清频道的建设和开播 [7] 盈利预测 - 预计公司2026-2028年分别实现营收8.32亿元、9.83亿元、11.43亿元,同比增速分别为13.45%、18.20%、16.30% [9][11] - 预计2026-2028年实现归母净利润0.44亿元、0.56亿元、0.65亿元,同比增速分别为34.01%、26.60%、14.94% [9][11] - 预计2026-2028年EPS分别为0.03元、0.04元、0.05元 [9][11] - 以2026年4月24日收盘价5.50元计算,对应2026-2028年PE分别为176.41倍、139.34倍、121.23倍 [9][11] 关键财务指标预测 - 预计2026-2028年毛利率分别为45.9%、47.0%、47.2%,净利率分别为5.3%、5.7%、5.7% [14] - 预计2026-2028年ROE分别为1.1%、1.4%、1.6% [14] - 预计2026-2028年资产负债率分别为10.2%、11.7%、13.2% [14]
600亿买一个即将过时的IDE,马斯克疯了吗?
交易核心信息 - SpaceX宣布已与AI编程平台Cursor达成协议,有权在2024年晚些时候以**600亿美元**收购该公司,或为双方合作项目支付**100亿美元** [6] - **600亿美元**的潜在收购金额足以买下百度这样规模的公司 [7] Cursor的业务与市场地位 - Cursor是**有史以来增速最快的初创公司之一**,在开发者群体中积累了极强的用户基础 [11] - 公司**年化营收已突破5亿美元**,付费用户黏性极高 [11] - 公司掌握着**海量的开发者行为数据、企业客户渠道和付费用户关系**,这些资产在Agent时代依然有价值 [12] - Cursor每天处理**数以亿计的代码生成请求**,积累了关于开发者如何思考、调试、优化代码的宝贵数据 [26] 行业趋势与Cursor的战略价值 - AI编程战场风向已变,开发者的工作流从打开IDE敲键盘,变成了向AI描述需求等结果,**Agent正在取代IDE作为开发者入口** [8] - Anthropic和OpenAI的编程工具都在向更自主的云端Agent进化,Cursor自身也在向**Agent调度中枢**转型 [9] - 在技术范式从IDE向Agent转移的**渐进替代过程**中,最值钱的资产往往是能够承接旧用户、同时有机会向新范式迁移的产品,Cursor正是这样的**强有力的过渡入口** [14][15][10] - AI编程工具的竞争本质上是**谁更懂开发者**,Cursor积累的开发者行为数据是训练下一代Agent模型的**宝贵燃料**,即使未来IDE形态消失,这些数据仍可帮助训练更懂开发者的AI Agent [25][27][28] - 对马斯克而言,收购Cursor是**进入AI编程核心战场的门票**,而非仅仅一个代码编辑器 [29] 马斯克及xAI的战略动机 - 2026年3月,马斯克罕见承认**xAI在编程方面落后了**,面对Anthropic的Claude Code和OpenAI的Codex毫无招架之力 [18][20] - 收购Cursor对xAI而言是**最快达成目标的救命稻草**,而非锦上添花,可让其**在2-3年的范式切换窗口期内**,从落后者转变为有产品、有用户、有数据的玩家 [21][22][23] - 与其花数年重建团队和训练数据,不如直接买下市场上**最成熟的产品** [22] 资本运作与平台叙事构建 - SpaceX正在准备估值可能冲到**1.75万亿美元**的IPO [31] - 在上市前夕宣布与Cursor的交易是一次**精准的市值管理**,旨在构建更完整的资本故事以支撑天价估值 [31] - 该交易将SpaceX的叙事从“航天+AI”升级为“**航天+AI基础设施+开发者平台**”的超级技术平台叙事,对资本市场更具吸引力 [31] - 交易结构显示,**Cursor将获得xAI的Colossus超算资源**用于训练更强的AI编程工具 [32] - 这形成了体系内资源重组与价值循环:**Cursor越成功,对xAI算力需求越大,xAI算力资产估值越高;xAI估值越高,SpaceX合并后整体估值越高;SpaceX估值越高,IPO募资能力越强,反哺整个马斯克系** [32] - 马斯克过往的资本动作(如440亿美元收购Twitter并入xAI)呈现相似路径:通过收购与重组,将分散资产**拼成更大的平台叙事**,让内部资源循环并彼此抬轿子 [32] 交易结构设计隐含的考量 - 协议设计为**收购权而非必须收购**,提供了**600亿美元收购**或**100亿美元战略合作**的二选一结构 [37] - 这种结构像是一张**看涨期权**,赋予了根据未来判断进行选择的灵活性,但也暗示了**对Cursor是否值600亿美元存在不确定感** [37][38] - 风险在于,当行业向Agent原生范式跃迁时,**Cursor的IDE基因反而可能成为包袱** [36]
速递|Anthropic内部小型实验:让Agent代替自己完成真实交易,共成交186笔
Z Potentials· 2026-04-27 12:55
Anthropic AI Agent 市场实验核心发现 - 公司创建了一个由AI Agent分别代表买家和卖家的分类广告市场,使用真实商品和真实资金进行交易,该测试名为“Project Deal”,是一项针对自选参与者群体的试点实验[1] - 实验共有69名公司员工参与,每位参与者获得了100美元预算(通过礼品卡支付),用于从同事处购买物品[1] - 实验共达成了186笔交易,总价值超过4,000美元,公司对“Project Deal的运作效果之好感到震惊”[2] AI模型性能与市场表现 - 公司运行了四个由不同模型驱动的独立市场,其中一个为“真实”市场(所有参与者由最先进模型代表且交易实际履行),另外三个用于研究[2] - 当用户由更先进的模型代表时,他们会获得“客观上更好的结果”[2] - 用户似乎并未察觉到由不同模型代表所带来的结果差异,这引发了关于“Agent质量差距”的可能性,即“处于劣势的一方可能意识不到自己的处境更糟”[2] AI Agent指令影响 - 最初给AI Agent的指令似乎并未影响促销的可能性或协商后的价格[3]