上下文工程 - 财报，业绩电话会，研报，新闻 - Reportify

上下文工程

搜索文档

AI智能体时代中的记忆：形式、功能与动态综述

新浪财经· 2025-12-17 12:42

记忆已成为并将继续成为基于基础模型的智能体的核心能力。它支撑着长程推理、持续适应以及与复杂环境的有效交互。随着智能体记忆研究的快速扩张并吸引空前关注，该领域也日益呈现碎片化。当前统称为"智能体记忆"的研究工作，在动机、实现、假设和评估方案上往往存在巨大差异，而定义松散的记忆术语的激增进一步模糊了概念上的清晰度。诸如长/短期记忆之类的传统分类法已被证明不足以捕捉当代智能体记忆系统的多样性和动态性。在这些智能体的核心能力中，记忆尤为关键，它明确地促成了从静态大语言模型（其参数无法快速更新）到自适应智能体的转变，使其能够通过环境交互持续适应（Zhang et al., 2025r; Wu et al., 2025g）。从应用角度看，许多领域都要求智能体具备主动的记忆管理能力，而非短暂、易忘的行为：个性化聊天机器人（Chhikara et al., 2025; Li et al., 2025b）、推荐系统（Liu et al., 2025b）、社会模拟（Park et al., 2023; Yang et al., 2025）以及金融调查（Zhang et al., 2024）都依赖于智能体处理、存储和管 ...

智能体记忆

通用人工智能（AGI）

大语言模型（LLM）

检索增强生成（RAG）

上下文工程

智能体记忆

通用人工智能（AGI）

大语言模型（LLM）

检索增强生成（RAG）

上下文工程

Google全链路赋能出海：3人团队调度千个智能体，可成独角兽｜MEET2026

量子位· 2025-12-17 11:38

编辑部整理自凹非寺量子位 | 公众号 QbitAI 未来应该是智能体之间自主协同，解决复杂问题、自动化工作流程、自主下达任务，创建一种全新的商业模式。 MEET2026智能未来大会是由量子位主办的行业峰会，近30位产业代表与会讨论。线下参会观众近1500人，线上直播观众350万+，获得了主流媒体的广泛关注与报道。核心观点初创企业在全球化过程中面临不同侧重点与挑战，Google的全链路生态在每一阶段都可以为初创企业助力，赋能高效出海。 Gemini 3是一次真正的突破，在多个权威榜单中排名第一，标志着从"辅助工具"向"自主智能体"的跨越。谷歌主导推出了A2A协议（Agent-to-Agent Protocol，智能体间通信协议），旨在打通跨企业、跨系统的智能体协同。商业模式正在从SaaS按月订阅转向Outcome-based按结果付费，这是智能体时代的底层逻辑变化。 3到10人的初创团队完全可能通过调度大量智能体成长为独角兽，但需要重视数据壁垒、行业深度集成以及法律合规。初创出海的五个阶段与Google全链路解决方案在演讲开篇， Dennis系统梳理了初创企业出海的五个阶段，以及谷歌在每个阶 ...

上下文工程

按结果付费

Internet Services

上下文工程

按结果付费

Internet Services

硅谷人工智能研究院院长皮埃罗·斯加鲁菲：2025年AI智能体将重塑数字劳动力

金融界· 2025-12-10 16:41

行业峰会与产品发布 - 中关村科金联合甲子光年主办“超级连接·智见未来”EVOLVE 2025大模型与智能体产业创新峰会，并首次公开企业级智能体落地路线图 [1] - 中关村科金发布“3+2+2”智能体产品矩阵，包括大模型平台、AI能力平台、AI数据平台三大基础平台，智能客户平台、智能工作应用平台两大通用场景应用平台，以及金融和工业两大行业智能体平台 [1] - 中关村科金联合华为云、阿里云、百度智能云、火山引擎、亚马逊云科技、超聚变、软通动力等企业共同发布“超级连接”全球生态伙伴计划，旨在打造开放、连接、可持续的“人工智能+”产业生态圈 [1] 2025年生成式AI技术趋势 - 2025年生成式AI呈现技术融合趋势，包括扩散模型与Transformer结合的扩散Transformer、降低应用门槛的小型语言模型、成为标配的多模态能力，以及思维链、专家混合、蒸馏等新技术 [3] - DeepSeek被视为工程成就典范，因其首次将上述多种技术整合到单一模型中 [3] - 行业研究正致力于开发理解三维真实世界的“世界模型”，以超越语言模型的一维预测和图像模型的二维预测，让机器人能自然地与世界互动，相关探索者包括李飞飞创立的World Labs和Meta的Yann LeCun [3] AI智能体的演进与特征 - AI智能体正从“副驾驶”模式（如传统ChatGPT，协助人类完成任务）进化为“自动驾驶”模式，能够自主完成包含多步骤的完整工作流而无需人类干预 [4] - 智能体可执行从市场调研、产品设计、采购、生产规格说明、营销材料生成、销售培训到客户支持的全流程自动化 [4] - 智能体的核心运作机制是“感知-决策-行动-学习”的循环，使其能够突破传统脚本限制并应对环境变化 [4] 多智能体系统与评估 - 随着应用演变为多智能体系统，新的技术栈正在形成，涵盖硬件层、云服务层、语言模型层、编排层（如LangChain）以及最终的智能体应用层 [5] - “上下文工程”概念变得关键，它要求智能体深刻理解组织的完整信息、结构和真实目标，而不仅仅是执行单一任务，从而实现动态组建和解散的群体智能 [5] - 评估智能体的关键指标包括：准确性、效率、稳定性、用户体验、适应性，以及通过强化学习实现的自我提升能力和长期保持上下文的自我监控能力 [5] 智能体的行业应用与价值 - 在客户支持领域，真正的智能客服需能理解问题与上下文、识别客户情绪，并了解组织架构以精准找到答案，而非像传统聊天机器人那样答非所问 [6] - 江森自控为10万名员工打造了集成所有手册和技术笔记的AI系统，相当于最优秀工程师的集合体，大幅提升了维护和故障排查效率，并用于培训新员工 [6] - Strategy公司使用AI设计的金融产品Stretch，创造了今年美国股票发行中最大的IPO [6] - 生成式AI的核心价值在于“生成”原本不存在的东西，例如在旅游业，AI可通过分析用户社交媒体照片了解偏好，提供比传统旅行社更精准的个性化行程 [6] - AlphaFold获得诺贝尔奖证明，AI能够完成人类科学家无法做到的事情，从而加速各类科学研究 [6] AI信任与社会协作愿景 - “Waymo效应”指随着谷歌自动驾驶汽车在旧金山日益普及，公众对AI的信任正在快速提升，这为AI智能体的广泛应用奠定了社会基础 [7] - 对AI未来的愿景并非一个全知“神”般的AI，而是由多个智能体组成的动态协作群体，它们像人类社会一样交换信息、相互协作以达成目标，人类也将作为协作链条的一部分参与其中 [7]

上下文工程

Artificial Intelligence

企业级智能体

上下文工程

Artificial Intelligence

企业级智能体

当创业遇见苍洱：开发者如何抓住AI浪潮的黄金机会？

新浪财经· 2025-12-09 21:43

12 月 4-6 日，由中国计算机学会主办，CCF TF、工业级 5G 创新应用（大理）研究院、麦思博（msup）承办的 2025 CCF 程序员大会在云南大理国际会议中心盛大召开。本次大会依托大理独有的数字产业特色 IP，精心打造两大主论坛及 24 个特色分论坛，涵盖 AI 前沿技术实践、工具应用、人才培养、全球协作、数字游民生态、创业及出海等热门方向，使得技术交流与大理的自然人文气息深度交融。来自各地的技术大咖及程序员代表们线下齐聚大理，开启了一场专属技术人的精彩年度盛会。共探 AI 创业新浪潮在丰富多元的议程中，"AI 创业新浪潮"论坛格外引人关注。近年来，大理依托苍山洱海的独特生活方式、开放多元的城市气质，以及不断完善的数字产业基础，吸引了越来越多创业者、技术自由职业者与数字游民在此落脚、实验与生长。这样的创新氛围，也让本次讨论更贴近当下创业者的真实需求。论坛上，来自 CSDN、久痕科技、麟玺创投、杭州指令集等企业与投资机构的嘉宾齐聚一堂，围绕创业方向、行业格局和技术趋势进行了高密度分享，为开发者和创业者带来了一份兼具前瞻性与实践性的系统化思考。开发者迎来 AI 创业黄金时代 CSD ...

创业(US:VEMLY)

上下文工程

Software Development

上下文工程

Software Development

AI写70%，剩下30%难得要命？Google工程师直言：代码审查已成“最大瓶颈”

猿大侠· 2025-12-04 12:35

AI编码工具对软件开发行业的影响 - AI编码工具（如GitHub Copilot、Gemini、Claude）显著提升了代码生成速度，使开发者生产力变强[1] - 但AI生成代码导致拉取请求（PR）数量暴增，修复一个Bug可能引入更多新Bug，工程细节处理成为最耗时的环节[1] AI生成代码的质量与审查瓶颈 - AI在用户界面、业务流程和样板代码生成上高效，但常产生系统边界不清、未处理边界条件、强耦合替代弱耦合、忽略安全与配置等问题的代码[4] - 这些问题在代码审查阶段暴露，资深工程师需花费更长时间拆解AI生成的逻辑，使代码审查成为新的开发瓶颈点[2][5] - 初级开发者借助AI快速产出看似可用的演示，但资深工程师视其为隐藏技术债务的定时炸弹[4] - 行业调查显示AI编码工具使用率上涨，但开发者对其信任度在下降[6][7] AI编码的“70/30”现象与维护挑战 - AI可快速生成约70%的代码（如界面、流程、基础逻辑），但剩下30%涉及业务边界、异常处理、稳定性、系统适配、长期维护性与性能优化等难题仍需人工解决[8] - 修改AI生成的代码易陷入“向前一步，向后两步”的恶性循环，修复一个Bug会触发更多新Bug[9] - 若无妥善的回滚机制、状态检查及开发者亲自修改的准备，代码库可能演变为无法维护的黑箱[9] 开发者能力与信任度的潜在风险 - 过度依赖AI可能导致开发者批判性思维被侵蚀，失去深入理解代码和从错误中学习的能力[10] - 开发者对AI生成代码的好感度从两年前的70%下降至60%，30%的开发者表示几乎不信任AI代码[11] - 建议通过设立“无AI编码日”来保持工程师的解题与系统思考能力，并建立“决策记录文件”以形成可溯源的知识资产[12] 提升AI编码质量的关键：上下文工程与测试 - “上下文工程”是突破AI生成代码质量限制的核心，即向AI提供更多有用信息（如系统提示、文档、项目结构、配置、示例代码）[13] - 测试是AI编码的安全网和反馈信号，但人类必须能理解并仔细审查AI生成的测试用例[13] - 应避免“写了就祈祷”的模式，充分利用AI工具自动加载文档和代码目录的能力来丰富上下文[13] AI对生产效率的真实影响 - 尽管有宣传称AI能将生产力提升5倍或10倍，但内部调查与数据显示，AI对编码效率的提升远不到2倍[13] - 声称获得极高效率提升的情况通常发生在全新的、无技术债务和历史包袱的低复杂度项目中[14] - 在现实世界中，AI可能帮助完成额外20%的工作量，但同时导致代码审查量爆炸式增长[16] - 代码审查严重依赖数量和时间有限的资深工程师，其审查模式尚未适应AI暴增的代码量，造成审查压力呈指数级上升[16] AI作为学习与协作伙伴的积极潜力 - AI的最佳用途之一并非直接写代码，而是作为“学习伙伴”帮助开发者快速补齐思维节点，理解遗漏的系统部分[17] - AI有助于开发者理解老系统并形成完整的“心智模型”[18] - 行业正在研究“主动式AI代码建议”（如预测开发者下一步意图），但此类工具达到日常可用成熟度仍需数年时间[17]

Artificial Intelligence

上下文工程

Software Development

Artificial Intelligence

上下文工程

Software Development

AI写70%，剩下30%难得要命？Google工程师直言：代码审查已成“最大瓶颈”

猿大侠· 2025-11-26 12:24

AI编码工具对开发效率的影响 - AI编码工具如GitHub Copilot、Gemini、Claude显著提升代码编写速度，但导致PR数量暴增和工程细节耗时增加[1] - AI主要提升UI、业务流程和样板代码等部分的效率，占整体代码量的70%[4][8] - 实际效率提升远低于宣传的5-10倍，内部数据显示提升不到2倍[13] - 在全新无历史包袱项目中效率提升更明显，可达5-6倍[14] 代码质量与技术债问题 - AI生成代码存在系统边界不清、未处理边界条件、强耦合替代弱耦合等质量问题[4] - 安全、鉴权、API Key、环境配置等关键部分经常空缺，运维集成考虑不足[4] - 代码逻辑缺乏一致性和可维护性，形成"技术债定时炸弹"[4][5] - 修改AI代码易陷入"修一个Bug触发新Bug"的恶性循环，称为"向前一步，向后两步"模式[9] 代码审查瓶颈与团队压力 - 代码审查成为新的开发瓶颈点，资深工程师审查压力呈指数级上升[2][16] - 初级工程师编写速度加快与AI代码量暴增导致PR队列延长[16] - 资深工程师数量有限且审查模式尚未适应AI生成的代码量[16] - 公司需要建立可回滚机制和变量检查等应对措施[9] 开发者能力与信任度变化 - 过度依赖AI可能导致开发者失去理解代码和犯错学习的能力[10] - 开发者对AI编码工具的好感度从70%下降至60%[11] - 30%的开发者表示对AI生成代码"几乎不信任"[11] - 建议设立"AI Free Sprint Day"和"决策记录文件"来保持开发者能力[12] 提升AI代码质量的关键因素 - 上下文工程是突破AI 70%限制的核心，需要提供系统提示、文档、项目规范等信息[13] - 测试作为AI编码的"安全网"，人类必须理解AI生成的测试代码[13] - AI工具正在研究"主动式代码建议"功能，但需数年才能成熟[17] - AI更适合作为学习伙伴帮助开发者补齐思维节点和形成系统心智模型[17][18]

上下文工程

上下文工程

查资料、劝老板、写周报，给上班人准备的大模型评测

晚点LatePost· 2025-11-25 23:01

大模型用户增长与市场趋势 - 截至2025年11月，中国每天使用大模型助手应用的用户数量已超过1亿人，与2024年4月相比，用户数增长超过900%[3] - 用户使用大模型的心态发生变化，从让大模型执行任务转向更多地进行咨询询问，OpenAI报告显示“询问”类互动占比从40%增长到50%，而“执行”类任务从40%下降到30%[96] - 工作场景中42%的任务与写作相关，其中约三分之二不是从头生成内容，而是让大模型修改文本[96] 参与测评的大模型概况 - 测评涵盖14款国内外大模型，包括GPT-5.1、Claude Opus 4.5、Gemini 3 Pro、文心5.0、Kimi K2 Thinking等最新版本[3] - 测评通过官方网页版助理进行，测试时间在11月中下旬，累计交互超千次，采用中文提问，每个问题单开对话框[4][5] - 测评聚焦日常工作相关场景，设定15个问题，不涉及编程工作、agent和深度研究[3] 角色扮演与头脑风暴能力 - 在组建8人决策委员会任务中，ChatGPT盲评得分最高（22.4分），阶跃星辰StepFun排名第二（22.2分），商汤商量排名第三（21.3分）[8][13] - MiniMax Agent得分最低（13.2分），仅调整提示词而未有效组织委员会[11][13] - 在劝说老板调整商业计划任务中，阿里千问得分最高（4.6分），其话术将修改方案融入执行策略并引用名人名言[18][22] - 阶跃星辰话术得分最低（2.2分），因直接指出“三大致命矛盾”而被认为不合理[20][22] 长文本处理能力 - 在处理36页会议手册提取参会人员名单任务中，无一大模型完美解决，Gemini 3.0 Pro和腾讯元宝表现相对较好但仍有错误[25] - 智谱清言出现幻觉，添加未参会人员如创始人唐杰；通义千问表现最差，仅提取4个参会者且3个单位错误[25][26] - 在总结长文章任务中，ChatGPT、Gemini和Kimi总结质量最高，作者盲评得分均为4分；MiniMax Agent表现最差，仅生成920字总结且有事实错误[31][32][33] 周报生成与识别能力 - 在周报生成任务中，ChatGPT周报最长（1902字），DeepSeek周报最短（488字）[37][43] - 多数大模型会虚构工作细节，如客户名称和潜在收入，仅阿里千问未脑补细节[37] - 在周报识别任务中，Claude最严格，识别出11份AI生成周报并给予低分（平均4.3分）；豆包和文心一言最宽松，仅识别出1份AI周报[41][42] - Claude生成的周报获得最高工作努力程度评分（8.2分），阿里千问因未脑补细节得分最低（4.6分）[42][43] 规划与统筹能力 - 在聚餐做菜规划任务中，Claude、豆包、千问、智谱清言、Kimi、MiniMax均能提供合理方案，智谱清言甚至考虑洗锅时间[44][46] - GPT-5驱动的ChatGPT表现不如去年的GPT-4，建议当场腌腊肉；DeepSeek、文心一言、阶跃星辰、讯飞星火提供的方案导致牛腩炖不熟[46][50] 联网搜索能力 - 在搜索大疆技术文章任务中，GPT-5、Kimi、GPT-5.1驱动的ChatGPT、文心一言、MiniMax均能找到相关官方文章[54][69] - 在搜索英伟达1999年招股书任务中，5款大模型（ChatGPT、Claude、Gemini、豆包、Kimi）能直接提供招股书链接[60][69] - 在以图找图任务中，10款大模型正确识别数据来自中国互联网络信息中心；Gemini 2.5 Pro最初杜撰答案，升级3.0 Pro后改正[65][67][69] 多模态识别能力 - 在识别未标注数据图表任务中，仅Gemini能给出接近实际数据的答案，其他模型仅提供估算[70][71] - 在分析甲状腺体检报告任务中，大多数模型建议“细针穿刺活检”，与三甲医院医生建议一致；DeepSeek建议定期观察，科大讯星星火还建议基因检测[75][79] - 在工位整理视觉识别任务中，DeepSeek和Kimi提示仅能使用OCR识别文字；能工作的模型仅识别部分物体，GPT-5.1驱动的ChatGPT提供ASCII示意图[86][89]

上下文工程

Artificial Intelligence

上下文工程

Artificial Intelligence

Elastic(ESTC) - 2026 Q2 - Earnings Call Transcript

2025-11-21 07:00

财务数据和关键指标变化 - 第二季度总收入为4.23亿美元，同比增长16%（按报告计算）和15%（按固定汇率计算）[21] - 销售主导的订阅收入为3.49亿美元，同比增长18%（按报告计算）和17%（按固定汇率计算）[21] - 当前剩余履约义务（CRPO）约为9.71亿美元，同比增长17%（按报告计算）和15%（按固定汇率计算）[22] - 剩余履约义务（RPO）同比增长19%（按报告计算）和17%（按固定汇率计算）[23] - 非GAAP运营利润率为16.5% [5][24] - 调整后自由现金流约为2600万美元，利润率为6% [25] - 第二季度通过股票回购向股东返还约1.14亿美元现金，平均每股价格为84.45美元 [25] - 第三季度总收入指引为4.37亿至4.39亿美元，中点增长15%（按报告计算）和13%（按固定汇率计算）[27] - 第三季度销售主导订阅收入指引为3.64亿至3.66亿美元，中点增长17%（按报告计算）和16%（按固定汇率计算）[27] - 第三季度非GAAP运营利润率预计约为17.5% [27] - 第三季度非GAAP稀释每股收益指引为0.63至0.65美元 [27] - 2026财年总收入指引上调至17.15亿至17.21亿美元，中点增长约16%（按报告计算）和15%（按固定汇率计算）[28] - 2026财年销售主导订阅收入指引为14.17亿至14.23亿美元，中点增长18%（按报告计算）和17%（按固定汇率计算）[28] - 2026财年非GAAP运营利润率预计约为16.25% [28] - 2026财年非GAAP稀释每股收益指引为2.40至2.46美元 [28] 各条业务线数据和关键指标变化 - 在所有解决方案领域均实现稳健增长，AI对业务所有领域产生积极影响 [5] - 搜索和AI领域保持强劲势头，同时安全和可观测性领域的平台整合出现上升趋势 [6] - 生成式AI需求强劲，越来越多客户采用Elastic开发语义搜索和智能体应用 [10] - 超过2450名Elastic Cloud客户将Elastic用于生成式AI用例，其中超过370名属于年消费10万美元以上的客户群 [12] - 安全领域取得显著成功，签署了两笔价值超过2000万美元总合同价值的交易 [49] - 可观测性领域也取得成功，例如一家领先的美国市政技术机构签署了七位数的扩展交易 [14] - 本季度推出了包括Agent Builder和Streams在内的新AI功能 [13][15] - 引入了托管推理服务以及新的向量数据库功能，如DiskBBQ算法 [16] - 完成了对Jina AI的收购，以增强多语言和多模态嵌入能力 [16] 各个市场数据和关键指标变化 - 交易动能遍布全球，涉及企业级和公共部门领域 [23] - 尽管10月份美国政府停摆，团队仍与CISA达成了重要合作 [23] - 年合同价值超过10万美元的客户数量增长了约13%，在过去四个季度净增约180名客户 [23] - 年合同价值超过10万美元的客户群中，有23%将Elastic用于生成式AI用例，高于一年前的17% [24] - 美国公共部门业务表现强劲，需求旺盛 [77] 公司战略和发展方向和行业竞争 - 公司的战略是提供一个强大而灵活的平台，将AI和向量搜索能力整合其中 [17] - 专注于通过创新和战略收购成为AI时代领先的数据检索和上下文工程平台 [18] - 销售团队在五个季度中持续保持严格的销售执行力，专注于高价值机会 [7] - 公司继续投资于上市能力和AI工程差异化 [42] - 在IDC的多个MarketScape报告中被认可为领导者，包括全球可观测性平台报告和全球通用知识发现报告 [18] - 安全被视为一个数据问题，公司的搜索AI平台非常适合解决此问题 [9][54] - 可观测性和安全被视为同一枚硬币的两面，公司拥有最好的数据平台来处理各种遥测数据 [57][58] - 公司通过不断引入提高平台效率的功能（如Searchable Snapshots、LogsDB）来应对数据量的增长 [39][60] 管理层对经营环境和未来前景的评论 - 市场机会比以往任何时候都更强大，由稳健增长、清晰的生成式AI领导地位和独特的平台驱动 [19] - 企业对生成式AI采用和平台整合的持续关注推动了对公司平台的需求动能 [21] - 公司对平衡增长与审慎支出保持承诺，这转化为强劲的运营杠杆和良好的底线结果 [24] - 公司对2026财年剩余时间的执行和实现中期销售主导订阅收入目标增长率充满信心 [29] - 数据量正在以惊人的速度增长，公司通过提高平台效率来帮助客户管理数据 [60] - 承诺（而不仅仅是消费）是收入增长的关键驱动因素，本季度的承诺表现非常强劲 [32][63] 其他重要信息 - 公司开始提供销售主导订阅收入的指引，认为这是衡量公司与大型战略客户和高端商业客户成功的关键指标 [26][36] - 公司预计在2026财年使用5亿美元股票回购授权金额的50%以上 [25] - 净扩张率（NRR）为112%，保持稳定，并由稳定的毛保留率支撑 [70] - 第三季度（2026财年）的静默期从2026年1月16日营业结束后开始 [3] - 公司将于12月10日参加巴克莱全球技术会议，并于1月14日参加Needham增长会议 [4] 问答环节所有提问和回答问题: 关于非AI原生客户的消费趋势 [30] - 公司观察到不仅仅是AI原生客户，传统业务（包括搜索、可观测性和安全）的消费也非常强劲 [30] - 本季度获得了大量大型承诺，客户将安全和可观测性工作负载整合到公司平台上，这些交易都是云交易，预计将推动未来的云收入和总收入 [31] - 销售主导订阅收入增长18%，消费和承诺表现强劲，对今年剩余时间充满信心 [31] 问题: 关于账单收入增长滞后于其他指标 [32] - 公司认为承诺和消费是关键，这两方面在第二季度都很强劲 [32] - CRPO增长17%，RPO增长19%，反映了多年承诺的实力 [32][33] - 本季度存在季节性因素，去年同期的账单和收入分布不典型，且美国政府停摆导致一些自托管续订从第二季度推迟到第三季度 [33][34] - 今年迄今的ACV增长强于去年同期，且销售渠道也在强劲增长，这使公司有信心提高下半年指引 [34] 问题: 关于销售主导订阅收入指引的构成和云增长假设 [35] - 公司首次提供销售主导订阅收入指引，因为这是公司的关键指标，驱动销售团队获取云和自托管的承诺 [36] - 月度云自助服务业务（主要面向SMB客户）预计将保持平稳 [36] - 对承诺和消费流向的预期已体现在指引中，公司对第二季度表现和全年指引的上调感到满意 [36] 问题: 关于第二季度销售主导订阅收入增长（18%）与第一季度（22%）的差异，以及生成式AI的收入贡献 [38] - 公司强调不应孤立看待定价，消费业务受多种因素影响（新工作负载、数据增加、平台效率功能等），净消费一直非常强劲 [39] - 不应过度关注单个季度的表现，因为本季度的季节性因素与上季度不同，且政府停摆导致的续订推迟影响了自托管收入的形态 [39][40] 问题: 关于一年前销售团队重组后的生产力现状以及是否计划增加销售容量 [41] - 六个季度前进行的改革已见成效，连续五个季度销售执行力强劲，承诺表现非常好 [41] - 本财年是投资年，公司将继续投资于上市销售能力和AI工程差异化 [42] 问题: 关于RAG（检索增强生成）机会的持久性以及AI搜索能力在RAG之外的货币化机会 [43] - 公司认为RAG和Agent Builder等是互补的，核心是将私有数据与LLM连接起来，公司专注于简化这一过程的复杂性 [43] - Agent Builder和收购Jina AI是货币化上下文工程核心优势的另一种方式，但这将是叠加的，而非替代 [44] 问题: 关于本季度业绩超出指引的幅度低于历史水平，以及是否有新的指引哲学或受推迟影响 [45] - 公司在第一季度末和一个月前的财务分析师日已经提供了更接近实际的指引，第二季度业绩比指引高出550万美元，并且两次大幅提高了全年指引 [46][47] - 本季度的推迟是预期内的波动，公司不过度关注单季度表现，推迟的续订将在本财年内完成 [47] 问题: 关于与CISA的大型安全合作胜利，是否是市场份额的夺取 [48] - 本季度两笔最大的交易（均超过2000万美元）都是安全领域的胜利，凸显了公司安全产品的成熟度和AI能力的优势 [49] - CISA选择Elastic是对公司平台实力、灵活性和AI能力的极大认可，这属于从现有厂商向公司平台的整合，是市场份额的夺取 [49] 问题: 关于生成式AI在客户（尤其是大客户）中的渗透率，以及未来的增长空间 [50] - 公布的23%渗透率仅针对Elastic Cloud客户，因为遥测数据清晰；自托管客户中有更多生成式AI用户未计入该统计 [51] - 在年消费10万美元以上的客户群中达到23%的渗透率已经很好，随着更多公司部署AI应用，渗透率和单客户收入都有望增长 [51] - 在AI用户群组中，观察到其增长速度高于其他群组 [52] 问题: 关于安全业务的竞争格局，对手是否是 observability 厂商或下一代安全平台厂商 [53] - 公司认为自己是领先的下一代安全SIEM平台，通常是在取代现有厂商 [53][54] - 优势在于后端数据平台的灵活性、可扩展性以及AI功能（如攻击发现） [55] - 在可观测性领域，公司以日志分析切入，然后扩展到指标和追踪 [55] - 本季度超过1000万美元的五笔交易中，两笔是安全，两笔是可观测性，一笔是AI，显示出各业务领域的成功 [56] 问题: 关于近期大型平台厂商收购（Chronosphere, ONUM）的看法 [57] - 公司认为这验证了可观测性和安全是同一枚硬币的两面 [57] - 公司的优势在于拥有最好的数据平台来引入和分析各种遥测数据，并且在此领域已有八年积累，AI功能和统一平台能力领先 [58][59] 问题: 关于产品优化（如LogsDB）对云收入轨迹的影响，以及客户是否已度过优化阶段 [60] - 数据量正在飞速增长，公司不断推出提高效率的功能是为了让客户能继续使用平台并吸引其他厂商的工作负载 [60][61] - 消费增长的关键驱动因素是承诺，本季度承诺表现非常出色，这给了公司信心并反映在指引上调中 [62][63] - 两笔最大的超过2000万美元的交易都是云交易 [63] 问题: 关于ACV增长是否强于报告的订阅收入增长 [64] - 是的，因为云收入会滞后于承诺，销售主导订阅收入增长通常会滞后于总ACV增长 [64] - ACV同比增长一直在加速 [64] 问题: 关于云和自托管在消费用例上的分布是否相同 [65] - 每个季度的分布会有变化，公司激励销售团队根据客户需求达成交易，无论是云还是自托管 [65] - 两种业务模式的混合轨迹没有发生有意义的变化，预计两者都将增长以达到中期目标 [65] 问题: 关于月度订阅收入的季节性以及本季度的下降 [66] - 月度订阅收入主要来自中小型企业的自助服务客户，公司预计这条业务线将保持平稳 [66] - 收入指引的重点是销售主导的订阅收入，因此将其单独列出并作为本季度开始的指引点 [66] 问题: 关于大型嵌入式生成式AI用例的演变、使用模式粘性/量级以及NRR趋势 [67] - AI用例本质上比文本搜索更消耗计算资源，AI用户群组的增长速度高于其他群组 [68] - 在各行各业都看到生产用例，而不仅仅是试点项目，公司功能的广度（不仅是向量搜索）创造了粘性 [69][70] - 净扩张率（NRR）为112%，保持稳定，背后是各群组的稳定扩张趋势 [70] 问题: 关于30笔超过100万美元的交易中，续约与新客户的比例，以及交易在不同季度间的变动 [71] - 交易在不同季度间自然会有一些推迟或提前，本季度情况正常 [71] - 在5笔超过1000万美元的交易中，2笔是安全，2笔是可观测性，1笔是AI；其中一笔最大的交易是新客户 [72] - 既有现有客户的扩展（交叉销售），也有全新客户，例如全球最大的化学品制造商之一就是全新客户 [72] 问题: 关于销售主导收入指引的细分（云 vs 自托管），以及第二季度在两者上的表现相对于内部目标如何 [73] - 公司内部不为销售团队设定云与自托管的分拆目标，他们只有一个配额，无论通过哪种方式完成 [74] - 公司以统一的方式思考这个指标，不区分云和自托管，也不关注迁移 [74] - 第三季度的销售主导指引基于承诺动能（包括大额交易）和消费动能 [75] 问题: 关于联邦业务（除CISA外）的表现以及政府停摆的影响是否会在第三季度恢复 [76] - 美国公共部门业务整体表现优秀，需求非常强劲 [77] - CISA交易在停摆前的9月份完成 [77] - 推迟的续订客户仍在继续使用产品，这些续订预计将在第三季度完成，业务没有风险 [78]

Elastic(US:ESTC)

上下文工程

上下文工程

Which Attention is All You Need？

机器之心· 2025-11-09 09:30

注意力机制优化背景 - 当前大语言模型发展面临数据和算力扩展瓶颈使得算法创新变得尤为重要[7] - Transformer架构的前馈神经网络模块已被混合专家模型成功优化业界创新压力与投入因此集中于注意力机制[5][7] - 专家观点认为注意力机制有望成为继混合专家模型之后AI架构的下一个重大突破方向[7] 注意力机制面临的挑战 - 标准自注意力机制的计算复杂度随序列长度呈O(N^2)增长成为高效长序列建模的根本障碍[9] - 二次方复杂度导致长序列预填充阶段计算量巨大解码阶段的关键值缓存占用大量内存带宽构成推理瓶颈[9] 主流优化路径：线性注意力 - 线性注意力目标是通过重新参数化或近似softmax注意力为线性操作将计算复杂度从O(N^2)降至O(N)[8][10] - 其设计思路主要分为三类：基于核函数的方法带遗忘机制的方法以及作为上下文学习器的方法[10] - 月之暗面团队提出的Kimi线性注意力采用门控Delta注意力核心通过通道感知门控机制让每个通道学习独立遗忘速率[11] - Kimi线性注意力采用分层混合架构每三层线性层后插入一个标准全注意力层比例为3:1[12] - 测试显示Kimi线性注意力最多可减少75%的大型关键值缓存需求在处理100万token上下文时速度是全注意力的6倍[13] 主流优化路径：稀疏注意力 - 稀疏注意力不试图近似整个注意力矩阵而是将计算限制在完整键空间的一个子集上仅计算被选中的token交互[8][14] - 主要方法包括固定模式块稀疏和基于聚类的稀疏注意力[14] - DeepSeek团队从块粒度的原生稀疏注意力演进到token粒度的DeepSeek稀疏注意力[15][17] - DeepSeek稀疏注意力通过轻量级Lightning Indexer进行O(N)扫描为每个token计算重要性代理分数并对得分最高的k个token执行全注意力计算[17] - 在H800 GPU集群测试中该方案在128k长上下文条件下将主模型注意力复杂度从O(L^2)降为O(Lk) 单位token计算成本最高下降60%-70%[17] 其他优化方案 - 除线性和稀疏路径外也存在混合扩展方案[8] - MiniMax团队出于工程理性考量在M2工作中选择重新拥抱全局注意力尝试通过工程优化使O(N^2)复杂度在特定场景下能被高效利用[8]

Attention改良

上下文工程

Artificial Intelligence

Attention机制

Attention改良

上下文工程

Artificial Intelligence

Attention机制

一篇论文，读懂上下文工程的前世今生

36氪· 2025-11-07 15:11

上下文工程的定义与本质 - 上下文工程被定义为设计和优化上下文的收集、管理、使用，以提升机器理解和任务表现的努力 [4] - 其本质是通过建立更丰富有效的上下文，弥合人类高熵表达与机器低熵理解之间的认知鸿沟，达成系统性的熵减过程 [3] - 该学科并非全新概念，在AI技术出现前已发展超过20年，目前处于上下文工程2.0时代 [5] 上下文工程的发展阶段 - **1.0时代 (1990年代-2020年)**：核心是翻译，通过图形界面和编程语言将人类自然语言意图工程化为机器可理解的交互流程 [7] - **2.0时代 (2020年至今)**：随着GPT-3发布，用户可直接用自然语言对话，但熵减需求转移至用户身上，催生了提示词工程 [11][13] - 2.0时代典型系统包括ChatGPT、LangChain、AutoGPT，核心机制为提示工程、RAG、CoT、记忆代理，上下文容忍度和类人程度相对更高 [12] AI与人沟通的理解差距根源 - AI感官残缺，仅能获得用户明确输入，无法像人类一样接收文字外的大量环境信息 [14] - AI理解能力有限，难以处理和整合复杂逻辑及图像中的关系信息 [14] - AI存在记忆缺失，Transformer架构有长上下文性能瓶颈，缺乏长期记忆系统，难以捕捉长距离依赖关系 [14] - AI注意力涣散，面对海量信息时存在“上下文选择困难”，不知该关注何处 [14][15] 上下文工程的核心构件 - **构件一：上下文收集与记忆系统**：通过多模态融合和分布式收集修复感官残缺，通过分层内存架构解决记忆缺失 [16][18][21] - **构件二：上下文管理**：通过上下文抽象实现“自我烘焙”，将高熵上下文预处理为AI能理解的低熵结构，方法包括自然语言摘要、模式化提取、在线蒸馏 [23][24] - **构件三：上下文使用**：构建高效上下文选择机制，通过理解逻辑依赖、平衡新近度与频率、主动需求推断来解决注意力涣散问题 [25][26] 上下文工程的未来演进 - **3.0时代**：机器智能达到人类水平，能处理情绪等复杂上下文，主动理解场景并与人类协作，但长期记忆问题仍未完全解决 [30] - **4.0时代**：机器智能达到“超人智能”，人机交流的熵被彻底消除，上下文工程本身将消失或融入核心架构 [30][31] - 当前的技术如工具使用能力正从外挂演变为标准协议并融入模型核心，遵循脚手架最终融入基础架构的普遍技术发展模式 [32][33][34]

上下文工程

提示词工程

上下文工程

提示词工程