Workflow
提示词工程
icon
搜索文档
Karpathy:我不是要造新词,是「上下文工程」对 Agent 来说太重要了
Founder Park· 2025-07-04 21:10
上下文工程概念 - 决定AI应用效果的关键在于提供完整且恰当的上下文而非单纯优化提示词[3] - 上下文工程是一门精妙的艺术与科学需精准填充信息包括任务描述示例RAG多模态数据工具等[7] - 上下文窗口需平衡信息量与相关性过量或不足均影响性能[7] 与提示词工程的区别 - 提示词仅为用户输入的文本指令如让ChatGPT总结文本[16] - 提示词工程是系统化设计测试优化提示词的方法论类似软件工程[17] - 上下文工程是动态系统设计在正确时间以正确格式提供信息与工具[19] - 三者关系:提示词是输入文本提示词工程优化过程上下文工程构建动态系统[20] 重要性体现 - AI Agent效能核心取决于上下文质量而非代码复杂度[24] - 案例对比:普通Agent仅处理简单请求而优质Agent整合日历历史邮件等上下文实现高效响应[25] 落地策略分类 写入上下文 - 草稿板机制持久化保存任务计划避免token截断[31] - 长期记忆跨会话存储如ChatGPT的生成式记忆[32][35] 筛选上下文 - 从草稿板或记忆中提取相关片段如少样本示例或指令[37][38] - 工具选择采用RAG技术提升3倍准确率[41] - RAG挑战包括代码索引与语义分块需结合知识图谱检索[42] 压缩上下文 - 自动摘要技术处理长交互如Claude Code的95%窗口压缩[43] - 修剪策略包括硬编码规则或训练专用裁剪模型[46] 隔离上下文 - 多Agent架构分配独立上下文窗口专注子任务[48][50] - 沙盒环境隔离消耗性资源如HuggingFace的CodeAgent[53][54] - 运行时状态对象选择性暴露字段实现隔离[55] 行业动态 - Andrej Karpathy强调工业级LLM应用中上下文组件复杂性被低估[10] - LangChain与DeepMind工程师推动上下文工程方法论标准化[3][56]
登上热搜!Prompt不再是AI重点,新热点是Context Engineering
机器之心· 2025-07-03 16:01
上下文工程的核心概念 - 将LLM视为通用的、不确定的文本生成函数而非拟人化实体 强调其无状态特性 需通过输入文本来控制输出[4][5][8] - 上下文工程的核心在于构建有效输入文本系统 而非依赖单句"魔法咒语"式的提示词工程[9][11] - LLM被类比为新型操作系统 需要为其准备完整运行环境而非零散指令[13] 上下文工程的技术要素 - 采用自动化系统构建"信息流水线" 从多源自动抓取整合数据形成完整上下文[15][17] - 工具箱包含四大核心工具:指令下达、知识记忆管理、检索增强生成(RAG)、智能体自主查资料[19][21] - RAG技术通过知识库检索防止模型幻觉 确保回答基于事实[19] - 智能体技术实现动态信息获取 自主判断需求并整合多源数据[21] 工程实践方法论 - 采用科学实验式流程 分"从后往前规划"和"从前往后构建"两阶段实施[23][24][25] - 实施路径:明确输出目标→倒推所需输入→设计自动化生产系统[26] - 模块化开发流程:依次测试数据接口、搜索功能、打包程序 最终进行端到端系统测试[30] - LangChain生态提供实践支持 包括LangGraph和LangSmith等工具[29][31]
论坛| 未可知 x 容诚: AI技术在基金行业的创新应用与效率提升之道
AI技术在基金行业的创新应用与效率提升 核心观点 - AI技术正在重塑基金行业的投研、营销、运营等环节,生成式AI和智能体技术实现从“回答问题”到“完成任务”的跨越式发展 [4] - 中国AI发展面临算力瓶颈,但国产模型如DeepSeek通过开源策略和低成本训练提供高性价比转型方案 [8] - 未来十年是人机协同黄金期,构建“AI员工”团队的机构将在行业竞争中占据先机 [13] 技术演进 - 生成式AI(如DeepSeek、Sora)与传统决策式AI存在本质区别,前者重塑内容生产方式,后者侧重任务执行 [4] - 新一代AI智能体突破“回答问题”局限,实现复杂任务自动化处理 [4] 行业实践 - **信息处理高效化**:秘塔AI等工具可将信息搜集时间缩短80% [6] - **内容生产自动化**:提示词工程快速生成营销文案和PPT,视频生成技术赋能产品营销 [4][6] - **业务流程智能化**:RPA数字员工实现净值核对等重复性工作自动化,某大型基金公司年节省超4000工时 [6] 中国AI发展现状 - 国产模型优势:DeepSeek开源策略降低训练成本,适合金融机构本地化部署解决数据隐私问题 [8] - 挑战:算力瓶颈仍需突破,需平衡技术创新与资源限制 [8] 未来趋势 - 未可知人工智能研究院将推出AI培训课程,培养金融机构AI人才 [13] - AI创造力显著提升,可模仿网红风格文案或鲁迅笔锋文章,技术成熟度已具备商业化应用条件 [10]
提示词工程、RAG之后,LangChain:上下文工程开始火了!
机器之心· 2025-06-25 12:06
上下文工程概述 - 上下文工程是构建动态系统以合适格式提供准确信息和工具,使LLM能合理完成任务[5][9] - 该概念并非全新,近两年已被智能体构建者广泛关注[2] - 传统提示工程侧重设计提示语,但应用复杂度提升后单纯依赖提示已无法满足需求[3] 上下文工程核心特征 - 系统性:需整合开发者、用户、交互记录等多来源数据[10] - 动态性:多数上下文动态生成,提示逻辑需随动调整[11] - 准确性:缺乏正确上下文是智能体表现不佳的主因[12] - 工具适配:需提供查找信息或执行行动的工具[12] - 格式规范:工具输入参数的结构化程度影响沟通效率[13] 重要性分析 - LLM出错主因从模型能力不足转向上下文传递不当[15] - 现代AI系统需完整结构化上下文而非巧妙措辞[17] - 正成为AI工程师最关键的发展技能[7] 与提示工程差异 - 提示工程是上下文工程的子集[17] - 前者处理静态模板,后者处理动态数据集[17] - 核心指令设计仍是两者的共同重点[18] 实施要素 - 工具使用:外部信息需格式化为LLM易理解形式[20] - 记忆系统:需建立短期对话摘要和长期用户偏好记忆[20] - 检索机制:动态获取信息并插入提示[20] - 格式优化:数据传递方式直接影响模型响应质量[19]
PromptPilot发布: AI“嘴替”帮你优化每个指令
财富在线· 2025-06-16 18:42
产品发布 - 火山引擎在2025 FORCE原动力大会上正式发布面向大模型的智能解决方案平台PromptPilot [1] - PromptPilot通过深度解析用户意图并自动构建最优指令路径,将模糊想法转化为AI可执行的精准指令 [1] 行业痛点 - AI大模型时代面临"提问之困",高质量Prompt撰写过程耗时耗力且对使用者经验要求极高 [2] - 不同模型对相同问题的理解存在差异,高价值问题往往没有标准答案 [2] 核心功能 - 提供覆盖Prompt生成、调试、优化与迭代全生命周期的自动化一站式解决方案 [3] - 通过互动式引导将模糊需求转化为清晰目标,简化"好答案"的定义过程 [3] - 构建闭环优化体系,将Bad Case转化为数据资产实现持续进化 [3] - 模拟人类思考能力实现全自动多轮迭代优化,支持联网AI搜索和自定义知识库 [4] 技术创新 - 突破性支持多轮对话优化,提供GSB比对模式实现跨模型表现横向对比 [5] - 支持图片/视频等多模态场景的Prompt优化,可自动拆解复杂任务为多步方案 [5] - 优化Function Call场景的工具调用指令和描述,提升工具选择准确率 [5] - 通过SDK接口实现线上Case自动监测,形成"监测-纠错-进化"闭环 [6] 市场定位 - 将复杂的提示词工程转化为标准化流程,降低AI大模型使用门槛 [6] - 助力企业和开发者聚焦业务创新,推动AI应用开发进入普及化阶段 [6][7]
多智能体在「燃烧」Token!Anthropic公开发现的一切
机器之心· 2025-06-14 12:12
多智能体系统概述 - 多智能体系统特别适合解决开放式研究问题,这类问题需要动态调整方法和路径[6] - 研究本质是信息压缩,子智能体通过并行处理不同方面信息辅助主智能体完成压缩过程[7] - 多智能体系统在"广度优先"查询任务中表现突出,比单智能体系统性能提升90.2%[8] 系统架构设计 - 采用"协调者-执行者"模式,主导智能体协调多个并行子智能体[14] - 用户查询先由主导智能体分析并生成子智能体,从不同角度并行探索[18] - 与传统RAG方法不同,采用动态搜索流程根据中间结果调整方向[20] - 主导智能体LeadResearcher负责持久化研究计划和综合分析子智能体反馈[21][22][23] 性能优化关键 - token消耗量单独解释80%性能差异,工具调用次数和模型选择是另两个关键因素[15] - 并行调用工具使研究时间缩短90%,从几小时降至几分钟[41] - 提示词工程是优化行为主要手段,需建立准确心理模型[27] - Claude 4系列在提示词工程表现出色,能自我诊断失败原因并提出改进[32] 评估方法 - 采用"LLM担任评审官"方法,通过0.0-1.0评分评估输出质量[49][51] - 评估维度包括事实准确性、引用准确性、完整性等五个方面[58] - 早期开发阶段小样本评估即可发现显著影响[46] - 人工评估能发现自动化评估遗漏的边缘案例问题[54] 工程挑战 - 智能体有状态特性使错误会累积,需构建从错误状态恢复的系统[56] - 部署采用彩虹部署策略,逐步转移流量避免干扰运行中智能体[59] - 同步执行造成瓶颈,异步执行可提高并行性但增加协调复杂度[59] - 原型与生产环境差距较大,需要大量工程投入实现稳定运行[61]
高管培训 | 民营企业家AI实战营①:如何用AI提效办公?
生成式AI与提示词工程 - 生成式AI核心在于生成新内容如AI绘画和生成对话 决策式AI则关注满意决策如人脸识别和风险管理 [3] - 生成式AI发展脉络从早期萌芽到快速进步 技术进步推动应用发展 [3] - 提示词工程通过设计和调整输入改善模型性能 控制生成结果 [4] - 经典提示词框架包括CO-STAR TCREI CRISPE 通过案例展示优化生成内容 [4] - 符号划重点 提供模板和案例帮助AI理解需求 生成精准结果 [4] AI提示词技巧与工作应用 - 提示词技巧提升AI生成内容质量 优化工作应用效果 [5] AI办公工具协同提升组织效能 - AI工具优化办公流程 提高效率 提升整体效能 [9] - 应用场景包括会议纪要整理 PPT生成 Excel数据处理 [9] 实践与互动激发创新思维 - 实践环节如DeepSeek生成宣传文案 撰写种草文案 体验AI功能 [11] - 实际操作激发创新思维 帮助理解应用AI技术 [11] 助力民营企业数字化转型 - 工作坊提供学习交流机会 把握AI时代发展机遇 [14] - 未来继续举办活动 助力企业在数字经济时代发展 [14]
DeepSeek与ChatGPT:免费与付费背后的选择逻辑
搜狐财经· 2025-06-04 14:29
作为一个在互联网行业摸爬滚打了20年的老兵,我最近被一个现象深深触动了。 2025年开年,DeepSeek这个国产开源大模型突然火了,朋友圈里到处都在讨论它的免费优势。但奇怪的是,我身 边很多同事依然坚持付费使用ChatGPT。这让我开始思考一个问题:既然有免费的好东西,为什么大家还要花 钱? 经过深入体验和分析,我发现了一个被很多人忽视的真相——AI工具的输出质量,70%取决于你怎么跟它对话。 换句话说,DeepSeek并不是真的"不如"ChatGPT,而是它需要你掌握更高级的沟通技巧。 先说说技术层面的差异。我在测试过程中发现,DeepSeek和ChatGPT走的完全是两条路。 但有意思的是,在一些具体场景下,DeepSeek的表现反而超出了我的预期: 比如我让它分析罗马帝国灭亡的原因,DeepSeek不仅给出了更详细的时间线,连后果分析都更全面。在创意写作 测试中,它生成的科幻故事结尾"智慧的最大成就不是统治,而是理解",这种深度思考能力确实让我惊艳。 这里要说到关键问题了。很多人觉得DeepSeek不好用,其实是因为他们还没掌握"提示词工程"这门手艺。 根据我看到的研究报告,AI输出质量的70%都取决 ...
第一批追赶AI的人,正在被AI甩开
投中网· 2025-05-30 11:32
核心观点 - AI行业快速发展导致提示词工程师职业门槛降低,传统仅优化提示词的岗位竞争力下降 [4][5][20] - 大模型能力提升使提示词优化技术重要性降低,从业者需转型为具备产品思维或跨领域能力的复合型人才 [22][23][24] - AI行业仍存在大量人才缺口,但要求从业者持续学习并深入理解业务逻辑 [29][30] 行业趋势 - 2023年提示词工程师年薪可达25-33万美元,但2024年模型升级导致该岗位技术含金量下降 [4][22] - 模型评测分数从60分提升至85分需复杂提示词优化,而当前模型基础性能已达90分,边际效益递减 [23] - 多模态趋势下文本模型参数量占比仅几B,对提示词工程师的跨模态理解能力要求提高 [29] 职业转型 - 提示词工程师工作内容从纯文本优化扩展至数据清洗、RAG技术应用、微调协助等,技术占比降至10% [9][18][24] - 头部企业将提示词工程师岗位归入产品序列,70%工作内容涉及产品设计,仅20%为数据标注 [30] - 从业者背景多元化,计算机、金融、心理学、文科专业均可入行,核心能力转向逻辑表达与业务理解 [13][16][30] 技术演进 - OpenAI o1 Preview模型内置思维链功能,替代人工编写的复杂提示词流程 [24] - Agent技术成为2024年关键方向,工作流串联需求使提示词设计更精细化 [29] - 端侧模型需求上升,提示词工程师需适配移动端2秒响应等具体业务指标 [25] 人才市场 - AI初创公司面临算力/资金/人力短缺,员工入职4个月即可能担任团队负责人 [10] - 行业窗口期缩短,创业者需1个月内验证项目可行性,企业间价格战加剧 [26] - 基层岗位大量空缺,企业主动通过社交平台招募实习生,跨专业转行者机会显著 [7][30]
第一批追赶AI的人,正在被AI甩开
虎嗅· 2025-05-29 08:14
近两年,随着AI的火热发展,"提示词(prompt)"这个词也被普通人熟知。 在AI短视频博主那里,这是AI时代的普通人必须要掌握的一项技能,"谁不会用提示词,谁就会被AI淘汰!"在焦虑的打工人那里,提示词是用AI来帮忙 完成工作的手段,需要整天琢磨对AI说什么才能得到更好的效果。这种焦虑也催生了众多"提示词工程"的知识付费课程,在AI还没真正落地之前,就先让 一帮嗅觉敏锐的人大赚一笔。 提示词也曾是许多没有AI和相关技术背景的人,想追赶AI风口的一条捷径。作为一种新职业,"提示词工程师"曾被许多人追捧,门槛低、上手快、薪资 高,成为转行AI的首选。"2023年的时候阿猫阿狗都能进来,挺好混的,挺水的。"从业者杨佩骏说。那时在国外有的提示词工程师甚至能拿到25-33万美 元年薪。 但现在,随着大模型能力的快速提升,提示词工程师越来越没有存在感,杨佩骏发现,辛辛苦苦优化了很长时间的提示词,模型一升级,就相当于白干 了。模型理解自然语言、推理与思考能力越来越强,传统意义上只会写提示词的提示词工程师已经失去竞争力,AI、模型公司们也不愿意招了。 "现在大家稍微有一点职业追求,都不愿意承认自己是PE(prompt e ...