提示词工程

搜索文档
提示词工程、RAG之后,LangChain:上下文工程开始火了!
机器之心· 2025-06-25 12:06
上下文工程概述 - 上下文工程是构建动态系统以合适格式提供准确信息和工具,使LLM能合理完成任务[5][9] - 该概念并非全新,近两年已被智能体构建者广泛关注[2] - 传统提示工程侧重设计提示语,但应用复杂度提升后单纯依赖提示已无法满足需求[3] 上下文工程核心特征 - 系统性:需整合开发者、用户、交互记录等多来源数据[10] - 动态性:多数上下文动态生成,提示逻辑需随动调整[11] - 准确性:缺乏正确上下文是智能体表现不佳的主因[12] - 工具适配:需提供查找信息或执行行动的工具[12] - 格式规范:工具输入参数的结构化程度影响沟通效率[13] 重要性分析 - LLM出错主因从模型能力不足转向上下文传递不当[15] - 现代AI系统需完整结构化上下文而非巧妙措辞[17] - 正成为AI工程师最关键的发展技能[7] 与提示工程差异 - 提示工程是上下文工程的子集[17] - 前者处理静态模板,后者处理动态数据集[17] - 核心指令设计仍是两者的共同重点[18] 实施要素 - 工具使用:外部信息需格式化为LLM易理解形式[20] - 记忆系统:需建立短期对话摘要和长期用户偏好记忆[20] - 检索机制:动态获取信息并插入提示[20] - 格式优化:数据传递方式直接影响模型响应质量[19]
PromptPilot发布: AI“嘴替”帮你优化每个指令
财富在线· 2025-06-16 18:42
产品发布 - 火山引擎在2025 FORCE原动力大会上正式发布面向大模型的智能解决方案平台PromptPilot [1] - PromptPilot通过深度解析用户意图并自动构建最优指令路径,将模糊想法转化为AI可执行的精准指令 [1] 行业痛点 - AI大模型时代面临"提问之困",高质量Prompt撰写过程耗时耗力且对使用者经验要求极高 [2] - 不同模型对相同问题的理解存在差异,高价值问题往往没有标准答案 [2] 核心功能 - 提供覆盖Prompt生成、调试、优化与迭代全生命周期的自动化一站式解决方案 [3] - 通过互动式引导将模糊需求转化为清晰目标,简化"好答案"的定义过程 [3] - 构建闭环优化体系,将Bad Case转化为数据资产实现持续进化 [3] - 模拟人类思考能力实现全自动多轮迭代优化,支持联网AI搜索和自定义知识库 [4] 技术创新 - 突破性支持多轮对话优化,提供GSB比对模式实现跨模型表现横向对比 [5] - 支持图片/视频等多模态场景的Prompt优化,可自动拆解复杂任务为多步方案 [5] - 优化Function Call场景的工具调用指令和描述,提升工具选择准确率 [5] - 通过SDK接口实现线上Case自动监测,形成"监测-纠错-进化"闭环 [6] 市场定位 - 将复杂的提示词工程转化为标准化流程,降低AI大模型使用门槛 [6] - 助力企业和开发者聚焦业务创新,推动AI应用开发进入普及化阶段 [6][7]
多智能体在「燃烧」Token!Anthropic公开发现的一切
机器之心· 2025-06-14 12:12
多智能体系统概述 - 多智能体系统特别适合解决开放式研究问题,这类问题需要动态调整方法和路径[6] - 研究本质是信息压缩,子智能体通过并行处理不同方面信息辅助主智能体完成压缩过程[7] - 多智能体系统在"广度优先"查询任务中表现突出,比单智能体系统性能提升90.2%[8] 系统架构设计 - 采用"协调者-执行者"模式,主导智能体协调多个并行子智能体[14] - 用户查询先由主导智能体分析并生成子智能体,从不同角度并行探索[18] - 与传统RAG方法不同,采用动态搜索流程根据中间结果调整方向[20] - 主导智能体LeadResearcher负责持久化研究计划和综合分析子智能体反馈[21][22][23] 性能优化关键 - token消耗量单独解释80%性能差异,工具调用次数和模型选择是另两个关键因素[15] - 并行调用工具使研究时间缩短90%,从几小时降至几分钟[41] - 提示词工程是优化行为主要手段,需建立准确心理模型[27] - Claude 4系列在提示词工程表现出色,能自我诊断失败原因并提出改进[32] 评估方法 - 采用"LLM担任评审官"方法,通过0.0-1.0评分评估输出质量[49][51] - 评估维度包括事实准确性、引用准确性、完整性等五个方面[58] - 早期开发阶段小样本评估即可发现显著影响[46] - 人工评估能发现自动化评估遗漏的边缘案例问题[54] 工程挑战 - 智能体有状态特性使错误会累积,需构建从错误状态恢复的系统[56] - 部署采用彩虹部署策略,逐步转移流量避免干扰运行中智能体[59] - 同步执行造成瓶颈,异步执行可提高并行性但增加协调复杂度[59] - 原型与生产环境差距较大,需要大量工程投入实现稳定运行[61]
DeepSeek与ChatGPT:免费与付费背后的选择逻辑
搜狐财经· 2025-06-04 14:29
技术差异 - DeepSeek采用混合专家模型,训练成本仅550万美元,远低于ChatGPT的几亿美元投入,在Chatbot Arena测试中排名第三与ChatGPT-4o并列 [2] - DeepSeek在数学推理方面表现突出,MATH-500测试准确率达97.3% [2] - ChatGPT基于传统Transformer架构,在多模态交互和创意内容生成方面更成熟 [2] 性能表现 - DeepSeek中文语义理解准确率92.7%高于ChatGPT的89.3%,支持古典文学解析和方言识别 [17] - 在金融领域应用使投资决策效率提升40%,医疗领域疾病鉴别诊断准确率85%,编程辅助错误率比GPT-4.5低23%且响应速度快40% [18][19][20] - 数据分析支持128K tokens长文本处理,某制造企业故障预测准确率从75%提升至92% [20] 成本优势 - 定价比ChatGPT低30%,处理效率高20%,能耗降低25% [8] - 百万token仅需8元,相比ChatGPT Pro月费200美元显著节省成本 [9] - 私有化部署前期投入约20万元服务器,长期无需持续API费用 [9] 应用场景 - DeepSeek适合深度推理、专业领域和数据隐私保护场景,某高校实验室用32B一体机支持240名学生实训 [22][23] - ChatGPT在多模态交互、创意内容生成和多语言翻译方面更具优势 [24] - 两者形成互补关系,共同推动AI行业发展 [21][53] 使用技巧 - AI输出质量70%取决于提示词设计,需掌握"提示词链"、"反向思考"和"多重角色"等高级技巧 [4][13][14][15] - 结构化提示词可显著提升效果,如分步引导分析市场进入策略 [14] - 专业领域提示词设计需结合具体场景需求,如医疗诊断需避免AI幻觉 [14][16] 生态发展 - DeepSeek通过算法创新降低算力依赖,已与华为、荣耀、阿里云等企业达成合作 [53] - ChatGPT持续进化多模态和记忆功能,两者共同推动AI技术民主化 [53] - 提示词工程能力将成为AI时代核心竞争力,包含AI思维、引导力、整合力与判断力 [54]
第一批追赶AI的人,正在被AI甩开
投中网· 2025-05-30 11:32
核心观点 - AI行业快速发展导致提示词工程师职业门槛降低,传统仅优化提示词的岗位竞争力下降 [4][5][20] - 大模型能力提升使提示词优化技术重要性降低,从业者需转型为具备产品思维或跨领域能力的复合型人才 [22][23][24] - AI行业仍存在大量人才缺口,但要求从业者持续学习并深入理解业务逻辑 [29][30] 行业趋势 - 2023年提示词工程师年薪可达25-33万美元,但2024年模型升级导致该岗位技术含金量下降 [4][22] - 模型评测分数从60分提升至85分需复杂提示词优化,而当前模型基础性能已达90分,边际效益递减 [23] - 多模态趋势下文本模型参数量占比仅几B,对提示词工程师的跨模态理解能力要求提高 [29] 职业转型 - 提示词工程师工作内容从纯文本优化扩展至数据清洗、RAG技术应用、微调协助等,技术占比降至10% [9][18][24] - 头部企业将提示词工程师岗位归入产品序列,70%工作内容涉及产品设计,仅20%为数据标注 [30] - 从业者背景多元化,计算机、金融、心理学、文科专业均可入行,核心能力转向逻辑表达与业务理解 [13][16][30] 技术演进 - OpenAI o1 Preview模型内置思维链功能,替代人工编写的复杂提示词流程 [24] - Agent技术成为2024年关键方向,工作流串联需求使提示词设计更精细化 [29] - 端侧模型需求上升,提示词工程师需适配移动端2秒响应等具体业务指标 [25] 人才市场 - AI初创公司面临算力/资金/人力短缺,员工入职4个月即可能担任团队负责人 [10] - 行业窗口期缩短,创业者需1个月内验证项目可行性,企业间价格战加剧 [26] - 基层岗位大量空缺,企业主动通过社交平台招募实习生,跨专业转行者机会显著 [7][30]
第一批追赶AI的人,正在被AI甩开
虎嗅· 2025-05-29 08:14
提示词工程师行业变迁 - 2023年提示词工程师职业火爆,国外年薪可达25-33万美元,门槛低且被视为转行AI捷径 [1] - 2023年中期行业存在大量机械化工作,如套壳强化版chatbot开发和竞品调研 [24][25] - 2024年模型能力提升导致提示词优化重要性下降,单纯写prompt的工程师失去竞争力 [2][31] - 2024年9月OpenAI o1 Preview模型发布,内置思维链进一步降低人工提示词工程价值 [34][35] 岗位职责演变 - 早期工作内容:30%时间写提示词,70%时间评估输出 [23] - 中期转型:50%提示词优化,50%工作流设计和调整 [26] - 现阶段核心:业务理解、模型选型、方案设计,提示词优化仅占不到10%工作时间 [37][38] - 新兴要求:需具备产品思维、跨行业技术咨询能力,工作涉及全流程 [27][39] 行业人才结构 - 从业者背景多元,包含计算机、金融、心理学等专业 [21] - 2023年外语专业人才被大量招募从事国际化AI产品开发 [22] - 当前AI产品经理中70%由提示词工程师转型而来 [48] - 行业严重缺人,基层岗位空缺明显,优秀人才遭争抢 [50] 技术发展趋势 - 模型从"难驯野兽"变为"家养宠物",提示词优化边际效益递减 [32][33] - 多模态趋势导致文本模型参数量占比下降,提示词难度提升 [46] - Agent技术兴起要求更细致的工作流设计和业务理解 [46] - 评估模型输出成为新挑战,需要语言敏感度和主观判断能力 [49] 入行路径变化 - 2023年可通过短期培训快速入行,存在信息红利期 [7][8] - 现阶段需要系统学习深度学习、神经网络等专业知识 [15] - 文科生入行优势:语言能力和跨学科思维受重视 [14][49] - 持续学习成为必需,每年知识更新率极高 [39]
ChatGPT催生的百万年薪岗位,大厂不愿意招了
虎嗅APP· 2025-05-04 21:14
同时在招聘平台 (Indeed) 上,提示词工程师的检索次数也在经历了过山车式变化。 大模型元年最热门的AI岗位,现在已经过气了。 提示词工程师 ,不用写代码、不限专业、不要求学历,只需研究如何和AI聊天,就能在2023年拿到25-33万美元年薪。 但如今,它已经沦为企业最不愿意扩增的岗位之一。 微软一项涉及31000名员工的调查显示,提示词工程师已经成为公司未来12-18个月内倒数第二不想新增的岗位。 本文来自微信公众号: 量子位 ,作者:明敏,题图来自:AI生成 2年时间过去,懂提示词工程确实依旧是项技能,但衍生出的岗位却已经不那么刚需了。 搞AI课程培训的高管表示 : 无论你是财务、HR还是法务, 懂提示词工程已经是一种基本的职业技能 ,而不是需要再专门招一个岗位。 提示工程已成基本必备技能 梳 理现状,提示词工程领域现在呈现出三个新趋势: 1. AI可以自动化提示词工程; 2. 普通人上手门槛变低; 3. 企业需要更加复合型人才。 要知道,当年这一新岗位可是得到了OpenAI奥特曼和AI大神卡帕西的共同认可。 最初,提示词工程师的工作内容被定义为"用合适的描述让AI发挥出最大的潜力"。 最早一批开设该 ...
2年就过气!ChatGPT催生的百万年薪岗位,大厂不愿意招了
量子位· 2025-05-04 12:08
提示词工程师 ,不用写代码、不限专业、不要求学历,只需研究如何和AI聊天,就能在2023年拿到25-33万美元年薪。 但如今,它已经沦为企业最不愿意扩增的岗位之一。 微软一项涉及31000名员工的调查显示,提示词工程师已经成为公司未来12-18个月内 倒数第二 不想新增的岗位。 同时在招聘平台(Indeed)上,提示词工程师的检索次数也在经历了过山车式变化。 要知道,当年这一新岗位可是得到了OpenAI奥特曼和AI大神卡帕西的共同认可。 明敏 发自 凹非寺 量子位 | 公众号 QbitAI 大模型元年最热门的AI岗位,现在已经过气了—— 2年时间过去,懂提示词工程确实依旧是项技能,但衍生出的岗位却已经不那么刚需了。 搞AI课程培训的高管表示: 无论你是财务、HR还是法务, 懂提示词工程已经是一种基本的职业技能 ,而不是需要再专门招一个岗位。 提示工程已成基本必备技能 梳理现状,提示词工程领域现在呈现出三个新趋势: 1、AI可以自动化提示词工程 2、普通人上手门槛变低 3、企业需要更加复合型人才 最初,提示词工程师的工作内容被定义为"用合适的描述让AI发挥出最大的潜力"。 最早一批开设该岗位的AI公司包括Ant ...
北京大学:DeepSeek提示词工程和落地场景.pdf
梧桐树下V· 2025-03-08 12:47
AI浪潮已至,DeepSeek正在重塑着我们的工作方式,效率才是王道!为了帮助大家快速掌握AI、提高工作 效率,我们整理了全套入门指南+高阶技巧,免费分享给大家: 免费领取 Deepseek 精选学习资料 共含 35份 领取方式 北京大学 《《 DDeeeeppSSeeeekk 提提示示词词工工程程和和落落地地场场景景》》 扫码添加梧桐小师弟 免费领取35份DeepSeek资料 1.DeepSeek提示词技巧-真诚+直接 传统 你现在是一个新能源汽车的市场研究 分析师,这里有一份调研报告总结需 要写成周报,请按周报的格式帮我完 成并进行润色,不少于500字。 DeepSeek (真诚是必杀技) 18 2.DeepSeek提示词技巧-通用公式 W 做什么 给谁用 음 E T 担心的问题 "内心戏" 20 3.DeepSeek提示词技巧-说人话 适合场景:科研,了解新事物 了避免DeepSeek的回答过于官方、专业,可以尝试这三个字"说人话" 你问:什么是"波粒二象性",DeepSeek大概率会给出专业目看不懂的回答,和百度百科差不多。但如 果给ta一句"说人话",ta就会生动形象的做一些举例 免费了的老者的意志 ...