提示词工程
搜索文档
登上热搜!Prompt不再是AI重点,新热点是Context Engineering
机器之心· 2025-07-03 16:01
上下文工程的核心概念 - 将LLM视为通用的、不确定的文本生成函数而非拟人化实体 强调其无状态特性 需通过输入文本来控制输出[4][5][8] - 上下文工程的核心在于构建有效输入文本系统 而非依赖单句"魔法咒语"式的提示词工程[9][11] - LLM被类比为新型操作系统 需要为其准备完整运行环境而非零散指令[13] 上下文工程的技术要素 - 采用自动化系统构建"信息流水线" 从多源自动抓取整合数据形成完整上下文[15][17] - 工具箱包含四大核心工具:指令下达、知识记忆管理、检索增强生成(RAG)、智能体自主查资料[19][21] - RAG技术通过知识库检索防止模型幻觉 确保回答基于事实[19] - 智能体技术实现动态信息获取 自主判断需求并整合多源数据[21] 工程实践方法论 - 采用科学实验式流程 分"从后往前规划"和"从前往后构建"两阶段实施[23][24][25] - 实施路径:明确输出目标→倒推所需输入→设计自动化生产系统[26] - 模块化开发流程:依次测试数据接口、搜索功能、打包程序 最终进行端到端系统测试[30] - LangChain生态提供实践支持 包括LangGraph和LangSmith等工具[29][31]
论坛| 未可知 x 容诚: AI技术在基金行业的创新应用与效率提升之道
未可知人工智能研究院· 2025-07-02 20:01
AI技术在基金行业的创新应用与效率提升 核心观点 - AI技术正在重塑基金行业的投研、营销、运营等环节,生成式AI和智能体技术实现从“回答问题”到“完成任务”的跨越式发展 [4] - 中国AI发展面临算力瓶颈,但国产模型如DeepSeek通过开源策略和低成本训练提供高性价比转型方案 [8] - 未来十年是人机协同黄金期,构建“AI员工”团队的机构将在行业竞争中占据先机 [13] 技术演进 - 生成式AI(如DeepSeek、Sora)与传统决策式AI存在本质区别,前者重塑内容生产方式,后者侧重任务执行 [4] - 新一代AI智能体突破“回答问题”局限,实现复杂任务自动化处理 [4] 行业实践 - **信息处理高效化**:秘塔AI等工具可将信息搜集时间缩短80% [6] - **内容生产自动化**:提示词工程快速生成营销文案和PPT,视频生成技术赋能产品营销 [4][6] - **业务流程智能化**:RPA数字员工实现净值核对等重复性工作自动化,某大型基金公司年节省超4000工时 [6] 中国AI发展现状 - 国产模型优势:DeepSeek开源策略降低训练成本,适合金融机构本地化部署解决数据隐私问题 [8] - 挑战:算力瓶颈仍需突破,需平衡技术创新与资源限制 [8] 未来趋势 - 未可知人工智能研究院将推出AI培训课程,培养金融机构AI人才 [13] - AI创造力显著提升,可模仿网红风格文案或鲁迅笔锋文章,技术成熟度已具备商业化应用条件 [10]
提示词工程、RAG之后,LangChain:上下文工程开始火了!
机器之心· 2025-06-25 12:06
上下文工程概述 - 上下文工程是构建动态系统以合适格式提供准确信息和工具,使LLM能合理完成任务[5][9] - 该概念并非全新,近两年已被智能体构建者广泛关注[2] - 传统提示工程侧重设计提示语,但应用复杂度提升后单纯依赖提示已无法满足需求[3] 上下文工程核心特征 - 系统性:需整合开发者、用户、交互记录等多来源数据[10] - 动态性:多数上下文动态生成,提示逻辑需随动调整[11] - 准确性:缺乏正确上下文是智能体表现不佳的主因[12] - 工具适配:需提供查找信息或执行行动的工具[12] - 格式规范:工具输入参数的结构化程度影响沟通效率[13] 重要性分析 - LLM出错主因从模型能力不足转向上下文传递不当[15] - 现代AI系统需完整结构化上下文而非巧妙措辞[17] - 正成为AI工程师最关键的发展技能[7] 与提示工程差异 - 提示工程是上下文工程的子集[17] - 前者处理静态模板,后者处理动态数据集[17] - 核心指令设计仍是两者的共同重点[18] 实施要素 - 工具使用:外部信息需格式化为LLM易理解形式[20] - 记忆系统:需建立短期对话摘要和长期用户偏好记忆[20] - 检索机制:动态获取信息并插入提示[20] - 格式优化:数据传递方式直接影响模型响应质量[19]
PromptPilot发布: AI“嘴替”帮你优化每个指令
财富在线· 2025-06-16 18:42
产品发布 - 火山引擎在2025 FORCE原动力大会上正式发布面向大模型的智能解决方案平台PromptPilot [1] - PromptPilot通过深度解析用户意图并自动构建最优指令路径,将模糊想法转化为AI可执行的精准指令 [1] 行业痛点 - AI大模型时代面临"提问之困",高质量Prompt撰写过程耗时耗力且对使用者经验要求极高 [2] - 不同模型对相同问题的理解存在差异,高价值问题往往没有标准答案 [2] 核心功能 - 提供覆盖Prompt生成、调试、优化与迭代全生命周期的自动化一站式解决方案 [3] - 通过互动式引导将模糊需求转化为清晰目标,简化"好答案"的定义过程 [3] - 构建闭环优化体系,将Bad Case转化为数据资产实现持续进化 [3] - 模拟人类思考能力实现全自动多轮迭代优化,支持联网AI搜索和自定义知识库 [4] 技术创新 - 突破性支持多轮对话优化,提供GSB比对模式实现跨模型表现横向对比 [5] - 支持图片/视频等多模态场景的Prompt优化,可自动拆解复杂任务为多步方案 [5] - 优化Function Call场景的工具调用指令和描述,提升工具选择准确率 [5] - 通过SDK接口实现线上Case自动监测,形成"监测-纠错-进化"闭环 [6] 市场定位 - 将复杂的提示词工程转化为标准化流程,降低AI大模型使用门槛 [6] - 助力企业和开发者聚焦业务创新,推动AI应用开发进入普及化阶段 [6][7]
多智能体在「燃烧」Token!Anthropic公开发现的一切
机器之心· 2025-06-14 12:12
多智能体系统概述 - 多智能体系统特别适合解决开放式研究问题,这类问题需要动态调整方法和路径[6] - 研究本质是信息压缩,子智能体通过并行处理不同方面信息辅助主智能体完成压缩过程[7] - 多智能体系统在"广度优先"查询任务中表现突出,比单智能体系统性能提升90.2%[8] 系统架构设计 - 采用"协调者-执行者"模式,主导智能体协调多个并行子智能体[14] - 用户查询先由主导智能体分析并生成子智能体,从不同角度并行探索[18] - 与传统RAG方法不同,采用动态搜索流程根据中间结果调整方向[20] - 主导智能体LeadResearcher负责持久化研究计划和综合分析子智能体反馈[21][22][23] 性能优化关键 - token消耗量单独解释80%性能差异,工具调用次数和模型选择是另两个关键因素[15] - 并行调用工具使研究时间缩短90%,从几小时降至几分钟[41] - 提示词工程是优化行为主要手段,需建立准确心理模型[27] - Claude 4系列在提示词工程表现出色,能自我诊断失败原因并提出改进[32] 评估方法 - 采用"LLM担任评审官"方法,通过0.0-1.0评分评估输出质量[49][51] - 评估维度包括事实准确性、引用准确性、完整性等五个方面[58] - 早期开发阶段小样本评估即可发现显著影响[46] - 人工评估能发现自动化评估遗漏的边缘案例问题[54] 工程挑战 - 智能体有状态特性使错误会累积,需构建从错误状态恢复的系统[56] - 部署采用彩虹部署策略,逐步转移流量避免干扰运行中智能体[59] - 同步执行造成瓶颈,异步执行可提高并行性但增加协调复杂度[59] - 原型与生产环境差距较大,需要大量工程投入实现稳定运行[61]
DeepSeek与ChatGPT:免费与付费背后的选择逻辑
搜狐财经· 2025-06-04 14:29
技术差异 - DeepSeek采用混合专家模型,训练成本仅550万美元,远低于ChatGPT的几亿美元投入,在Chatbot Arena测试中排名第三与ChatGPT-4o并列 [2] - DeepSeek在数学推理方面表现突出,MATH-500测试准确率达97.3% [2] - ChatGPT基于传统Transformer架构,在多模态交互和创意内容生成方面更成熟 [2] 性能表现 - DeepSeek中文语义理解准确率92.7%高于ChatGPT的89.3%,支持古典文学解析和方言识别 [17] - 在金融领域应用使投资决策效率提升40%,医疗领域疾病鉴别诊断准确率85%,编程辅助错误率比GPT-4.5低23%且响应速度快40% [18][19][20] - 数据分析支持128K tokens长文本处理,某制造企业故障预测准确率从75%提升至92% [20] 成本优势 - 定价比ChatGPT低30%,处理效率高20%,能耗降低25% [8] - 百万token仅需8元,相比ChatGPT Pro月费200美元显著节省成本 [9] - 私有化部署前期投入约20万元服务器,长期无需持续API费用 [9] 应用场景 - DeepSeek适合深度推理、专业领域和数据隐私保护场景,某高校实验室用32B一体机支持240名学生实训 [22][23] - ChatGPT在多模态交互、创意内容生成和多语言翻译方面更具优势 [24] - 两者形成互补关系,共同推动AI行业发展 [21][53] 使用技巧 - AI输出质量70%取决于提示词设计,需掌握"提示词链"、"反向思考"和"多重角色"等高级技巧 [4][13][14][15] - 结构化提示词可显著提升效果,如分步引导分析市场进入策略 [14] - 专业领域提示词设计需结合具体场景需求,如医疗诊断需避免AI幻觉 [14][16] 生态发展 - DeepSeek通过算法创新降低算力依赖,已与华为、荣耀、阿里云等企业达成合作 [53] - ChatGPT持续进化多模态和记忆功能,两者共同推动AI技术民主化 [53] - 提示词工程能力将成为AI时代核心竞争力,包含AI思维、引导力、整合力与判断力 [54]
第一批追赶AI的人,正在被AI甩开
投中网· 2025-05-30 11:32
核心观点 - AI行业快速发展导致提示词工程师职业门槛降低,传统仅优化提示词的岗位竞争力下降 [4][5][20] - 大模型能力提升使提示词优化技术重要性降低,从业者需转型为具备产品思维或跨领域能力的复合型人才 [22][23][24] - AI行业仍存在大量人才缺口,但要求从业者持续学习并深入理解业务逻辑 [29][30] 行业趋势 - 2023年提示词工程师年薪可达25-33万美元,但2024年模型升级导致该岗位技术含金量下降 [4][22] - 模型评测分数从60分提升至85分需复杂提示词优化,而当前模型基础性能已达90分,边际效益递减 [23] - 多模态趋势下文本模型参数量占比仅几B,对提示词工程师的跨模态理解能力要求提高 [29] 职业转型 - 提示词工程师工作内容从纯文本优化扩展至数据清洗、RAG技术应用、微调协助等,技术占比降至10% [9][18][24] - 头部企业将提示词工程师岗位归入产品序列,70%工作内容涉及产品设计,仅20%为数据标注 [30] - 从业者背景多元化,计算机、金融、心理学、文科专业均可入行,核心能力转向逻辑表达与业务理解 [13][16][30] 技术演进 - OpenAI o1 Preview模型内置思维链功能,替代人工编写的复杂提示词流程 [24] - Agent技术成为2024年关键方向,工作流串联需求使提示词设计更精细化 [29] - 端侧模型需求上升,提示词工程师需适配移动端2秒响应等具体业务指标 [25] 人才市场 - AI初创公司面临算力/资金/人力短缺,员工入职4个月即可能担任团队负责人 [10] - 行业窗口期缩短,创业者需1个月内验证项目可行性,企业间价格战加剧 [26] - 基层岗位大量空缺,企业主动通过社交平台招募实习生,跨专业转行者机会显著 [7][30]
第一批追赶AI的人,正在被AI甩开
虎嗅· 2025-05-29 08:14
提示词工程师行业变迁 - 2023年提示词工程师职业火爆,国外年薪可达25-33万美元,门槛低且被视为转行AI捷径 [1] - 2023年中期行业存在大量机械化工作,如套壳强化版chatbot开发和竞品调研 [24][25] - 2024年模型能力提升导致提示词优化重要性下降,单纯写prompt的工程师失去竞争力 [2][31] - 2024年9月OpenAI o1 Preview模型发布,内置思维链进一步降低人工提示词工程价值 [34][35] 岗位职责演变 - 早期工作内容:30%时间写提示词,70%时间评估输出 [23] - 中期转型:50%提示词优化,50%工作流设计和调整 [26] - 现阶段核心:业务理解、模型选型、方案设计,提示词优化仅占不到10%工作时间 [37][38] - 新兴要求:需具备产品思维、跨行业技术咨询能力,工作涉及全流程 [27][39] 行业人才结构 - 从业者背景多元,包含计算机、金融、心理学等专业 [21] - 2023年外语专业人才被大量招募从事国际化AI产品开发 [22] - 当前AI产品经理中70%由提示词工程师转型而来 [48] - 行业严重缺人,基层岗位空缺明显,优秀人才遭争抢 [50] 技术发展趋势 - 模型从"难驯野兽"变为"家养宠物",提示词优化边际效益递减 [32][33] - 多模态趋势导致文本模型参数量占比下降,提示词难度提升 [46] - Agent技术兴起要求更细致的工作流设计和业务理解 [46] - 评估模型输出成为新挑战,需要语言敏感度和主观判断能力 [49] 入行路径变化 - 2023年可通过短期培训快速入行,存在信息红利期 [7][8] - 现阶段需要系统学习深度学习、神经网络等专业知识 [15] - 文科生入行优势:语言能力和跨学科思维受重视 [14][49] - 持续学习成为必需,每年知识更新率极高 [39]
ChatGPT催生的百万年薪岗位,大厂不愿意招了
虎嗅APP· 2025-05-04 21:14
文章核心观点 - 提示词工程师这一在2023年大模型元年爆火的高薪岗位,其市场需求已迅速降温,不再被视为企业的刚需岗位,而是逐渐演变为一项跨行业从业者应具备的基本职业技能 [1][3][7][9] 岗位需求与市场变化 - 2023年提示词工程师年薪可达25-33万美元,但如今已成为企业最不愿意扩增的岗位之一 [2][3][4] - 微软一项涉及31000名员工的调查显示,提示词工程师是公司未来12-18个月内倒数第二不想新增的岗位 [4] - 在招聘平台Indeed上,提示词工程师的检索次数经历了过山车式变化:2023年1月每百万次搜索中仅2次,2023年4月暴增至144次/百万次,目前回落至20-30次/百万次 [5][15] - 人力资源公司Xpheno指出,全球范围内对提示词工程师的需求在过去三个季度已趋于平缓 [22] 岗位性质演变 - 行业高管认为,无论财务、HR或法务,懂提示词工程已成为一种基本的职业技能,而非需要专门招聘的岗位 [8] - 企业当前更倾向于招聘AI训练师、AI数据专家及AI安全专家等复合型岗位 [21] - 市场更需要懂提示词工程的复合型人才,例如同时了解基础模型、AI安全治理、数据和云计算的人才 [22][23] - 现阶段仍招聘提示词工程师的企业多集中在垂直行业领域,且要求候选人深入了解行业业务知识,如格灵深瞳要求该岗位需深入了解政务业务知识 [24][28][29] 技术发展与门槛降低 - 技术厂商正通过标准化工具降低提示词工程门槛,例如Anthropic推出了可自动优化提示词的工具Prompt Improver,谷歌发布了面向非技术用户的提示词工程白皮书 [16][18] - AI可以自动化提示词工程,普通人上手门槛变低,企业需要更加复合型人才 [10] - 大模型智能水平显著提升,无需完美提示词也能给出更好回答,且可通过交互设计(如进一步追问、自动优化问题)更精准理解用户需求 [36][37][38][39] 未来趋势 - 提示词工程师岗位不会完全消失,但其存续时间取决于AI的进化速度 [31][32] - AI正朝个性化发展,随着AI对用户理解加深,通用化的提示词工程可能变得不再实用 [40] - AI使用将像使用Office一样平常,提示工程将成为未来每个人的必备技能 [33][41]
2年就过气!ChatGPT催生的百万年薪岗位,大厂不愿意招了
量子位· 2025-05-04 12:08
文章核心观点 - 提示词工程师岗位经历了从2023年高薪热门到2024-2025年需求急剧冷却的过山车式变化 该岗位正从独立的专门职位演变为一项广泛要求的基础职业技能 其未来可能取决于AI技术的进化速度 但短期内不会完全消失 [1][2][6][30][31] 岗位需求与市场趋势演变 - **需求急剧下滑**:提示词工程师已成为企业未来12-18个月内最不愿意扩增的岗位之一 在微软一项涉及31000名员工的调查中位列倒数第二 [3][19] - **招聘热度骤降**:招聘平台Indeed上 提示词工程师的检索次数从2023年4月每百万次144次的峰值 大幅回落至20-30次/百万次 全球范围过去三个季度的需求趋于平缓 [4][14][20] - **早期高薪盛况**:2023年 该岗位年薪可达25-33万美元 早期招聘方如Anthropic对硬性技能要求不高 但强调黑客精神、沟通能力等软技能 [1][9][10] - **岗位需求转变**:企业当前更倾向于招聘AI训练师、AI数据专家及AI安全专家等岗位 对纯提示词工程师的需求普遍降低 [19] 技能属性与岗位性质变化 - **从专门岗位到基础技能**:提示词工程正从专门岗位转变为一项基本的职业技能 如同财务、HR、法务等岗位人员都需要掌握 而非单独设岗 [7] - **复合型人才更受青睐**:市场更需要懂提示词工程 同时对基础模型、AI安全治理、数据和云计算都有了解的复合型人才 [21][22] - **垂直行业需求尚存**:当前仍提供高薪招聘提示词工程师的企业 更多集中在垂直行业领域或服务于垂直行业的技术提供商 且要求候选人深入了解行业业务知识 [23][27][28] 技术发展对岗位的冲击 - **AI自动化提示工程**:技术厂商正通过标准化工具降低提示词工程门槛 例如Anthropic推出了能自动写提示词或优化提示词的Prompt Improver工具 谷歌也发布了面向非技术用户的白皮书 [12][13][16] - **大模型智能水平提升**:大模型智能水平已显著提高 无需完美提示词也能给出更好回答 并且能通过追问、结合上下文等方式自动优化用户问题 理解更精准 [33][34][35][37] - **AI向个性化发展**:随着AI与用户交流增多并形成个人知识库 AI更像私人助理 对用户理解更深 通用化的提示词工程实用性可能下降 [38] 行业长期展望 - **AI使用常态化**:使用AI将像使用Office一样平常 成为日常工作生活的一部分 [39] - **岗位存在基础动摇**:提示词工程师岗位爆火的底层逻辑在于“AI还不够聪明” 随着AI持续进化 该岗位的长期存在性面临挑战 [32]