提示工程 - 财报，业绩电话会，研报，新闻 - Reportify

提示工程

搜索文档

【焦点】香港中文大学(深圳) 赵俊华：大模型智能体在电力系统中的应用初探

搜狐财经· 2025-06-29 21:01

人工智能发展历程 - 决策式AI阶段(1950s~1980s)：以逻辑程序和专家系统为主，1956年首次人工智能研讨会召开标志着领域诞生，1965年Logic Theorist程序实现数学证明推理[4] - 技术积淀阶段(1980s~2010年)：1986年Backpropagation算法突破，1997年Deep Blue击败国际象棋冠军，2006年深度学习技术发明[4] - 快速发展阶段(2011-2016年)：2011年IBM Watson在Jeopardy获胜，2014年GAN出现，2015年AlphaGo战胜围棋冠军[4] - 爆发阶段(2017年至今)：2017年Transformer架构提出，2018年GPT/BERT发布，2022年ChatGPT推出，2024年Sora面世[4] 大语言模型技术架构 - 预训练三要素：大数据(无标注文本)、大模型(深度神经网络)、大算力(并行计算集群)[11][12][13] - 训练流程：预训练(月级/千级GPU)→有监督微调(天级/百级GPU)→强化学习(天级/百级GPU)[22] - 微调技术：LoRA方法仅需训练百万参数，效果媲美全参数微调，GPU需求降至3090*4级别[15][20] - 强化学习：通过RLHF量化人类喜好，训练打分模型优化最终输出[18][19] 智能体关键技术 - 工具使用：通过API调用、搜索引擎、代码执行等扩展能力[26][27] - 任务分解：实现复杂任务的子目标拆解与试错机制[28][30] - 长期记忆：存储经验、知识、技能，支持读写持久化[31][32][33] - 自主学习：结合权重微调、提示优化、自我反思等多路径提升[35][36][38] 电力系统应用场景 - 负荷预测：ITA-LF框架整合新闻文本，预测准确率达94.7%，显著优于LSTM(82.08%)和SARIMA(89.93%)[64][68][71] - 调度系统：构建70b参数调度大模型集群，支持检修单成票(94.46%准确率)、规程检索问答(RAG召回率58.7%)[77][91][94] - 市场仿真：多代理模型实现碳市场均衡分析，量化价格弹性系数(煤炭企业7,278吨/元)[113][115][120] - 机理研究：AI4S框架处理10万节点电网建模，年算例超10亿，推动动态建模与稳定性分析[125] 技术融合路径 - 模型融合：推理大模型+PINN+因果模型+符号模型，保留准确性同时提升计算速度[54][56][58] - 人机协同：必要场景引入人工反馈，作为最终决策质量判定者[56][59] - CPSSE仿真：结合真人、因果模型和大语言模型，构建数字孪生系统[62] - 范式演进：从参数学习(机器学习)→提示工程(大模型)→机制工程(智能体)的能力获取转变[40]

大模型智能体

大模型智能体

告别无效提示！开发者必学的AI协作提示框架全解析

36氪· 2025-06-28 08:04

AI编程助手应用 - 开发者依赖AI编程助手加速工作流程，包括自动补全函数、修复bug和生成模块或MVP [3] - AI输出质量高度依赖提示词质量，提示工程成为必备技能 [3] - 有效提示需要提供丰富上下文、明确目标和问题、分解复杂任务、提供输入输出示例以及利用角色扮演 [5] 提示工程技术 - 角色提示技术模拟专家级代码评审、调试或重构 [4] - 显式上下文设置清晰界定问题避免笼统回答 [4] - 输入输出示例通过具体案例传递意图引导AI [4] - 迭代链式处理将大型任务拆分为步骤避免提示过于庞杂 [4] - 模拟调试让AI模拟运行时行为暴露隐藏Bug [4] 调试代码策略 - 清晰描述问题和症状是调试的基础，需包含编程语言、预期行为、错误输出和代码上下文 [9] - 对复杂bug采用分步或逐行方法让AI逐步执行代码 [9] - 提供最小可复现示例帮助AI集中注意力并澄清问题 [14] - 提出有针对性的问题和后续跟进促使AI进行诊断并提出解决方案 [14] 重构与优化方法 - 明确重构目标如提高可读性、降低复杂度或优化性能 [17] - 提供必要代码上下文包括语言、框架和周边相关代码 [18] - 鼓励附带代码解释以验证重构正确性并学习改进方法 [18] - 利用角色扮演如要求AI扮演资深工程师设定高标准 [19] 功能实现技巧 - 从高阶指令开始逐步深入分解复杂功能为小任务 [35] - 提供相关上下文或参考代码确保生成代码符合项目需求 [36] - 使用注释和TODO作为内联提示指导AI生成特定代码块 [36] - 提供预期输入输出或用法示例约束AI生成符合要求的函数 [38] 常见提示反模式 - 模糊提示缺乏细节导致AI猜测和泛泛回答 [51] - 超载提示要求AI同时处理过多任务导致结果混乱 [51] - 缺失明确诉求使AI无法理解用户意图 [51] - 模糊成功标准未定义优化方向导致AI解决非目标问题 [51]

上下文就是一切！行业热议话题：提示工程是否应该改名

歸藏的AI工具箱· 2025-06-26 19:40

核心观点 - 上下文工程是比提示工程更准确描述LLM应用核心技能的术语强调为LLM提供完成任务所需的所有上下文 [1] - 工业级LLM应用中上下文工程是精心填充上下文窗口的艺术与科学需包含任务描述少样本 RAG 多模态数据工具状态历史等多维度信息 [1] - 上下文工程师需具备对LLM"心理"的引导性直觉通过持续优化提示词和上下文内容来建立模型边界认知 [2] 行业动态 - Shopify CEO和Andrej Karpathy推动"上下文工程"术语替代"提示工程" 因其更准确反映岗位核心技能 [1] - Cognition和Anthropic在AI Agent构建中均强调上下文管理是关键 Anthropic指出数百轮对话需精细策略 [3] 重要性分析 - 不充分上下文共享导致子Agent工作不一致或冲突假设过长上下文限制LLM回忆能力 GPT-4o多轮对话准确率仅50% [4] - 语音AI Agent中上下文膨胀增加延迟(目标中位延迟800ms) 函数调用准确性在多轮对话中显著下降 [4] 优化策略框架 - Lance Martin定义上下文工程为伞状学科涵盖指令上下文(提示/记忆) 知识上下文(RAG) 操作上下文(工具流) [5] - 提出三大策略：压缩(保留高价值Token) 持久化(存储检索系统) 隔离(划分上下文边界) [5] 压缩技术实践 - Claude Code在上下文窗口使用超95%时自动压缩 Anthropic多Agent研究生成工作阶段摘要 [7] - Cognition的Devin使用专用微调模型进行上下文压缩显示技术门槛较高 [7] 持久化系统构建 - 存储方式：Claude Code用CLAUDE.md文件 Cursor/Windsurf用规则文件 Letta/Mem0用嵌入式文档 Zep/Neo4J用知识图谱 [10] - 保存策略：Claude Code用户手动更新 Reflexion论文提出Agent轮次后反思生成 ChatGPT等产品实现自动记忆生成 [11][12] - 检索机制：小规模直接载入(如CLAUDE.md) 大规模需选择性检索(向量搜索/图检索) GPT-4o曾因检索错误注入非意图位置信息 [14][15] 隔离管理方案 - 上下文模式：用Pydantic模型替代臃肿消息列表隔离高Token内容并按需获取深度研究Agent将messages与sections分离 [18][20] - 多Agent架构：OpenAI Swarm库实现关注点分离 Anthropic研究显示隔离上下文多Agent性能比单Agent高90.2% 但Token消耗增15倍 [21] - 环境隔离：HuggingFace的CodeAgent在沙箱执行代码隔离生成对象(如图片)但保留变量引用能力 [22] 行业实践经验 - 工具先行原则：建立Token追踪机制作为基础 Anthropic建议"像Agent一样思考"明确状态模式 [23] - 可并行化任务优先采用多Agent Anthropic案例显示子Agent无需严格协调时效率显著提升 [26] 发展趋势 - 上下文管理是AI Agent核心需平衡性能(如GPT-4o 50%准确率) 成本(15倍Token消耗) 准确性(函数调用) [24] - LLM本质是无状态函数最佳输出依赖最佳输入设计清晰表达需求与语境构建决定响应质量 [25]

上下文工程

Artificial Intelligence

上下文工程

Artificial Intelligence

速递｜下一代十亿级AI创意藏于系统提示词，Superblocks完成A轮融资2300万美元

Z Potentials· 2025-06-08 11:04

企业级低代码开发平台Superblocks - Superblocks完成2300万美元A轮扩展融资使A轮总融资额达到6000万美元 [1] - 公司主打产品vibe coding工具面向企业非开发人员 [1] - 已赢得Instacart和Paypaya Global等知名企业客户 [5] - 内部实践"吃自己的狗粮"策略业务人员自主搭建智能代理处理CRM数据识别支持指标跟踪等任务 [5] AI系统提示词的价值 - AI独角兽企业使用的系统提示词(5000-6000字)被视为提示工程"大师课" [1] - 系统提示词占核心技术的20% 剩余80%为"提示增强"基础设施 [2] - Superblocks公开分享19个来自Windsurf Manus Cursor等热门AI编程产品的系统提示词文件 [2] 系统提示词研究框架 - 包含三部分：角色提示(如Devin的提示赋予目标与个性) 上下文提示(设立防护机制) 工具使用(指导模型超越文本生成) [3][4] - 自然语言编写的系统提示词需极度特异需像对待人类同事般精确 [3] - 不同工具侧重点各异：Loveable V0 Bolt专注快速迭代 Manus Devin等输出原始代码 [4] 商业机会洞察 - 研究系统提示词可发现价值十亿美元的创业点子 [1] - 通过处理安全性访问Salesforce等企业数据源赋能非程序员编写应用程序 [5] - CEO推文浏览量近200万引发硅谷大咖广泛关注 [2]

系统提示词

系统提示词

5 万行代码 Vibe Coding 实践复盘：最佳实践、关键技术，Bitter Lesson

海外独角兽· 2025-06-05 19:00

Vibe Coding实践与验证 - Vibe Coding指完全依赖AI生成代码的编程方式代表产品包括Windsurf Cursor Cline Devin等 [7] - 资深工程师通过3个月实践验证完全依赖AI生成5万行代码成功开发3个功能产品包括增强型Cline Twitter订阅系统和浏览器自动化工具 [7][8] - 开发效率达到每天生成1万行代码其中约5000行可直接采纳远超人工编程速度 [9] - 开发成本控制在100-200美元/项目耗时主要集中于假期和周末 [8] Coding Agent关键技术架构 - 核心三要素为模型(Model) 上下文(Context) 工具(Tools) 类比企业人力资源管理体系 [15] - 顶尖模型代表包括Cursor调教的Claude 3.7 Max和Gemini 2.5 Pro Max 在复杂任务中表现优异 [15][43] - 上下文管理系统需包含1000+行system prompt 动态用户输入及反馈闭环机制 [16] - 关键工具链包含代码语义搜索(codebase_search) MCP协议支持浏览器自动化(browser use)等特色功能 [17][32] 语义搜索技术突破 - Cursor通过codebase_search实现工程级语义搜索支持10万行以上代码库的精准定位 [18][26] - 技术实现包含AST语义分块向量嵌入存储余弦相似度搜索三阶段类似百度搜索引擎架构 [29] - Cline因缺失语义搜索功能处理1万行以上代码库时效率显著下降需通过第三方方案补足 [31] MCP协议生态发展 - MCP(Model Context Protocol)实现工具链标准化使同一工具可跨平台(Cline Cursor Copilot)通用 [33] - 协议优势包括开发流程简化(仅需修改JSON配置) 端到端SOP自动化避免重复开发排队 [38] - 2025年5月技术格局：Cline对MCP支持最佳 Cursor次之 Copilot仍在追赶但差距可能快速变化 [36] 主流Coding Agent产品对比 - Cursor当前领先凭借Claude 3.7 Max模型和语义搜索能力可驾驭10万行级工程 [43][44] - Cline优势在于开源可定制对MCP支持最完善但需补足语义搜索和上下文管理短板 [44][45] - GitHub Copilot在上下文管理和MCP支持方面暂处劣势但微软生态整合能力可能带来变数 [46] Agent开发核心原则 - 实践验证"苦涩教训"(The Bitter Lesson)：过度植入人类经验会限制AI潜力应侧重搜索和学习元方法 [47][49] - 质量Agent案例显示减少人为干预后测试覆盖率从70%提升至99% 证明通用方法的扩展性价值 [48] - 行业需建立能自主发现复杂性的系统而非简单封装现有知识 [49]

“由 AI 生成的代码，从诞生那一刻起就是「遗留代码」！”

AI科技大本营· 2025-05-12 18:25

AI生成代码的特性分析 - AI生成的代码缺乏上下文记忆和维护连续性，一诞生就处于"他人旧作"的状态 [1] - AI生成的代码具有"无状态"特性，无法真正理解作者意图或拥有时间点记忆 [3] - 每次AI生成的代码都像是"由别人写的"，跳过了"新代码"阶段直接进入"旧代码"模式 [5] 代码生命周期与维护行为 - 代码演进速度取决于编写时间远近和维护者是否为原作者 [1] - 人类维护者对不同时期代码的四种典型态度：近期自写代码最易改进，他人旧代码最不愿改动 [4] - 遗留代码的本质是支撑代码的"理论"随原作者离开而失传，仅保留低保真表达的代码和文档 [8] 行业解决方案与发展趋势 - 开发者尝试通过精心构造提示、设计上下文窗口和详细注释来弥补AI缺陷 [5] - Chain of Thought技术可能解决AI无状态问题，通过重新激活上下文理解代码 [10] - 未来代码可能更依赖模型推理和提示生成，而非长期维护的静态结构 [5] LLM时代的理论构建探讨 - LLM可能隐含某种尚未被理解的"程序理论"，或能从代码中逐步构建理论 [12] - 技术债管理新思路：保存Prompt可帮助理解代码存在原因，优于人类记忆 [10] - 理论掌握权可能转移至写prompt的人而非写代码的人 [12] 行业观点与讨论 - 软件开发本质是开发者集体心智构建的"理论"，代码只是其低保真表达 [8] - 人类开发者常通过"时代写法"解释代码，部分确实反映历史约束条件 [9] - 代码提示生成可能成为短期/中期的过渡桥梁，而非长期维护对象 [6]

思维链技术

Software Development

AI生成的代码

思维链技术

Software Development

AI生成的代码

AI提示词终极指南：掌握这些技巧，让输出效果翻倍

36氪· 2025-05-11 10:04

文章核心观点 - AI输出质量与提问方式直接相关，精准提问能显著提升AI潜能 [1][4] - 提示词优化是数字化时代的元能力，掌握技巧可大幅提升生产力 [1][29] - 提示词质量决定AI输出水准，需具备明确、上下文化、目的性强三大特质 [5][6][11] 提示词优化原则 - 提示词分指令型和对话型，前者适合目标明确任务，后者适合创意探索 [7] - 高阶技巧包括零样本提示、少样本提示、思维链提示，组合运用效果更佳 [5][7] - 黄金法则：具体明确指令=更优质输出，避免含糊或冗长指令 [5][6][8] 实用技巧 - 提供背景信息可提升输出相关性，如说明受众、任务目标或角色设定 [11][24] - 增加约束条件（篇幅、基调、格式）能有效引导AI输出方向 [17][20] - 复杂任务需拆解为单步指令，AI在清晰小任务中表现最佳 [22] 迭代与角色设定 - 提示词需多次迭代调整，首次输出不理想属正常现象 [23] - 角色代入法（如设定AI为特定专家）可使输出自带专业滤镜 [24] - 建立个人提示库可积累已验证有效的指令，提升长期效率 [27] 行业应用观察 - AI可作为高效头脑风暴搭档，批量生成备选方案加速创意流程 [30] - GPT综合性能领先，Claude细腻度突出，工具选择需结合场景 [30] - 提示词编写虽耗时但能压缩构思阶段时间成本，适合重复性工作 [30][31] 方法论总结 - 提示词准则应视为乐高积木，根据场景自由组合而非机械套用 [32] - 负面排除法（明确避免内容）与正面引导同等重要 [28] - 需测试边缘案例（如向不同受众解释概念）以优化提示适应性 [27][31]

Artificial Intelligence

Artificial Intelligence

写好 Prompt 仍是2025 年 AI 时代的超能力

36氪· 2025-03-31 12:18

AI产品与提示工程行业趋势 - AI产品开发正从技术导向转向用户体验导向，强调提示词工程在优化人机交互中的核心作用[3][6] - 行业活动形式趋向多元化，涵盖学术研究（高校博士）、产品实践（AI创始人）和技术专家（微软MVP）等多维度视角[1] - 主流AI产品需平衡技术能力与用户表达清晰度，模型效果公式体现为"大模型能力×（任务+提示词）"的乘数效应[9] 提示词工程核心技术框架 - AI对话系统存在三重角色架构：用户（需求方）、助手（模型执行端）、系统（隐式控制层），其中系统角色通过API参数预设决定模型行为特征[4] - 提示词本质是表达本意的技术载体，需区分指令与问题两部分，精准度直接影响输出质量[7] - CRISP等标准化框架通过决策主体描述、信息清晰化、输出模式定义提升提示词结构化水平[16] 提示词工程师能力要求 - 提示词创作需融合领域知识（如财务指标、法律条文）与语言表达能力，词汇储备量直接影响描述精度[14] - 工程师需具备自然语言写作与基础编程能力，逻辑思维和简洁表达是核心优势[19] - 评估体系以业务需求实现为基准，需通过多次调试确保线上环境与测试环境效果对齐[23][24] 企业级提示工程应用 - 从提示工程（PE）向企业级提示工程（EPE）演进，重点从个人使用转向大规模稳定输出[26] - 生产环境存在效果衰减挑战，某案例显示模型从测试环境近100%性能降至上线后20%，需通过持续迭代优化[23] - 专业评估需设定适用性指标，结合知识压缩和应用迭代实现规模化部署[24] 工具生态与实战案例 - AIPRM等插件通过预设场景描述优化提示词，在StableDiffusion等平台可提升生成内容与预期匹配度[28][29] - Midjourney提示词优化平台支持局部优化和一键优化，减少模型反复修改成本[31] - 深度提问策略影响输出精度，具体化描述（如"30分钟站立瘦腰腹视频"）比宽泛提问效果提升显著[32] 行业社区与标准化进展 - PEC（提示工程大会）和LangGPT社区推动提示词标准化建设，LangGPT提出模块化、标准化编写方法论[35] - 结构化提示词案例显示跨语言支持（中/英/日文）和美学设计（配色方案、排版规则）成为产品化关键要素[36][37] - 提示词创作呈现人文与技术融合趋势，文学哲学背景可提升提示词的思想深度和美学价值[33][34]

刑法小助手

刑法小助手