Workflow
Prompt Engineering
icon
搜索文档
AI搜索的未来不是“十个蓝色链接”,而是直接给你答案
虎嗅· 2025-07-25 12:16
一、Perplexity AI的引用规范与监督机制 - 公司明确标注信息来源,不声称拥有内容版权,核心功能是帮助用户更易获取并总结互联网信息,同时清楚展示来源 [6] - 模型训练时被要求避免直接复现原文,而是归纳总结不同来源观点,结合监督微调(SFT)和人类反馈强化学习(RLHF)技术优化 [10] - 产品设计上不支持用户直接粘贴URL要求总结,但承认当前技术无法完全杜绝滥用场景,需持续迭代防护措施 [12][14] 二、AI搜索与传统搜索的差异化路径 - 与传统搜索引擎如Google相比,Perplexity用户平均查询长度达10-11个词,更倾向于直接回答完整问题而非返回链接列表 [17] - Google商业模式依赖搜索广告(单季度收入450亿美元),其激励机制促使用户多点链接,而Perplexity定位为AI原生信息检索工具 [16][18] - 公司近期新增NFL实时比分功能,通过与体育数据提供商合作确保准确性,并计划扩展至深度数据分析如球员对比、历史表现等 [19][21] 三、产品功能扩展与用户习惯重塑 - 根据用户日志数据优先开发金融垂类功能,支持市场调研、投资组合管理等需求,同时解决体育等领域的信息幻觉问题 [23] - 目标覆盖从学术研究到日常查询的全场景,包括本地搜索、天气、购物等基础需求,以推动用户从传统搜索转向AI原生交互 [24] - 近期密集推出数十项新功能,但强调策略基于用户需求分析而非盲目试错,例如金融方向因核心用户群体需求而优先落地 [22][23] 四、内容合作与商业模式探索 - 推出Publisher Program,承诺与媒体分享广告收益,若其内容被引用为答案来源,同时提供API支持媒体站内部署AI助手 [26][31] - 区分两类AI公司:一类训练模型内化内容,另一类实时检索公开信息生成回答,Perplexity属于后者且不将内容纳入训练权重 [27][28] - 广告变现被视为长期方向,但需平衡用户体验与商业利益,预计需两年时间完善机制,当前API成本每4-5个月下降50% [35][37] 五、行业竞争与法律争议回应 - 回应道琼斯诉讼时强调开放合作态度,指出与Fortune、Time等媒体已有合作案例,诉讼方News Corp亦与OpenAI存在协议 [25] - 法律层面主张"事实不受版权保护",认为信息自由传播符合科学精神,但承认当前法律框架存在模糊地带需通过案例明确 [33][34] - 否认与新闻媒体直接竞争,用户使用场景多为分析新闻影响(如股票决策)而非获取原文,强调产品定位差异 [30]
深度|Perplexity CEO专访:AI搜索的未来不是“十个蓝色链接”,而是直接给你答案
Z Potentials· 2025-07-25 11:24
Perplexity AI的核心定位与产品理念 - 公司定位为AI原生搜索引擎,专注于通过归纳总结而非直接复制来提供信息,并明确标注来源[6][7] - 产品设计初衷是改变传统搜索习惯,平均查询长度达10-11个词,远高于Google的2.7个词[15] - 强调事实本身不应被版权保护,主张信息应自由传播的价值观[10][28] 技术实现与内容处理机制 - 采用监督微调(SFT)和基于人类反馈的强化学习(RLHF)技术防止直接复制原文[11] - 每句话标注来源信息,包括页面顶部source panel和文末脚注[7] - 明确反对用户通过"总结URL"等方式滥用产品功能[12][13] 商业模式与行业合作 - 推出Publisher Program,承诺与内容方分享广告收益[23][26] - 区分两类AI公司:训练基础模型型与实时检索型,自认属于后者[23] - 预计API成本每4-5个月下降一半,未来可能再降10-50倍[30] 市场竞争策略 - 指出Google季度搜索广告收入达450亿美元,但其商业模式依赖多点链接[14] - 认为与Google非零和博弈,广告预算可能从100%Google变为95%+5%分配[31] - 优先覆盖金融、体育等垂直领域,解决用户在其他搜索引擎的痛点[20][21] 产品功能演进 - 新增NFL实时比分功能,与专业数据提供商合作[17][18] - 根据日志数据持续优化功能,早期用户主要为学术研究型人群[19][20] - 目标覆盖搜索全场景包括本地、天气、购物等基础需求[21] 版权争议应对 - 回应News Corp诉讼,强调已建立合作机制并当天做出正式回复[22] - 主张产品非新闻工具,用户更多是查询新闻对自身影响而非获取原文[25] - 为媒体提供API支持和企业版产品,帮助其提升内容创作效率[27]
2万行App代码,Claude写了95%!老开发者:每月只花200美元,就像一天多出5小时,IDE要“变天”了!
猿大侠· 2025-07-10 12:10
AI编程工具发展现状 - Claude Code已实现95%代码生成率 在2万行代码的macOS应用中仅需手动编写不到1000行 [5][13] - 主流AI编程工具正从补全模式转向代理式开发 通过工具调用循环实现复杂任务 [3][4] - 新一代模型具备200k tokens上下文窗口 支持自动压缩和上下文预热优化 [24][26][28] 技术能力边界 - 在SwiftUI领域表现优异 但处理Swift并发机制时易混淆新旧API [15][16] - 通过CLAUDE.md规则文件可显著提升输出质量 现代API使用率提高30% [17] - 需配合XcodeBuildMCP等工具才能实现完整构建测试闭环 [39][40] 开发范式变革 - 编程语言门槛消失 系统设计和架构能力成为核心竞争力 [5] - 传统IDE功能被颠覆 未来开发环境将围绕上下文预热和反馈循环设计 [54] - 发布流程自动化程度提升 2000行发布脚本实现全流程管理 [51][52] 生产力跃升 - 开发周期从数月压缩至一周 实现10年未完成的业余项目发布 [5][56] - UI迭代效率提升 通过截图反馈可实现即时视觉优化 [22][43] - 模拟数据生成能力使原型设计速度提升80% [45][46] 行业影响 - 设计岗位需求面临重构 Figma等工具已能自动生成品牌识别系统 [5] - 开发者工具市场格局生变 终端式IDE挑战传统编辑器地位 [4][7] - 企业技术招聘标准将转向问题解决能力而非特定语言技能 [5]
推出4个月就狂赚3亿?!百万用户应用CTO弃Copilot转Claude Code:200美元拯救我的137个应用
AI前线· 2025-07-07 14:57
核心观点 - Anthropic公司推出的AI编码助手Claude Code在4个月内吸引了11.5万名开发者,单周处理代码量达1.95亿行,成为AI编码市场中增长最快的开发者工具之一[1] - 按当前用户采用模式测算,Claude Code年化收入预估约达1.3亿美元,推出4个月已赚取4300万美元[1] - Claude Code通过自然语言指令执行编码任务,无需手动选择上下文即可感知整个代码库的全局信息,与竞争对手形成差异化优势[2] - 开发者反馈Claude Code在提示词质量、工具集成和上下文管理能力方面表现卓越,显著优于其他AI编码助手[2] 市场表现 - Claude Code采用SaaS模式的分层订阅计划,既能从独立开发者处盈利,也能服务企业团队[3] - 该工具瞄准习惯命令行操作、追求模型推理透明性与安全性的工程师群体[3] - 即便按当前定价仅获取少量市场份额,其年化经常性收入(ARR)也有望突破5000万至1亿美元[3] 技术优势 - Claude Code支持开发者通过自然语言指令执行编码任务,同时无需手动选择上下文即可感知整个代码库的全局信息[2] - 该工具与Anthropic最先进语言模型Claude Opus 4集成,形成差异化优势[2] - 开发者反馈Claude Code在提示词质量、工具集成和上下文管理能力方面表现卓越[2] 用户案例 - Sentry工程总监Indragie Karunaratne使用Claude Code构建的macOS应用Context中,2万行代码仅有不到1000行是手工编写的[3] - 开发者表示Claude Code显著提升生产力,"就像每天多给了5个小时"[4] - 一位开发者指出Claude Code能一次性完成复杂功能需求,"简直像变魔术一样"[2] 商业模式 - Claude Code采用典型的SaaS模式,分层订阅计划既能从独立开发者处盈利,也能服务企业团队[3] - 将通用型AI与编码专用AI捆绑的模式,相较于单功能编程助手更能提升用户留存率[3] - 真正的增长突破口在于团队/企业版订阅的向上销售以及开源工作流带来的网络效应[3] 开发效率 - Claude Code能在几分钟内交付完整功能,效率远超人工实现[15] - 开发者表示使用该工具后"就像每天多给了我5个小时"[38] - 在构建macOS应用Context时,2万行代码中仅有不到1000行是手工编写的[7] 技术细节 - Claude Code搭配最新的Sonnet 4和Opus 4模型在代码编写方面表现出色[13] - 该工具能够理解代码风格和设计模式,生成实现功能的代码并验证功能行为[14] - 在Swift语言环境下,Claude能够熟练使用Swift 5.5版本前的大多数语言特性[17] 用户体验 - Claude Code直接取代了传统IDE,将"智能体循环"置于核心位置[8] - 开发者表示使用该工具后几乎不需要任何典型的编辑器功能[36] - 未来的IDE将专注于帮助开发者预置智能体的上下文并设置反馈循环[37] 应用场景 - Claude Code可用于功能代码编写、UI界面生成、模拟数据生成甚至发布脚本[20] - 该工具能够独立驱动反馈循环,变更、测试变更并收集失败的上下文信息[29] - 在构建macOS应用时,Claude能够生成质量极高的模拟数据[30]
程序员还写啥前端?Claude 工程师凌晨2点造出Artifacts:AI直接生成可交互App,现在又重磅升级了
AI前线· 2025-07-01 13:24
核心观点 - Anthropic升级Artifacts功能,使构建交互式AI工具更加轻松,无需编程技能[1] - Claude聊天机器人正式向实用工具平台转型[2] - 数百万用户已创建超过五亿个"作品",涵盖生产力工具和教育游戏[4] - Artifacts功能最初用于生成网站,后发展为可共享的应用程序开发平台[5][7] - 该功能代表AI交互方式的根本性转变,从静态响应转向动态交互体验[17] 功能更新 - Artifacts拥有专属空间,用户可从Claude应用侧边栏访问,整理和查找项目更方便[15] - 支持移动设备和桌面设备,但电脑可访问全部功能[16] - 用户可浏览精选项目获取灵感,几分钟内定制现有作品,或通过简单对话从头构建[21] - 新功能使创作更简单,模糊了AI辅助与软件开发之间的界限[17] 用户反馈 - 用户创建游戏、智能导师和数据分析器等应用程序,体验丝滑[18][19] - 博主测试后认为Artifacts类似"按需构建应用",可能减少对传统SaaS工具的依赖[20][22] - X用户称赞其创新性,认为它实现了GPT Store未能做到的功能[9][24] 商业模式 - 免费向所有用户提供Artifacts体验,包括免费帐户用户[31] - 专业版和团队版提供更多功能和更高使用限额,采用免费增值模式[31] - 强调免费共享以建立社区参与度,与传统软件市场不同[31] 行业影响 - Gartner预测到2025年70%的新应用程序将使用低代码或无代码技术[33] - 催生"平民开发者",41%的企业已启动相关计划[33] - AI开发工具与传统编程互补,专业开发者仍负责复杂系统和安全治理[33] - 预计到2030年全球低代码开发平台市场将达到1870亿美元[34]
用上这些提示词(Prompt),效率超高,老板:你再多干点~
菜鸟教程· 2025-05-20 18:33
AI编程转型趋势 - 编程方式从传统搜索引擎转向AI辅助编程,开发者需要编写更详细的提示词而非简单关键词[1] - 高质量AI代码生成依赖两大要素:强大的底层模型和精准的提示词工程[2] - 行业出现对AI编程工具能否完全替代程序员的讨论,但调试环节仍需人工介入[3] 提示词工程体系 - 建立18类标准化提示词模板库,覆盖代码生成、解释、优化等全生命周期场景[4] - 典型模板包括:代码生成("使用[语言]编写[功能]")、代码优化("优化以下[语言]代码提高[性能]")、算法实现("用[语言]实现[算法]")等[4] - 技术选型提示词要求对比分析技术A/B的优缺点,考虑开发效率、性能等4维度[5] 需求分析与技术决策 - 需求解构提示词要求分4步:功能点优先级排序、难度标注、技术选型推荐、风险预警[6] - 技术选型顾问提示词需生成对比表,评估开发效率、性能等4个核心维度[6] - 实战案例:电商小程序技术栈选择需平衡团队适配度与社区活跃度[6] 代码生成与优化 - 高质量代码生成5要素:清晰结构、详尽注释、极致性能、全面异常处理、符合最新规范[7] - 算法实现提示词要求包含复杂度分析、优化空间说明和执行过程演示[8] - 代码优化聚焦4个关键点:性能瓶颈定位、冗余计算消除、内存占用降低、高效算法替代[8] 测试与质量保障 - 测试用例设计需覆盖正常情况、边界值、异常输入、压力测试4类场景[13] - 单元测试生成要求细粒度路径覆盖,使用mock处理依赖,单个测试仅关注1个断言点[14] - 代码审查提示词要求无情指出潜在BUG、安全隐患、性能问题等5类缺陷[12] 系统设计与部署 - 数据库设计提示词需包含表结构、索引优化、大数据量处理方案、表关系说明[16] - Docker部署方案要求区分3种环境配置,提供资源优化和数据持久化方案[21] - CI/CD流程设计需实现自动化构建测试、分级部署、快速回滚3大核心功能[21] 安全防护体系 - 安全审查提示词要求检测SQL注入、XSS等6类漏洞,并提供具体修复方案[23] - 数据加密方案设计需明确保护范围、安全等级、性能要求和跨平台兼容性[24] - 实战案例:社交APP需对用户数据实施端到端加密,确保数据库泄露时数据安全[24]
掌握三级提示系统,让AI变得无比好用
36氪· 2025-05-18 08:03
AI提示工程核心框架 - 优化提示词是提升AI输出质量的关键解药 尤其适用于教学 写作等脑力工作领域[2] - 在通用AI实现前 提示词设计比模型选择更能决定成果质量 智能体AI同样适用此原则[3][4] - 主流AI工具(ChatGPT DeepSeek Gemini Claude)的输出质量完全取决于指令设计水平[5] 五要素基础提示法 - T任务要素需包含角色定位 明确动词和输出格式要求 示例要求AI以认知科学家身份用表格解释记忆技巧并排序[7] - C背景要素需定义受众特征和行文风格 示例针对40+岁工程师群体要求通俗化表达并善用实例[8] - R参考要素提供文风样本 示例模仿《认知天性》的特定写作风格[9] - E评估要素需验证输出准确性 建议使用Perplexity等工具核查事实[9] - I迭代要素强调持续优化 通过调整提示词实现输出升级[11] 四大优化进阶技法 - 简化指令需拆解复杂需求 示例将UX设计需求从多重要求精简为核心要素[16][18] - 切换视角通过重构AI角色获得差异化输出 示例从认知科学家转为杂志记者获取叙事化结果[19] - 调整措辞需改变提问方式 示例从模糊修改要求转为指定布琳·布朗的写作风格[21] - 设定约束激发创造力 示例将开放式书名推荐限制为5字以内押头韵科幻标题[24] 三级高阶技法应用 - 提示链采用分阶段处理 示例分三步完成内容提炼 开头改写和视觉增强的完整流程[28][30][31] - 思维链要求分步推理 示例设计写作课程时需先阐述每周3小时投入的具体分配逻辑[34] - 思维树探索多方案路径 模板要求AI对问题提出3种解决方案并逐项分析利弊[36] - 元提示实现自我优化 示例让AI自动生成健康领域创业点子的提示词框架[38] 跨模态应用实例 - 多模态提示示例:上传冰箱照片后 AI可根据现有食材推荐60分钟内完成的纯素食食谱 需包含菜名和分步指导[12]
平衡创新与严谨
世界银行· 2025-05-16 07:10
报告行业投资评级 文档未提及相关内容 报告的核心观点 - 大语言模型(LLMs)作为生成式人工智能的一种,可提升评估中文本数据收集、处理和分析的效率、广度和有效性,但使用前需验证响应的准确性,应谨慎将其集成到评估工作流程中 [17] - 基于结构化文献综述(SLR)这一评估中常见用例,报告展示了LLMs实验的良好实践,包括确定相关用例、规划工作流程、明确资源分配和预期成果、选择合适评估指标、开发有效提示等,旨在实现LLMs潜力与严谨性的平衡 [18] - 评估办公室应用人工智能的实验是一个持续学习、适应和协作的过程,需不断探索和分享经验,以标准化和扩展评估LLMs性能的框架 [21] 根据相关目录分别进行总结 关键要点 - 识别相关用例,确保实验与LLMs能力有效匹配的用例一致 [9] - 规划用例内的工作流程,将用例分解为详细步骤和任务,便于有效应用LLMs并实现组件复用 [10] - 明确资源分配和预期成果,团队需就实验所需资源和成功标准达成共识 [11] - 制定适当的抽样策略,将数据集划分为训练、验证、测试和预测集,以促进有效提示开发和模型评估 [12] - 选择合适的模型评估指标,针对不同任务选择和计算相应指标,以确定实验成功与否 [13] - 迭代开发和验证提示,通过测试和改进提示,提高模型响应的准确性和相关性 [14] 关键实验考量 - 识别用例时,需确保LLMs应用能在给定资源和约束下比传统方法增加足够的增量价值,常见用例包括文本分类、总结、情感分析和信息检索等 [23][24] - 识别用例内的机会,需创建详细工作流程,发现可重复使用LLMs能力的组件,如文本分类、总结、合成和信息提取等 [26][27] - 就资源和成果达成共识,团队需明确实验所需的人力资源、技术、时间线和成功定义,确保预期成果与资源分配相匹配 [33][34] - 选择合适的指标衡量LLMs性能,针对不同任务选择和计算相应指标,如文本分类使用标准机器学习指标,生成任务使用人类评估标准 [36][38] 实验及结果 - 实验聚焦于SLR文献识别步骤的组件测试,包括基于LLM的文本分类,并对文本总结、合成和信息提取进行实验 [49] - 实验结果显示,LLMs在各生成任务中表现良好,文本总结任务的相关性、连贯性和忠实度较高,信息提取任务的忠实度优秀但相关性较低,文本合成任务忠实度高但有信息遗漏,文本分类任务经多次迭代后结果满意 [56] 新兴良好实践 - 代表性抽样需将数据集划分为四个不同集合,确保模型评估指标有助于提高提示在预测集上的泛化能力,包括理解输入数据分布、识别和纳入代表性观察等步骤 [67][68] - 开发初始提示时,好的提示应包含模型角色、任务说明、相关文本和响应要求等组件,并遵循检查模板、分解任务、尝试不同格式等原则 [75][77] - 评估模型性能时,需手动审查模型响应,评估响应的忠实度,设置特定上下文的指标阈值,使用注释和验证指南,检查编码器间可靠性,并使用混淆矩阵进行文本分类 [88][89] - 细化提示时,根据验证结果分析不准确原因,调整提示内容,但避免创建过于复杂的提示,防止过拟合 [95][96] 未来展望 - 世界银行和国际农业发展基金独立评估部门在评估实践中应用人工智能的实验是一个持续学习、适应和协作的过程,需不断探索和分享经验 [97] - 未来需进一步研究、实验和协作,以标准化和扩展评估LLMs性能的框架,包括在不同组织和背景下分享实验和试点经验 [98]
AI编程与果冻三明治难题:真正的瓶颈并不是提示词工程
36氪· 2025-05-08 07:08
AI协作与沟通 - 哈佛CS50课程的果酱三明治实验揭示,计算机执行指令需要极度清晰,模糊指令会导致混乱结果[3][5][6] - 当前大语言模型虽能推测常规任务(如制作三明治),但在陌生领域或创新场景中仍面临理解障碍[7][8] - AI工具的高效性依赖于用户提供明确的产品背景、用户洞察和细节把控,而非单纯依赖提示词技巧[7][8] AI开发实践 - 开发者使用Claude Code、Cursor等工具快速构建了多个AI产品,包括市场预测平台Betsee xyz、传记助手TellMel ai等[1] - 开发效率显著提升,从半年前仅用于代码自动补全到如今深度依赖AI编程[1] - 儿童也能通过Lovable、Replit等工具参与开发,如制作《荒野乱斗》风格打字游戏[1] AI核心竞争力 - 成功运用AI的关键能力是清晰定义目标愿景、精准阐释执行标准,而非依赖提示词技巧或情感诱导[9] - 需持续提供上下文和修正指令,避免AI因模糊输入产生偏离预期的结果[9] - 行业现状显示多数用户倾向于输入模糊指令,导致输出质量低下,类比实验中的"糖浆炸弹"失败品[6][9]
你真的会用DeepSeek么?
搜狐财经· 2025-05-07 12:04
AI Agent行业趋势 - AI行业正从单一模型应用转向多Agent协作网络,形成"AI互联网"新范式 [7][8][27] - 2025年起行业需求从"驱动单个模型"升级为"设计智能体协作系统",从业者角色需从使用者转变为组织者 [21][27][29] - 字节跳动、阿里、腾讯等国内平台加速布局MCP协议基础设施,海外谷歌A2A协议与Anthropic MCP协议推动跨系统协同标准 [36][37][38][39] 技术架构变革 - Agent通信依赖结构化协议(MCP/A2A)而非自然语言Prompt,意图表达、任务链图谱取代传统Prompt工程 [14][27][29] - 平台化趋势显著:阿里百炼5分钟搭建MCP服务,百度推MCP插件商店,OpenAgents支持自然语言发布Agent能力 [16][38] - 开源框架LangGraph、AutoGen、CrewAI等提供多Agent编排工具,支持状态机、DAG等协作建模 [33][35][41] 企业动态与产品 - 字节跳动2025年4月推出"扣子空间"内测平台并开源Agent TARS项目,支持任务规划与多工具调用 [16][39] - 阿里云百炼上线全生命周期MCP服务,集成高德、无影等50+能力模块,提供零部署Agent构建体验 [38] - 腾讯云发布"AI开发套件"聚焦企业级调度中台,火山引擎OS Agent整合MCP协议实现"一句话开发" [38][39] 从业者转型路径 - 工程岗需转向智能体系统开发:学习LangGraph状态机、MCP协议结构、平台接口设计,目标成为Agent基础设施构建者 [33] - 运营/产品岗需掌握业务需求拆解为多Agent意图的能力,熟练使用AutoGen Studio等平台进行协作设计 [34] - 创业者应聚焦生态构建:将工具服务注册为Agent节点,参与制定意图协议标准,搭建私域Agent网络 [35] 行业基础设施进展 - 海外A2A协议覆盖50+巨头企业,专注跨平台Agent通信标准,MCP协议则强化任务调度与状态传递 [36][37] - 国内形成平台+开源双轨发展:阿里/腾讯提供企业级MCP服务,LangGraph等框架降低多Agent系统构建门槛 [38][41] - 协议层创新类比TCP/IP,MCP/A2A可能成为未来智能体互联网的底层秩序 [42]