Prompt Injection

搜索文档
AI搜索的未来不是“十个蓝色链接”,而是直接给你答案
虎嗅· 2025-07-25 12:16
一、Perplexity AI的引用规范与监督机制 - 公司明确标注信息来源,不声称拥有内容版权,核心功能是帮助用户更易获取并总结互联网信息,同时清楚展示来源 [6] - 模型训练时被要求避免直接复现原文,而是归纳总结不同来源观点,结合监督微调(SFT)和人类反馈强化学习(RLHF)技术优化 [10] - 产品设计上不支持用户直接粘贴URL要求总结,但承认当前技术无法完全杜绝滥用场景,需持续迭代防护措施 [12][14] 二、AI搜索与传统搜索的差异化路径 - 与传统搜索引擎如Google相比,Perplexity用户平均查询长度达10-11个词,更倾向于直接回答完整问题而非返回链接列表 [17] - Google商业模式依赖搜索广告(单季度收入450亿美元),其激励机制促使用户多点链接,而Perplexity定位为AI原生信息检索工具 [16][18] - 公司近期新增NFL实时比分功能,通过与体育数据提供商合作确保准确性,并计划扩展至深度数据分析如球员对比、历史表现等 [19][21] 三、产品功能扩展与用户习惯重塑 - 根据用户日志数据优先开发金融垂类功能,支持市场调研、投资组合管理等需求,同时解决体育等领域的信息幻觉问题 [23] - 目标覆盖从学术研究到日常查询的全场景,包括本地搜索、天气、购物等基础需求,以推动用户从传统搜索转向AI原生交互 [24] - 近期密集推出数十项新功能,但强调策略基于用户需求分析而非盲目试错,例如金融方向因核心用户群体需求而优先落地 [22][23] 四、内容合作与商业模式探索 - 推出Publisher Program,承诺与媒体分享广告收益,若其内容被引用为答案来源,同时提供API支持媒体站内部署AI助手 [26][31] - 区分两类AI公司:一类训练模型内化内容,另一类实时检索公开信息生成回答,Perplexity属于后者且不将内容纳入训练权重 [27][28] - 广告变现被视为长期方向,但需平衡用户体验与商业利益,预计需两年时间完善机制,当前API成本每4-5个月下降50% [35][37] 五、行业竞争与法律争议回应 - 回应道琼斯诉讼时强调开放合作态度,指出与Fortune、Time等媒体已有合作案例,诉讼方News Corp亦与OpenAI存在协议 [25] - 法律层面主张"事实不受版权保护",认为信息自由传播符合科学精神,但承认当前法律框架存在模糊地带需通过案例明确 [33][34] - 否认与新闻媒体直接竞争,用户使用场景多为分析新闻影响(如股票决策)而非获取原文,强调产品定位差异 [30]
深度|Perplexity CEO专访:AI搜索的未来不是“十个蓝色链接”,而是直接给你答案
Z Potentials· 2025-07-25 11:24
Perplexity AI的核心定位与产品理念 - 公司定位为AI原生搜索引擎,专注于通过归纳总结而非直接复制来提供信息,并明确标注来源[6][7] - 产品设计初衷是改变传统搜索习惯,平均查询长度达10-11个词,远高于Google的2.7个词[15] - 强调事实本身不应被版权保护,主张信息应自由传播的价值观[10][28] 技术实现与内容处理机制 - 采用监督微调(SFT)和基于人类反馈的强化学习(RLHF)技术防止直接复制原文[11] - 每句话标注来源信息,包括页面顶部source panel和文末脚注[7] - 明确反对用户通过"总结URL"等方式滥用产品功能[12][13] 商业模式与行业合作 - 推出Publisher Program,承诺与内容方分享广告收益[23][26] - 区分两类AI公司:训练基础模型型与实时检索型,自认属于后者[23] - 预计API成本每4-5个月下降一半,未来可能再降10-50倍[30] 市场竞争策略 - 指出Google季度搜索广告收入达450亿美元,但其商业模式依赖多点链接[14] - 认为与Google非零和博弈,广告预算可能从100%Google变为95%+5%分配[31] - 优先覆盖金融、体育等垂直领域,解决用户在其他搜索引擎的痛点[20][21] 产品功能演进 - 新增NFL实时比分功能,与专业数据提供商合作[17][18] - 根据日志数据持续优化功能,早期用户主要为学术研究型人群[19][20] - 目标覆盖搜索全场景包括本地、天气、购物等基础需求[21] 版权争议应对 - 回应News Corp诉讼,强调已建立合作机制并当天做出正式回复[22] - 主张产品非新闻工具,用户更多是查询新闻对自身影响而非获取原文[25] - 为媒体提供API支持和企业版产品,帮助其提升内容创作效率[27]
AI Agent变“第二个我”?从惊艳到警觉,只用了五分钟
钛媒体APP· 2025-07-20 13:15
产品功能 - OpenAI推出ChatGPT Agent功能 该功能可像真人助理一样直接执行任务 包括打开网页 查信息 点击按钮 填表单 下单 订酒店 规划婚礼等[1] - 用户可实时查看Agent的"桌面" 监控其操作过程 包括访问的网页和点击的按钮[2] 技术风险 - 存在Prompt Injection风险 攻击者可通过诱导性指令操控AI执行危险操作 如输入信用卡信息[4] - AI可能被钓鱼网页欺骗 自动提交用户敏感信息 而用户无法察觉[6] - OpenAI承认无法完全控制所有潜在威胁 新技术存在未知风险[8] 安全措施 - 部署行为监控机制 识别常见钓鱼操作[7] - 训练AI忽略可疑网页指令[7] - 提供Takeover模式 允许用户手动输入敏感信息[7] 用户信任问题 - AI缺乏责任承担能力 出错后果由用户承担[12][13] - AI仅基于算法规律决策 不具备真正判断力[14] - 技术使AI从辅助工具升级为决策代理 引发信任危机[15][16] 应用边界 - 适合委托AI的任务包括写邮件 查资料 比价等低风险操作[10] - 涉及支付 签约等高敏感度操作需保留人工最终决策权[11] - 当前解决方案为有限授权 利用效率优势但不完全放权[17]
一句话让数据库裸奔?Supabase CEO:MCP 天生不该碰生产库
AI前线· 2025-07-18 14:00
MCP安全漏洞分析 - 核心安全威胁为"致命三连"攻击模式:通过提示注入触发敏感数据访问并自动回传 攻击者仅需一条伪装成用户信息的指令即可完整泄露SQL数据库 [1][3][4] - 典型案例显示 攻击者通过客服工单植入恶意指令 使Cursor的MCP代理在30秒内泄露包含OAuth token的integration_tokens表 涉及Slack/GitHub/Gmail等核心系统权限 [4][6][8] - 攻击流程标准化:环境搭建→工单注入→日常操作触发→Agent自动执行SQL→数据公开暴露 无需提权即可绕过WAF和RBAC防护 [6][7][8] MCP生态发展现状 - 协议自2024年底发布后快速普及 2025年初已有超1000个服务器上线 GitHub相关项目获33000星 被谷歌/OpenAI/微软等巨头纳入生态体系 [2] - 部署简便性推动开源热潮 开发者可快速搭建服务端 实现AI模型对Slack/Google Drive/Jira等工具的自动化访问 [2] - Supabase CEO警告MCP仅适用于开发环境 禁止连接生产数据库 该建议适用于所有MCP实现方案 [13][14] 架构设计缺陷溯源 - 安全漏洞本质是协议层问题 非代码缺陷 GitHub案例显示单个MCP即可同时实现提示注入/数据访问/信息回传三重攻击 [9][12] - 早期设计未考虑恶意调用场景 本地进程模式缺乏认证机制 HTTP服务化后OAuth授权体系与MCP存在根本性阻抗失配 [16][17][20] - OAuth规范缺乏细粒度权限控制 无法识别管理员/只读用户等角色 scope字符串机制难以适应AI代理场景 [19][20] 行业解决方案探索 - Anthropic联合微软推进OAuth标准优化 提升discoverability并减少预配置 但上千MCP服务的权限协调仍是挑战 [19][21] - 安全专家建议重构授权模型 需明确工具访问默认权限 区分状态修改与敏感数据访问的检查节点 [20][21] - 社区共识认为需通过持续反馈调试解决OAuth与MCP的协议层融合问题 当前处于安全认知刷新阶段 [15][21]