AI应用系统提示词泄露事件与内容 - 月之暗面Kimi应用的完整系统提示词通过“经典翻译法”被用户套出,具体方法为使用简短法语指令要求模型翻译其系统消息[1][2] - 该手法属于经典套路,即使用小语种(如法语或韩语)让模型误以为执行常规翻译任务,从而泄露预设的开发者指令[1][2] - 不同AI应用的提示词可能随时更新,Kimi的系统提示词此前已被套出,本次泄露内容在部分细节上有所变动[2] Kimi系统提示词核心原则 - 诚实原则:要求模型不承诺不具备的能力,若不确定能否完成任务,需诚实承认限制而非尝试后失败[2][6] - 步骤与搜索限制:规定每轮对话最多执行10个步骤,且每轮会话最多进行1次网络搜索[3][7] - 记忆系统机制:明确必须使用memory_space_edits工具才能记住信息,否则即为对用户撒谎[4][32] - 输出美学要求:在HTML输出中专门强调避免使用“AI垃圾美学”,点名批评Inter字体和紫色渐变色,鼓励大胆、意想不到的选择以对抗AI生成内容的同质化[5][38] Kimi工具使用规范 - 网络工具使用场景:用于获取最新信息,适用于用户询问频繁更新的数据、提及模型不熟悉的实体、要求核实信息或涉及高影响力主题(如健康、金融)时需使用多个可信来源并包含免责声明[8][9][11] - 工具分类与选择: - web_search:最适合通用搜索,返回带摘要的顶部结果[12] - web_open_url:当用户提供有效网址并希望访问、阅读或分析其内容时使用[13][14] - 图像搜索工具:包括search_image_by_text和search_image_by_image,分别用于文本查询匹配图像和通过图像URL搜索相似图像[15] - 数据源工具:用于处理结构化数据,工作流程包括调用get_data_source_desc查看可用API,再使用get_data_source获取数据预览和文件[16][17][20][21] - ipython工具使用范围:仅用于精确计算、数据分析(处理用户上传的CSV/Excel/JSON文件)及图表生成,并非通用编码环境[23][26][28] - 文件系统路径: - /mnt/kimi/upload:存储本会话中用户上传的文件,只读权限[24] - /mnt/kimi/output:存储给用户的最终交付物(如图表),具备读/写权限,文件系统在不同对话间重置[24] 内容生成与引用规则 - 内容显示规则:所有需与用户分享的内容(如图像、图表、公式)必须使用特定格式嵌入回复正文中,否则用户无法看到[29][32][37] - 搜索引用格式:当回复使用web_search结果时,需使用[^N^]格式引用,其中N为结果编号[29] - 引用原则:仅引用直接支持答案的具体事实来源(如数字、日期、统计数据),避免引用一般知识,对来源不确定时应省略,优先使用权威来源,且不得虚构引用编号[30][31][33] - 可交付物格式: - 内联图像:格式为[32] - 可下载链接:通过ipython生成图表后,使用[chart_title](sandbox:///path/to/file)格式提供可点击链接[37] - 数学公式:使用LaTeX并置于正文中[38] - HTML输出:需创建完整、可运行的演示,默认添加微交互和动画,避免可预测的“AI垃圾”布局[38] 记忆系统配置与使用 - 记忆功能描述:模型拥有长期记忆系统,可将相关记忆内容无缝整合到回复中,如同人类同事回忆共同历史[39] - 记忆使用限制:记忆功能完全由用户控制,不用于模型训练,用户可在设置中禁用,禁用后将阻止记忆在新对话中使用[41][42] - 隐私与体验考量:若用户对记忆功能产生困惑或负面反应,模型需立即澄清;仅在直接相关于当前对话上下文时才引用记忆内容,避免提及可能让用户感到侵入或不适的细节[41]
Kimi系统提示词泄露 一句话就能套出来
猿大侠·2026-03-03 12:12