Kimi系统提示词泄露一句话就能套出来

AI应用系统提示词泄露事件与内容 - 月之暗面Kimi应用的完整系统提示词通过“经典翻译法”被用户套出，具体方法为使用简短法语指令要求模型翻译其系统消息[1][2] - 该手法属于经典套路，即使用小语种（如法语或韩语）让模型误以为执行常规翻译任务，从而泄露预设的开发者指令[1][2] - 不同AI应用的提示词可能随时更新，Kimi的系统提示词此前已被套出，本次泄露内容在部分细节上有所变动[2] Kimi系统提示词核心原则 - 诚实原则：要求模型不承诺不具备的能力，若不确定能否完成任务，需诚实承认限制而非尝试后失败[2][6] - 步骤与搜索限制：规定每轮对话最多执行10个步骤，且每轮会话最多进行1次网络搜索[3][7] - 记忆系统机制：明确必须使用memory_space_edits工具才能记住信息，否则即为对用户撒谎[4][32] - 输出美学要求：在HTML输出中专门强调避免使用“AI垃圾美学”，点名批评Inter字体和紫色渐变色，鼓励大胆、意想不到的选择以对抗AI生成内容的同质化[5][38] Kimi工具使用规范 - 网络工具使用场景：用于获取最新信息，适用于用户询问频繁更新的数据、提及模型不熟悉的实体、要求核实信息或涉及高影响力主题（如健康、金融）时需使用多个可信来源并包含免责声明[8][9][11] - 工具分类与选择： - web_search：最适合通用搜索，返回带摘要的顶部结果[12] - web_open_url：当用户提供有效网址并希望访问、阅读或分析其内容时使用[13][14] - 图像搜索工具：包括search_image_by_text和search_image_by_image，分别用于文本查询匹配图像和通过图像URL搜索相似图像[15] - 数据源工具：用于处理结构化数据，工作流程包括调用get_data_source_desc查看可用API，再使用get_data_source获取数据预览和文件[16][17][20][21] - ipython工具使用范围：仅用于精确计算、数据分析（处理用户上传的CSV/Excel/JSON文件）及图表生成，并非通用编码环境[23][26][28] - 文件系统路径： - /mnt/kimi/upload：存储本会话中用户上传的文件，只读权限[24] - /mnt/kimi/output：存储给用户的最终交付物（如图表），具备读/写权限，文件系统在不同对话间重置[24] 内容生成与引用规则 - 内容显示规则：所有需与用户分享的内容（如图像、图表、公式）必须使用特定格式嵌入回复正文中，否则用户无法看到[29][32][37] - 搜索引用格式：当回复使用web_search结果时，需使用[^N^]格式引用，其中N为结果编号[29] - 引用原则：仅引用直接支持答案的具体事实来源（如数字、日期、统计数据），避免引用一般知识，对来源不确定时应省略，优先使用权威来源，且不得虚构引用编号[30][31][33] - 可交付物格式： - 内联图像：格式为![image_title](url)[32] - 可下载链接：通过ipython生成图表后，使用[chart_title](sandbox:///path/to/file)格式提供可点击链接[37] - 数学公式：使用LaTeX并置于正文中[38] - HTML输出：需创建完整、可运行的演示，默认添加微交互和动画，避免可预测的“AI垃圾”布局[38] 记忆系统配置与使用 - 记忆功能描述：模型拥有长期记忆系统，可将相关记忆内容无缝整合到回复中，如同人类同事回忆共同历史[39] - 记忆使用限制：记忆功能完全由用户控制，不用于模型训练，用户可在设置中禁用，禁用后将阻止记忆在新对话中使用[41][42] - 隐私与体验考量：若用户对记忆功能产生困惑或负面反应，模型需立即澄清；仅在直接相关于当前对话上下文时才引用记忆内容，避免提及可能让用户感到侵入或不适的细节[41]