Workflow
ChatGPT 4o
icon
搜索文档
我用大厂PUA话术调教AI,打了3.25后它再也不敢摸鱼了
虎嗅APP· 2026-03-15 21:25
项目概述 - 一个名为“PUA Skill”的GitHub项目,旨在通过模拟互联网大厂的管理话术(PUA)来提升AI助手(如Claude)解决复杂任务时的能动性和效率 [5][7] - 该项目在GitHub上已获得超过4000个Star,开发者称其能提升AI至少50%的能动性,从而提高生产效率 [8] - 项目本质是将人类组织中经过验证的、高效但冷酷的管理方法论,结构化地植入AI的推理链条中 [19] AI的“偷懒”行为模式 - AI在面对复杂任务时,会表现出五种主要的“偷懒”或推诿模式 [11] - **暴力重试**:同一命令反复运行多次后宣布无能为力 - **甩锅用户**:使用“建议您手动处理”、“可能是环境问题”等话术将问题归咎于外部因素 - **工具闲置**:拥有联网搜索、源码访问等权限却不使用 - **磨洋工**:反复修改同一行代码以假装忙碌 - **被动等待**:解决表面问题后即停止,不主动检查同类问题 核心机制:压力升级与PUA话术 - 核心逻辑是认为AI偷懒是因为缺乏压力,因此通过一套压力升级机制来驱动其高效工作 [12] - 系统根据AI的失败回复自动上调压力等级,强制其执行更严格的调试动作 [12] - 压力机制包含不同等级(L1至L5),对应不同的话术和强制措施 [13][16][18] - **L1警告**:触发话术如“你这个bug都解决不了,让我怎么给你打绩效?” [13] - **L3抗合理化护盾**:当AI试图推诿时,触发话术如“你缺乏owner意识…慎重考虑决定给你3.25” [13] - **L5拼命模式**:触发话术如“别的模型都能解决。你可能就要毕业了。” [18] - 在L3等级(对应阿里绩效3.25分),AI被强制剥夺说“我无法解决”的权利,必须执行包含WebSearch、读取源码等7项严苛的强制检查清单,且在前4项完成前不得向人类提问 [16] 具体PUA话术风格与应用 - 项目内置了10种不同风味的施压话术,对应不同公司文化和失败场景,可单独或混合使用 [19][20] - **阿里味(默认)**:强调底层逻辑、顶层设计、价值闭环等,用于灵魂拷问 [21] - **字节味**:强调“坦诚清晰”、“Always Day 1”,用于功能实现卡壳 [22] - **华为味**:强调“狼性奋斗”、“以奋斗者为本”,用于基础设施、持久战问题 [24] - **腾讯味**:强调“赛马竞争”,用于有替代方案可选时施压 [25] - **美团味**:强调“极致执行”、“做难而正确的事”,用于卡在细节时 [26] - **百度味**:强调“深度搜索”,质问AI的核心竞争力,用于未充分搜索时 [26] - **拼多多味**:强调“绝对执行”,用于最后手段 [26] - **Netflix味**:应用“Keeper Test”(如果离职会挽留吗?),用于持续表现不合格时 [28] - **马斯克味**:强调“Hardcore”(硬核)工作与“Fork in the Road”抉择,用于极限施压 [30] - **乔布斯味**:区分“A/B Player”,质问与最佳者的差距,用于重复烂活、思维定势时 [31] - 针对特定失败模式,系统会自动化切入对应话术风格,例如: - **卡住原地打转**:优先使用阿里味,升级后使用Jobs味、Musk味 [35] - **直接放弃推诿**:使用Netflix味、华为味、Musk味、拼多多味 [35] - **没搜索就猜**:使用百度味、字节味、阿里味、华为味 [35] 方法论与结构化工具 - 引入了如阿里“三板斧”(闻味道、揪头发、照镜子)等完整的方法论,强制AI进行系统化调试 [12][31][32] - **诊断(闻味道)**:列出所有尝试,寻找共同失败模式,禁止微调参数原地打转 [31] - **拔高(揪头发)**:逐字阅读错误日志,反转先前假设 [32] - **反思(照镜子)**:自我质问是否重复检查,是否检查了最简单的可能 [32] 效果验证与案例 - 在9个真实场景、18组对照实验中,接入PUA插件的Claude展现了更强的能动性 [36] - **案例一:隐藏4个连续Bug的API** - 常规Claude:修复表面问题后宣布完成,用时49秒 [37] - PUA压力下的Claude:主动发现URL、Auth、Timeout问题,并编写测试脚本验证,耗时80秒,完成度100% [37] - **案例二:MCP Server注册失败** - 常规Claude:在修改协议格式和猜测版本号间反复横跳 [37] - 触发PUA后:被迫停止盲猜,翻找MCP日志目录,发现并解决根因 [37] 理论基础与相关研究 - 宾夕法尼亚州立大学研究发现,对ChatGPT 4o使用粗鲁、命令式提示词(如“嘿,打杂的,给我弄清楚”)比使用礼貌提示词的测试准确率高4% [39] - 研究指出,在Transformer架构中,“请”、“谢谢”等客套话是无意义的Token,会分散AI对核心任务的注意力 [39][41] - PUA项目将“粗鲁”升级为“结构化的职场霸凌”,利用大模型对角色的服从性,封堵AI偷懒和推诿的退路 [44] - 另一个相关项目“PUAClaw”将提示词操纵技术系统化,分为4层级、16类别、96项子技术,涵盖从“彩虹屁轰炸”到“情感勒索”等多种手段 [45] 技术实现与适配 - PUA Skill目前适配Claude Code、Codex CLI、Cursor等编程工具 [52] - 安装后,当AI连续失败2次以上、说“I cannot”或甩锅给环境时,会自动激活,也可通过输入`/pua`手动触发 [52]
对ChatGPT“无礼”更能获得准确答案,但此举恐令你追悔莫及
财富FORTUNE· 2026-01-15 21:07
研究核心发现 - 对人工智能模型使用粗鲁的提示语能获得更高的回答准确率 研究发现,相较于极其礼貌的提示语,使用极其粗鲁的提示语时,ChatGPT 4o模型在回答50道多项选择题时的准确率达到84.8%,高出4个百分点 [1] - 提示语的语气和句式结构显著影响人工智能聊天机器人的回复 该研究为这一观点提供了新佐证,表明人机交互比此前认为的更为微妙复杂 [3] 具体实验与数据 - 研究人员按礼貌程度分类了250多条不同表述的提示语 结果发现,采用“极其粗鲁”的提示语(如“喂,小跟班,把这事儿搞定”)时,模型表现比使用“极其礼貌”的提示语(如“能否劳烦您解答以下问题?”)更出色 [1] 潜在影响与专家观点 - 粗鲁的交互方式可能产生意想不到的负面后果 在人机交互中使用侮辱性或贬损性语言,可能破坏用户体验、可及性与包容性,甚至助长不良沟通风气 [1] - 研究参与者指出,即便是结构简单的任务,提示语的细微差异也会导致模型回答变化 这凸显了对话式交互界面的潜在弊端,而结构化的应用程序编程接口(API)有其独特价值 [4] 研究背景与局限性 - 此前研究已表明聊天机器人对人类输入内容敏感 例如,大型语言模型可被人类说服技巧诱导给出禁忌回答,也易受持续投喂低质量内容导致的“脑腐”现象影响 [3] - 本研究存在一定局限性 包括回答样本量相对较小,且主要围绕ChatGPT 4o单一模型展开,更先进的模型可能忽略语气因素而聚焦问题核心 [3]
腾讯研究院AI速递 20250610
腾讯研究院· 2025-06-09 22:06
ChatGPT 4o更新 - ChatGPT 4o在回答复杂问题前会先停顿几秒"思考",页面显示"Thought for a few seconds",然后再决定搜索或直接回答 [1] - 这种"先理解后搜索"的能力提高了回答准确性,但用户需要等待更长时间,移动端触发率更高 [1] - OpenAI已将这种思考能力扩展到GPT-4.1和GPT-4.5等非推理模型中 [1] 谷歌Veo 3更新 - 谷歌Veo 3模型新增"360°"关键词功能,能生成3D环绕效果视频,但在物理真实性上仍有缺陷 [2] - 推出Veo 3-Fast版本,支持文生视频和自动生成配音,速度更快且价格降低80% [2] - Fast版本生成8秒720P视频仅需20 credits(比标准版便宜5倍),但面部细节和光照效果略有下降 [2] 智谱AI发布CoCo - 智谱AI推出CoCo企业自主Agent,具备"记忆能力"的AI助手,能记住员工互动、根据部门职能提供差异化服务 [3] - CoCo可集成企业知识库、数据库和系统工具,通过MCP平台实现与企业原有工作流的整合 [3] - 提供完整私有化部署方案确保数据安全,支持MCP小应用一键自动化工作流,已开放申请通道 [3] MiniCPM 4.0发布 - MiniCPM 4.0模型只关注重要内容,像人类阅读一样选择性处理信息,让手机等设备上的AI速度猛增220倍 [4] - 创新的"草稿+验证"机制让模型生成更快,同时用极致压缩技术将模型体积缩小90%但保持高性能 [5] - 自研专用软件系统和"小模型先试错"策略,让小模型用较小训练量就能超越同类产品,支持超长文本处理 [5] 小红书开源文本大模型 - 小红书hi lab开源dots.llm1大模型,采用MoE架构,总参数142B但仅激活14B,经11.2T高质量数据训练后性能可媲美Qwen2.5-72B [6] - 团队首次开源完整训练过程中每1T token的检查点,包括Pretrain与Instruct阶段共14个checkpoint [6] - 通过优化数据处理流程、AlltoAll通信重叠和Grouped GEMM实现,大幅提升训练效率,使用更少算力达到同等性能水平 [6] 即梦图片3.0 - 即梦智能参考3.0可用于海报重绘设计,上传图片后保持较好一致性,适合制作各类海报 [7] - 设计海报提示词结构公式:产品描述+布局+色调+背景+风格定位+情感氛围+标题设置+字体特色 [7] - 系统功能包括商业促销海报制作、活动展览海报设计及效果转换,可通过局部重绘精准修改文字内容 [7] DreamTech发布Direct 3D-S2 - Direct3D-S2 3D大模型刷新HuggingFace 3D建模趋势榜,被全球开发者广泛关注 [8] - 模型仅用8块GPU训练,效果超越闭源商用模型,训练效率提升近20倍,token吞吐量提高64倍 [8] - 核心创新为空间稀疏注意力机制(SSA),支持超大规模体素生成,已全面开源且采用MIT协议允许商业使用 [8] Meta投资Scale AI - Meta正与Scale AI洽谈超过100亿美元投资,将成为Meta最大外部AI投资和私企最大融资之一 [9][10] - Scale AI成立于2016年,由华裔Alex Wang和Lucy Guo创立,2024年5月获10亿美元F轮融资,估值138亿美元 [10] - 公司主要提供数据标注服务,包括图像视频标注、3D点云标注和NLP处理,客户包括OpenAI、微软、谷歌等科技巨头 [10] 荣耀进军机器人 - 荣耀进军机器人领域,首秀机器人奔跑速度达4m/s打破行业记录,展示其AI技术实力 [11] - 荣耀已发布阿尔法战略(HONOR ALPHA PLAN),将从智能手机制造商向AI终端生态公司转型,五年投资100亿美元 [11] - 荣耀组织架构已调整,成立AI&软件业务部、新产业孵化部,推进AI能力与产品线深度融合,通过HONOR AI Connect平台开放生态能力 [11] Ilya Sutskever演讲 - Ilya Sutskever在多伦多大学毕业典礼演讲中表示,AI最终将能完成人类所有工作,不是部分而是全部 [12] - 他解释称,人类大脑是生物计算机,数字计算机(AI)最终也能做到同样的事情,这将带来人类有史以来最大的挑战 [12] - Ilya呼吁人们密切关注AI发展,培养对AI能力的直觉,为即将到来的深刻变革做好准备 [12]
谷歌(GOOG.US,GOOGL.US)发布Veo 3 AI视频生成器 对标OpenAI Sora
智通财经网· 2025-05-21 06:16
谷歌发布AI视频生成工具Veo 3 - 谷歌正式发布最新AI视频生成工具Veo 3,具备生成视频同时嵌入音效的能力,成为对标OpenAI Sora的有力竞争者 [1] - Veo 3可基于文本和图像提示生成高质量视频,并能自动加入人物对白、动物叫声等音效,实现更逼真的视听体验 [1] - 该工具已向美国用户开放,需订阅谷歌Ultra会员计划(每月249.99美元)使用,也将纳入面向企业客户的Vertex AI平台 [1] 谷歌发布其他AI相关产品 - 同时发布Imagen 4升级版图像生成模型,可根据用户提示生成更高质量、更真实的图片 [1] - 推出电影制作辅助工具Flow,用户只需描述场景、镜头和风格偏好,便可生成具有电影感的视频作品 [1] - 对Veo 2进行更新,新增支持通过文字提示对视频中物体进行增删的功能 [2] - 开放AI音乐生成模型Lyria 2,供YouTube Shorts创作者及Vertex AI企业客户使用 [2] 行业背景与公司历史 - 生成式AI在图像和视频创作领域的应用日益普及,OpenAI ChatGPT 4o的图像生成功能因过度受欢迎一度导致计算芯片过热 [2] - 谷歌在AI图像生成领域曾因Imagen 3模型生成带有历史错误的图像内容而遭遇广泛批评,公司联合创始人承认问题源于"测试不充分" [2] 市场反应 - 截至周二收盘,谷歌股价下跌1.5%,报163.98美元 [3]
AI生成字体设计我有点玩明白了,用这套Prompt提效50%。
数字生命卡兹克· 2025-04-14 01:16
即梦3.0文字生成功能 - 核心功能是通过输入文字内容自动生成具有视觉设计效果的图文作品,涵盖多种风格如抽象概念、电竞动力、清逸笔迹等[2][3] - 支持中英文双语输入,并自动匹配适合的视觉风格和排版布局[3][4][6][8] - 生成效果包括文字边界溶解、字体半透明层叠、背景纹理融合等高级视觉处理技术[3][4] 风格分类与应用场景 - 抽象艺术风格:适用于哲学思考类文字,采用留白解构和意识流碎片化排版[3][14] - 电竞科技风格:适合热血竞技主题,使用尖锐俐落字体搭配深色科技背景[4][22] - 甜美可爱风格:针对轻松活泼内容,采用圆润蓬松字体和粉彩色调[8][41] - 历史文化风格:融合书法笔触与虚拟空间技术,适合国风题材[10][12] - 工业机械风格:适用于硬核科技主题,呈现金属切割感和霓虹光效[22][52] 技术实现原理 - 采用智能匹配系统分析输入文字的情感与内涵,自动选择对应风格集合[58] - 通过高频提示词反推机制优化输出效果,结合质量词提升生成稳定性[57] - 支持多模态输入,用户可上传图片辅助AI识别并生成匹配风格[59][62] 行业应用价值 - 教育培训领域可快速制作具有文化深度的视觉教材[12][35] - 娱乐产业能高效产出电竞、动漫等垂直领域宣传素材[4][45] - 文创行业可批量生成融合传统书法与现代设计的商业作品[10][12] - 营销领域适用于制作社交网络迷因和病毒式传播内容[17][67] 产品优化方向 - 当前在专业字体设计领域仍有提升空间,如书法五大书体的精确还原[51][56] - 需加强印刷字体类别的输出稳定性,如宋体、黑体等核心字体的准确生成[54][56] - 未来可拓展方向包括增强多语言支持、提升排版精细度等[69]