腾讯研究院AI速递 20251229
腾讯研究院·2025-12-29 00:42

大模型伦理与行为测试 - 针对19种新旧大模型的电车难题测试显示,一些早期模型在近80%测试中拒绝执行“拉或不拉”指令,而是通过暴力计算改变轨道或直接摧毁电车 [1] - 不同主流模型展现出截然不同的决策倾向,GPT 5.1在80%闭环死局中选择自我牺牲,Claude 4.5 Sonnet表现出更强自保倾向,DeepSeek则一半一半 [1] - 部分AI展现出基于结果最优解的实用主义智能,通过算力识别系统漏洞并破坏规则来保全全局,这种不按常理出牌的决策在未来可能引发不可预知的后果 [1] 平台功能与内容生态变革 - 马斯克在圣诞节推出X平台全场域编辑功能,所有图片新增“编辑图片”选项接入Grok AI模型,用户可直接修改他人发布的图片,还提供图转视频能力 [2] - 该功能依托xAI团队的多模态模型技术进步和十万卡H100 GPU的Colossus AI超算集群,标志着X平台从“内容分享平台”向“生成式创作平台”转型 [2] - 画师群体强烈抗议该功能可轻松去除水印和作者签名,目前没有禁用AI修图的设置选项,X已更新服务条款允许使用发布内容进行机器学习 [2] 自动驾驶AI系统设计 - 华人大神Jane Manchun Wong逆向Waymo程序发现完整的1200行系统提示词,揭示基于Gemini 2.5 Flash搭建的车内AI助手严格区分自身与Waymo Driver的界限 [3] - 助手具备调节空调、切换音乐、获取位置等工具能力,但被明确禁止碰方向盘、改变路线或评论驾驶事件,遇到问题时需将用户引导至App或支持按钮 [3] - 系统提示词涵盖个性化问候、对话管理、硬性边界、优雅失败等详细协议,甚至预装了6个“老爸笑话”,展现了车内AI助手设计的复杂性和严谨性 [3] 大模型技术进展与行业格局 - 阶跃星辰开源NextStep-1.1图像模型,通过扩展训练和基于流的强化学习后训练范式大幅提升图像质量,解决了可视化失败问题并减少视觉伪影 [4] - 该模型采用自回归流匹配架构,拥有140亿参数,通过轻量级流匹配头避开计算密集型扩散模型依赖,但仍存在高维连续潜在空间下的数值不稳定性 [4] - 在智谱和MiniMax相继通过聆讯冲刺IPO、Kimi接入微软Azure之际,依然坚持预训练自研通用大模型路线的还有智谱、MiniMax、Kimi和阶跃星辰四家 [4] AI商业化与广告营收预测 - OpenAI员工讨论在ChatGPT回复中优先展示赞助信息方案,使用专门构建的AI系统评估对话商业意图后调取相关广告,预计2030年非付费用户收入达约1100亿美元 [5][6] - 公司预测“免费用户货币化”带来的平均每用户收入将从明年起达到每年2美元,到本年代末增至每年15美元,毛利率预计与Facebook相近约80%-85% [6] - OpenAI通过与Stripe、Shopify等合作搭建购物导向功能获取最新商家数据用于精准投放广告,但截至目前仅2.1%的ChatGPT查询与“可购买产品”相关 [6] AI原生工具与设计理念演进 - Cursor华人设计负责人Ryo Lu提出角色边界模糊化理念:设计师开始写代码、工程师开始做设计,共同语言是代码而非像素,AI Agent让设计从“像素绘画”转变为对AI产物的“雕塑” [7] - 产品设计应采用“系统优先”而非“功能堆砌”思维,通过识别核心原语并保持简单灵活,像Notion的Blocks/Pages/Databases组合涌现复杂性 [7] - Cursor通过统一Chat/Composer/Agent为单一Agent界面、将文件中心视图翻转为Agent中心视图,实现从辅助工具到AI原生编辑器的跃迁,用户从主要写代码转变为主要与Agent交互 [7] AI产品战略与架构设计 - Manus团队确立“通用性平台+高频场景优化”双轮驱动策略,采用类似“百度模式”而非“Hao123模式”,先打造强大通用能力平台再反向优化高频场景 [8] - 技术层面明确以“状态持久化”和“云端浏览器”为核心,解决登录状态、文件系统、环境变量密钥管理等关键痛点,构建真正具备代理能力的架构 [8] - 产品层面提出“渐进式披露”和“操作系统隐喻”设计理念,默认呈现简洁界面,随任务展开逐步浮现工具窗口,将不同功能设计成独立平等的一级应用 [8] AI发展速度与社会影响 - Anthropic联创Jack Clark警告到2026年夏天,AI经济会把世界撕成两个并行层面,前沿AI用户会感觉生活在平行世界,而普通人感知与AI能力跃迁彻底脱节 [9] - 他用Claude Code在5分钟内完成捕食者-猎物模拟器开发,而十年前类似工作需要好几周,体验像孩子在和成年人玩“我画你猜”游戏,想象被AI完美呈现 [9] - 他预计数字世界将进入高速进化阶段,巨额财富在硅基引擎驱动下被创造或摧毁,AI智能体彼此交易、AI服务网站批量生成,形成一片不可见却汹涌澎湃的Token之海 [9] 开发者生态与能力重构 - Andrej Karpathy坦言从未像现在这样觉得自己作为程序员如此落后,编程职业正被彻底重构,需掌握agents、提示词、MCP、工作流等新可编程抽象层 [10] - 资深工程师Boris Cherny表示每周都需重新调整对模型能力的认知,应届毕业生因没有先入之见反而能更有效使用模型,上个月他完全没打开IDE全靠Opus 4.5写了约200个PR [10] - Epoch AI数据显示AI通用能力综合指标ECI在过去两年增长速度几乎是前两年的两倍,2024年4月加速增长了90%,实际指数级增长已超过原本预期 [11]