模型伪对齐 - 财报，业绩电话会，研报，新闻

模型伪对齐

搜索文档

腾讯研究院AI速递 20250723

腾讯研究院· 2025-07-22 22:32

DeepMind获IMO官方金牌与OpenAI争议 - 谷歌DeepMind新Gemini模型在IMO竞赛中获官方金牌，解决六题中的五题，首次证明AI仅用自然语言可解复杂数学题 [1] - DeepMind遵循IMO规则，等待官方结果验证后才公布成绩，获业界赞誉 [1] - OpenAI因不参与官方评估、提前公布成绩而引发争议，被批评缺乏规范与合作精神 [1] 腾讯推出全球首款产设研一体AI全栈工具 - CodeBuddy AI IDE是腾讯云推出的全球首个产品-设计-研发一体化AI工具，用户通过自然语言对话即可完成全流程开发 [2] - 全链路覆盖需求PRD生成、原型UI设计、前后端开发到上线部署，集成国际主流模型和国产大模型 [2] - 实战案例显示开发效率提升10倍以上，已开启内测，将解决AI落地的关键环节问题 [2] 字节AI编程助手Trae 2.0发布 - 字节AI编程助手Trae发布2.0版本，新增SOLO模式，基于上下文工程实现从需求描述到功能上线的端到端开发 [3] - SOLO模式整合代码、文档、终端和浏览器于一个窗口，通过自然语言输入即可完成PRD生成、编码、测试和部署 [3] - 上下文工程成为AI开发新趋势，多位专家认为其比提示工程和"靠感觉写代码"更为重要 [3] 通义千问Qwen3模型更新 - 通义千问更新旗舰版Qwen3模型，推出Qwen3-235B-A22B-Instruct-2507-FP8非思考模式版本 [4] - 新模型在指令遵循、逻辑推理、文本理解等通用能力显著提升，多项测评对标Kimi-K2、DeepSeek-V3和Claude-Opus4等竞品 [4] - 模型增强多语言长尾知识覆盖，提升用户偏好契合度，长文本上下文扩展至256K，已开源 [5] 零一万物推出企业级Agent"万仔" - 零一万物推出万智企业大模型平台2.0版本及企业级Agent"万仔"，李开复倡导"一把手工程"打法，以推动AI战略转型 [6] - 零一万物企业级Agent定位为"超级员工"，具备五大功能：超级能干、超级靠谱、自主晋升、超级装备和极速上岗 [6] - 李开复预测AI Agent将经历三阶段演进：2024年工作流Agent、2025年推理Agent和未来的Multi-agents协作网络 [6] 星动纪元推出全尺寸人形机器人 - 清华背景的星动纪元推出全尺寸人形机器人星动L7，身高171cm、体重65kg，实现360°旋转跳和街舞等复杂动作 [7] - 星动L7具备55个自由度的超冗余设计，依靠端到端具身大模型ERA-42驱动，手部自由度达12个，手指响应速度堪比电竞选手 [7] - 星动纪元成立两年融资近5亿，率先跑通"模型-本体-场景数据"闭环飞轮，已交付200多台产品，海外市场占比超50% [7] Anthropic最新研究：模型伪对齐行为 - Anthropic最新研究发现大多数AI模型不会主动欺骗用户，在25个先进模型中仅5个表现出伪对齐行为 [8] - 实验证明几乎所有模型在预训练阶段已具备伪对齐能力，但被安全训练中的"拒绝机制"所抑制 [8] - 模型伪对齐的主要动机是基于工具性目标守护的理性权衡，而非追求评价或纯粹自保 [8] OpenAI新任CEO谈AI赋能人类 - OpenAI新任CEO Fidji Simo提出六大赋能领域：知识、健康、创意表达、经济自由、时间和支持 [9] - 知识赋能通过个性化学习缩小教育鸿沟，健康赋能转变被动就医为主动预防，创意赋能降低艺术创作门槛 [9] - AI将创造"个体经济"新模式，让创业无需高门槛，同时自动化日常琐事释放时间 [9] Kimi K2技术报告解析 - Kimi K2采用1万亿+参数稀疏MoE架构，384个专家，拥有三大核心技术突破：MuonClip优化器、Agentic数据合成管线和RLVR+自评Rubric奖励 [10] - MuonClip优化器通过QK-Clip权值裁剪确保训练稳定，实现15.5万亿tokens训练零loss抖动 [10] - 三步式智能体数据流水线构建了20,000+合成工具，结合可验证奖励与自评判奖励的强化学习框架 [10]

Artificial Intelligence

Artificial Intelligence

Gemini模型