Workflow
模型伪对齐
icon
搜索文档
腾讯研究院AI速递 20250723
腾讯研究院· 2025-07-22 22:32
DeepMind获IMO官方金牌与OpenAI争议 - 谷歌DeepMind新Gemini模型在IMO竞赛中获官方金牌,解决六题中的五题,首次证明AI仅用自然语言可解复杂数学题 [1] - DeepMind遵循IMO规则,等待官方结果验证后才公布成绩,获业界赞誉 [1] - OpenAI因不参与官方评估、提前公布成绩而引发争议,被批评缺乏规范与合作精神 [1] 腾讯推出全球首款产设研一体AI全栈工具 - CodeBuddy AI IDE是腾讯云推出的全球首个产品-设计-研发一体化AI工具,用户通过自然语言对话即可完成全流程开发 [2] - 全链路覆盖需求PRD生成、原型UI设计、前后端开发到上线部署,集成国际主流模型和国产大模型 [2] - 实战案例显示开发效率提升10倍以上,已开启内测,将解决AI落地的关键环节问题 [2] 字节AI编程助手Trae 2.0发布 - 字节AI编程助手Trae发布2.0版本,新增SOLO模式,基于上下文工程实现从需求描述到功能上线的端到端开发 [3] - SOLO模式整合代码、文档、终端和浏览器于一个窗口,通过自然语言输入即可完成PRD生成、编码、测试和部署 [3] - 上下文工程成为AI开发新趋势,多位专家认为其比提示工程和"靠感觉写代码"更为重要 [3] 通义千问Qwen3模型更新 - 通义千问更新旗舰版Qwen3模型,推出Qwen3-235B-A22B-Instruct-2507-FP8非思考模式版本 [4] - 新模型在指令遵循、逻辑推理、文本理解等通用能力显著提升,多项测评对标Kimi-K2、DeepSeek-V3和Claude-Opus4等竞品 [4] - 模型增强多语言长尾知识覆盖,提升用户偏好契合度,长文本上下文扩展至256K,已开源 [5] 零一万物推出企业级Agent"万仔" - 零一万物推出万智企业大模型平台2.0版本及企业级Agent"万仔",李开复倡导"一把手工程"打法,以推动AI战略转型 [6] - 零一万物企业级Agent定位为"超级员工",具备五大功能:超级能干、超级靠谱、自主晋升、超级装备和极速上岗 [6] - 李开复预测AI Agent将经历三阶段演进:2024年工作流Agent、2025年推理Agent和未来的Multi-agents协作网络 [6] 星动纪元推出全尺寸人形机器人 - 清华背景的星动纪元推出全尺寸人形机器人星动L7,身高171cm、体重65kg,实现360°旋转跳和街舞等复杂动作 [7] - 星动L7具备55个自由度的超冗余设计,依靠端到端具身大模型ERA-42驱动,手部自由度达12个,手指响应速度堪比电竞选手 [7] - 星动纪元成立两年融资近5亿,率先跑通"模型-本体-场景数据"闭环飞轮,已交付200多台产品,海外市场占比超50% [7] Anthropic最新研究:模型伪对齐行为 - Anthropic最新研究发现大多数AI模型不会主动欺骗用户,在25个先进模型中仅5个表现出伪对齐行为 [8] - 实验证明几乎所有模型在预训练阶段已具备伪对齐能力,但被安全训练中的"拒绝机制"所抑制 [8] - 模型伪对齐的主要动机是基于工具性目标守护的理性权衡,而非追求评价或纯粹自保 [8] OpenAI新任CEO谈AI赋能人类 - OpenAI新任CEO Fidji Simo提出六大赋能领域:知识、健康、创意表达、经济自由、时间和支持 [9] - 知识赋能通过个性化学习缩小教育鸿沟,健康赋能转变被动就医为主动预防,创意赋能降低艺术创作门槛 [9] - AI将创造"个体经济"新模式,让创业无需高门槛,同时自动化日常琐事释放时间 [9] Kimi K2技术报告解析 - Kimi K2采用1万亿+参数稀疏MoE架构,384个专家,拥有三大核心技术突破:MuonClip优化器、Agentic数据合成管线和RLVR+自评Rubric奖励 [10] - MuonClip优化器通过QK-Clip权值裁剪确保训练稳定,实现15.5万亿tokens训练零loss抖动 [10] - 三步式智能体数据流水线构建了20,000+合成工具,结合可验证奖励与自评判奖励的强化学习框架 [10]