OpenAI Codex技术进展 - OpenAI预告下周起将发布Codex相关重磅内容,并发布技术博客揭秘其CLI核心架构——智能体循环 [1] - 智能体循环通过Responses API协调用户指令、模型推理与本地工具执行,采用“提示词前缀一致”策略触发缓存以优化性能 [1] - Codex支持零数据保留配置以保障隐私,并利用自动压缩技术管理上下文窗口 [1] 谷歌DeepMind动态4D重建技术突破 - 谷歌DeepMind发布D4RT,将3D重建、相机追踪、动态物体捕捉统一成“查询”动作,速度比现有SOTA快18至300倍 [2] - 核心技术是统一的时空查询接口,AI先全局“阅读”视频生成场景表征,再按需搜索任意像素的3D轨迹、深度和位姿 [2] - 该技术对具身智能、自动驾驶和AR意义重大,但训练仍需10亿参数模型和64个TPU [2] Claude产品功能升级 - Claude Code将内部“Todos”升级为“Tasks”,支持多会话或子代理协作完成跨越多个上下文窗口的长期复杂项目 [2] - Tasks存储在文件系统中便于多个会话协同,当一个会话更新Task时会广播给所有处理同一任务列表的会话 [2] - Anthropic推出Claude in Excel插件,支持Pro、Max、Team、Enterprise用户,基于Opus 4.5模型,能联网搜索并自动填充表格,支持读取公式、Debug错误、从零建模、制作透视表等功能 [6] 百度文心大模型发布 - 百度文心5.0正式版上线,参数量达2.4万亿,采用原生全模态统一建模技术,支持文本、图像、音频、视频的理解与生成 [3] - 在LMArena文本和视觉理解榜单五次登顶,进入全球第一梯队,语言与多模态理解能力稳居国际领先 [3] - 实测显示模型在复杂情感理解、弦外之音分析、创意写作等文科任务表现突出 [3] AI智能体与开源项目动态 - 开源项目Clawdbot在硅谷爆火,可在Mac mini上运行,兼具本地AI智能体和聊天网关双重身份,通过WhatsApp、iMessage等随时对话 [4] - Clawdbot解决了大模型记忆力痛点,能记住两周前的对话,还会主动推送邮件、日程提醒,并可直接操控电脑执行任务 [4] - 项目GitHub获9.2k星,最低月成本约25美元,用户反馈它能自动管理生意、写代码替代Zapier等付费服务 [4] AI研究新范式与行业观点 - 图灵奖得主LeCun创立的AMI Labs官宣核心方向为“世界模型”,旨在构建理解现实世界、具备持久记忆和推理规划能力的智能系统 [5] - 该路线认为仅靠预测下一个token无法真正理解现实,需在更高层次表征空间进行预测与推理,过滤不可预测的噪声信息 [5] - 谷歌云AI总监Addy Osmani警告“氛围编程”已撞南墙,AI能完成70%前期工作但剩余30%只有经验丰富的工程师能搞定,2026年真正核心竞争力是把模糊问题转化为明确执行意图、设计好上下文结构 [7] 科技巨头对AI发展的预测 - 马斯克预测2026年底前AI将超越人类智慧,到2030年AI将比全人类集体智慧更聪明,特斯拉明年底将开售人形机器人Optimus [8] - 微软CEO纳德拉警告若AI只消耗资源不改善结果社会会失去容忍,黄仁勋称具身智能是“一代人一次的机会” [9] - DeepMind CEO哈萨比斯认为AGI还需5-10年,Anthropic CEO达里奥称只差6-12个月模型就能端到端完成软件开发 [9]
腾讯研究院AI速递 20260126
腾讯研究院·2026-01-26 00:01