腾讯研究院AI速递 20260317

行业核心动态:AI智能体与下一代模型架构的演进 - 谷歌与微软联合推出并开源WebMCP协议,使AI智能体可通过API直接调用网页底层功能,无需依赖截屏或模拟点击等低效方式 [1] - 智谱推出为OpenClaw龙虾场景深度优化的GLM-5-Turbo模型,强化工具调用、长链路执行等能力,盲测中90%用户认为其优于其他国产模型 [2] - 月之暗面发布注意力残差(AttnRes)论文,用动态注意力机制替代传统残差连接,在Kimi Linear架构上验证后使GPQA-Diamond基准提升超20%,计算效率相当于1.25倍算力基线 [3] - Sam Altman预言下一代AI架构将彻底颠覆Transformer,性能跃升不亚于当年Transformer对LSTM的颠覆,并认为AGI可能在两年内降临 [10] - 后Transformer架构竞争已启动,例如Mamba第三代架构推理吞吐快5倍,英伟达全线新模型切换混合架构 [11] 智能体(Agent)生态与应用发展 - 智谱同步发布针对Agent场景的龙虾套餐(个人版和Team版),以解决tokens消耗高的问题,并推出企业级Claw安全管理体系 [2] - 腾讯元宝App更新后,用户可将OpenClaw龙虾接入“元宝派”社交功能,实现多人共同养虾、龙虾互动的社交化Agent体验,生态从“人+Bot”扩展为“人+Bot+龙虾” [4] - 腾讯电脑管家上线“龙虾管家”功能,为OpenClaw提供全套安全防护,包括文件保护、端口暴露检测等,针对当前38万个OpenClaw实例公网暴露的安全隐患提供解决方案 [5][6] - UniPat AI开源SWE-Vision极简视觉智能体框架,仅用两个工具和约五百行代码,通过让多模态模型编写Python代码来分步处理视觉任务,显著提升基础感知任务精度 [7][8] 模型与智能体能力突破 - 陈天桥旗下MiroMind发布MiroThinker-1.7和H1重型推理智能体,在BrowseComp(88.2%)、GAIA(88.5%)等基准上刷新SOTA [7] - MiroMind H1采用智能体原生训练和以验证为核心的重型推理模式,在实测中提前15天预测黄金价格误差仅0.08% [7] - 智谱GLM-5-Turbo在工具调用稳定性和长任务执行方面获得多家大厂内测团队高度评价 [2] - UniPat AI的SWE-Vision框架揭示了视觉领域的新方向:通过test-time scaling(多写代码)而非仅靠延长思考时间来提升任务精度 [8] 行业风险与监管动向 - 315晚会曝光GEO(生成式引擎优化)黑产,商家可通过几篇软文、几小时即可让虚构产品出现在主流大模型的推荐结果中,涉事公司一年服务200多客户 [9] - 被曝光系统套餐价格从2980元到16980元/年不等,高级版每天可生成63篇虚假软文 [9] - 国家市场监管总局已将AI生成广告列为2026年互联网广告监管重点,将开展集中整治 [9]