腾讯研究院AI速递 20250718
腾讯研究院·2025-07-17 22:12
生成式AI 一、 谷歌DeepMind 推 出 新架构MoR实现两倍推理速度 1. MoR架构实现参数共享与自适应计算相结合,以更少参数达到大模型性能; 2. 动态路由机制根据token复杂度分配不同递归深度,减少冗余计算并优化KV缓存; 3. 实验证明MoR推理吞吐量最高提升2.06倍,训练时间减少19%,峰值内存下降25%。 https://mp.weixin.qq.com/s/6IUoCHjm9P_FZllxBlQHPQ 二、 亚马逊推Agent全家桶!5招连发,吹响AI集结号 1. 亚马逊发布Bedrock AgentCore预览版,提供7大AI agents核心服务,包括运行时、记 忆、身份验证等; 2. 推出Nova定制选项和Strands Agents V1.0,使agents开发更简单,实现多agents协同工 作; 四、 谷歌搜索A I将可以 替你电话约服务,还会谈价砍单 1. 谷歌搜索推出AI代打电话功能,可为用户自动联系并预约本地服务,如宠物美容; 2. 搜索集成Gemini 2.5 Pro模型和Deep Search功能,能处理复杂查询并生成深度报告; 3. 发布Amazon S3 V ...