腾讯研究院AI速递 20260327

生成式AI算法与模型优化 - 谷歌发布TurboQuant压缩算法，通过极坐标变换与1-bit误差校验，将KV缓存压缩至3-bit，使内存占用降低6倍，推理速度提升8倍，无需重训或校准数据，在长上下文基准测试中性能接近全精度模型[1] - 英伟达提出智能体式变异算子AVO，用自主编码智能体替代传统进化搜索，在Blackwell B200 GPU上连续自主运行7天，其生成的注意力内核在BF16精度下达1668 TFLOPS，性能超越英伟达官方cuDNN最高3.5%，超越FlashAttention-4最高10.5%[3] - Meta提出超级智能体HYPERAGENTS，结合哥德尔机思想与达尔文开放算法，使智能体不仅能完成任务还能优化“改进自身”的底层逻辑，在SWE-bench上性能从20%自动提升至50%，并具有跨领域迁移能力[4] 生成式AI应用与产品动态 - 谷歌发布AI音乐模型Lyria 3 Pro，可生成最长3分钟完整歌曲，支持前奏、主歌、副歌等结构化编排及精确控制节奏与歌词时间轴，并通过Gemini App、API、Google Vids等多入口全面开放[2] - OpenAI因成本压力关停Sora，半年仅赚210万美元且与迪士尼的10亿美元合作泡汤，而谷歌选择将生成能力嵌入已有产品生态[2] - Sakana AI等团队提出的AI Scientist系统实现科研全流程自动化，能自主生成研究思路、编写代码、运行实验、撰写论文并进行同行评审，其生成的一篇论文获得ICLR 2025研讨会6.33分评审成绩[7] AI行业趋势与竞争格局 - AI工程方法正经历从Prompt Engineering到Context Engineering再到Harness Engineering的演进，Harness包含记忆管理、工具技能等六大组件，核心原则是精准信息披露、工具精简和上下文利用率控制在60%以下[9] - 智能体时代的竞争优势正从RL算法转向环境质量、训练推理紧耦合和harness工程能力，reward hacking被视为最大技术挑战[8] - 模型公司与应用公司的竞争已从模型层转向“模型+harness”整体，下一代范式可能是多智能体协调工程[9] 地缘政治与市场影响 - NeurIPS新增条款禁止美国OFAC制裁名单上的机构投稿和参与审稿，涉及华为、商汤、中芯国际、海康威视等873条中国相关名单条目，引发中国学界抵制[5][6] - 中国学者已成NeurIPS核心力量，清华大学以390篇论文位列NeurIPS 2025全球第一，此举被批评为将学术交流政治化[6] - 谷歌TurboQuant算法消息引发存储芯片板块集体重挫，美光、西数等巨头股价全线下跌，但业界认为杰文斯悖论可能使实际内存需求不降反升[1] 中国市场与基础设施预测 - Gartner预测到2030年中国80%本地AI基础设施将采用国产AI芯片，目前仅为20%，出口限制推动了自主研发进程和本土市场保护[10] - 到2028年跨区域合规与AI偏见问题将占AI数据管理量的50%，企业需通过数据属地化等方式应对多区域模型混用带来的合规风险[10] - 到2029年70%的中国企业将落地正式AI安全测试，AI智能体将承担大型企业超40%的IT运营任务，“智能体化企业”是下一阶段方向[11]