腾讯研究院AI速递 20260327
腾讯研究院·2026-03-27 00:06

生成式AI算法与模型优化 - 谷歌发布TurboQuant压缩算法,通过极坐标变换与1-bit误差校验,将KV缓存压缩至3-bit,使内存占用降低6倍,推理速度提升8倍,无需重训或校准数据,在长上下文基准测试中性能接近全精度模型[1] - 英伟达提出智能体式变异算子AVO,用自主编码智能体替代传统进化搜索,在Blackwell B200 GPU上连续自主运行7天,其生成的注意力内核在BF16精度下达1668 TFLOPS,性能超越英伟达官方cuDNN最高3.5%,超越FlashAttention-4最高10.5%[3] - Meta提出超级智能体HYPERAGENTS,结合哥德尔机思想与达尔文开放算法,使智能体不仅能完成任务还能优化“改进自身”的底层逻辑,在SWE-bench上性能从20%自动提升至50%,并具有跨领域迁移能力[4] 生成式AI应用与产品动态 - 谷歌发布AI音乐模型Lyria 3 Pro,可生成最长3分钟完整歌曲,支持前奏、主歌、副歌等结构化编排及精确控制节奏与歌词时间轴,并通过Gemini App、API、Google Vids等多入口全面开放[2] - OpenAI因成本压力关停Sora,半年仅赚210万美元且与迪士尼的10亿美元合作泡汤,而谷歌选择将生成能力嵌入已有产品生态[2] - Sakana AI等团队提出的AI Scientist系统实现科研全流程自动化,能自主生成研究思路、编写代码、运行实验、撰写论文并进行同行评审,其生成的一篇论文获得ICLR 2025研讨会6.33分评审成绩[7] AI行业趋势与竞争格局 - AI工程方法正经历从Prompt Engineering到Context Engineering再到Harness Engineering的演进,Harness包含记忆管理、工具技能等六大组件,核心原则是精准信息披露、工具精简和上下文利用率控制在60%以下[9] - 智能体时代的竞争优势正从RL算法转向环境质量、训练推理紧耦合和harness工程能力,reward hacking被视为最大技术挑战[8] - 模型公司与应用公司的竞争已从模型层转向“模型+harness”整体,下一代范式可能是多智能体协调工程[9] 地缘政治与市场影响 - NeurIPS新增条款禁止美国OFAC制裁名单上的机构投稿和参与审稿,涉及华为、商汤、中芯国际、海康威视等873条中国相关名单条目,引发中国学界抵制[5][6] - 中国学者已成NeurIPS核心力量,清华大学以390篇论文位列NeurIPS 2025全球第一,此举被批评为将学术交流政治化[6] - 谷歌TurboQuant算法消息引发存储芯片板块集体重挫,美光、西数等巨头股价全线下跌,但业界认为杰文斯悖论可能使实际内存需求不降反升[1] 中国市场与基础设施预测 - Gartner预测到2030年中国80%本地AI基础设施将采用国产AI芯片,目前仅为20%,出口限制推动了自主研发进程和本土市场保护[10] - 到2028年跨区域合规与AI偏见问题将占AI数据管理量的50%,企业需通过数据属地化等方式应对多区域模型混用带来的合规风险[10] - 到2029年70%的中国企业将落地正式AI安全测试,AI智能体将承担大型企业超40%的IT运营任务,“智能体化企业”是下一阶段方向[11]

腾讯研究院AI速递 20260327 - Reportify