AVO
搜索文档
腾讯研究院AI速递 20260327
腾讯研究院· 2026-03-27 00:06
生成式AI算法与模型优化 - 谷歌发布TurboQuant压缩算法,通过极坐标变换与1-bit误差校验,将KV缓存压缩至3-bit,使内存占用降低6倍,推理速度提升8倍,无需重训或校准数据,在长上下文基准测试中性能接近全精度模型[1] - 英伟达提出智能体式变异算子AVO,用自主编码智能体替代传统进化搜索,在Blackwell B200 GPU上连续自主运行7天,其生成的注意力内核在BF16精度下达1668 TFLOPS,性能超越英伟达官方cuDNN最高3.5%,超越FlashAttention-4最高10.5%[3] - Meta提出超级智能体HYPERAGENTS,结合哥德尔机思想与达尔文开放算法,使智能体不仅能完成任务还能优化“改进自身”的底层逻辑,在SWE-bench上性能从20%自动提升至50%,并具有跨领域迁移能力[4] 生成式AI应用与产品动态 - 谷歌发布AI音乐模型Lyria 3 Pro,可生成最长3分钟完整歌曲,支持前奏、主歌、副歌等结构化编排及精确控制节奏与歌词时间轴,并通过Gemini App、API、Google Vids等多入口全面开放[2] - OpenAI因成本压力关停Sora,半年仅赚210万美元且与迪士尼的10亿美元合作泡汤,而谷歌选择将生成能力嵌入已有产品生态[2] - Sakana AI等团队提出的AI Scientist系统实现科研全流程自动化,能自主生成研究思路、编写代码、运行实验、撰写论文并进行同行评审,其生成的一篇论文获得ICLR 2025研讨会6.33分评审成绩[7] AI行业趋势与竞争格局 - AI工程方法正经历从Prompt Engineering到Context Engineering再到Harness Engineering的演进,Harness包含记忆管理、工具技能等六大组件,核心原则是精准信息披露、工具精简和上下文利用率控制在60%以下[9] - 智能体时代的竞争优势正从RL算法转向环境质量、训练推理紧耦合和harness工程能力,reward hacking被视为最大技术挑战[8] - 模型公司与应用公司的竞争已从模型层转向“模型+harness”整体,下一代范式可能是多智能体协调工程[9] 地缘政治与市场影响 - NeurIPS新增条款禁止美国OFAC制裁名单上的机构投稿和参与审稿,涉及华为、商汤、中芯国际、海康威视等873条中国相关名单条目,引发中国学界抵制[5][6] - 中国学者已成NeurIPS核心力量,清华大学以390篇论文位列NeurIPS 2025全球第一,此举被批评为将学术交流政治化[6] - 谷歌TurboQuant算法消息引发存储芯片板块集体重挫,美光、西数等巨头股价全线下跌,但业界认为杰文斯悖论可能使实际内存需求不降反升[1] 中国市场与基础设施预测 - Gartner预测到2030年中国80%本地AI基础设施将采用国产AI芯片,目前仅为20%,出口限制推动了自主研发进程和本土市场保护[10] - 到2028年跨区域合规与AI偏见问题将占AI数据管理量的50%,企业需通过数据属地化等方式应对多区域模型混用带来的合规风险[10] - 到2029年70%的中国企业将落地正式AI安全测试,AI智能体将承担大型企业超40%的IT运营任务,“智能体化企业”是下一阶段方向[11]
刚刚,英伟达革了自己的命:智能体自主进化7天,干掉所有算子工程师、GPU专家
36氪· 2026-03-26 12:14
研究背景与核心创新 - 英伟达提出了一种名为智能体式变异算子(Agentic Variation Operators, AVO)的新型进化变异算子,它用自主编码智能体取代了经典进化搜索中固定的变异、交叉和人工设计的启发式方法 [2] - 该研究旨在解决传统基于大语言模型(LLM)的进化搜索的局限,即LLM被限制在预设流程中仅作为候选解生成器,无法主动查阅资料、测试、解读反馈或修正方案,这对于需要深度迭代的顶级硬件优化任务尤为致命 [5][10] - AVO将深度智能体提升为变异算子本身,使其成为一个自我驱动的智能体循环,能够自主决定查阅内容、修改对象及评估时机,实现长周期内的持续改进,从而将AI从被动的“代码生成器”转变为掌握全局的“进化操盘手” [6][7][10][12] 技术验证与性能表现 - 研究将AVO应用于NVIDIA Blackwell B200 GPU上的多头注意力(MHA)内核优化,在无需人工干预、连续7天的自主演化中,智能体探索了超过500个优化方向,演化出40个内核版本 [9][16] - 最终生成的MHA内核在BF16精度下达到了最高1668 TFLOPS的吞吐量,在测试配置中性能超越英伟达官方cuDNN库高达3.5%,超越目前最前沿的开源基准FlashAttention-4高达10.5% [9][14][19] - 研究证明了优化技术的强大泛化能力:智能体仅需30分钟的额外自主适配,即可将演化版MHA内核迁移至分组查询注意力(GQA),其性能相比cuDNN提升高达7.0%,相比FlashAttention-4提升高达9.3% [9][18][23] 优化深度与硬件级推理 - 分析表明,智能体发现的优化涵盖了内核设计的多个层面,包括寄存器分配、指令流水线调度和负载分布,反映了真正的硬件级推理,而非表层的代码变换 [9][14][24] - 具体优化案例包括:通过消除条件分支和替换轻量级内存屏障,使非因果注意力吞吐量一次性提升8.1%;重新组织执行流水线以实现张量核心计算重叠,减少硬件空闲等待时间;通过分析性能数据,对Blackwell的2048个寄存器预算进行重新分配,进一步榨取2.1%的性能提升 [25] - 该研究证明AI智能体已具备处理多硬件子系统(如同步、内存排序、流水线调度和寄存器分配)联合推理的能力,为未来的自动化软件系统优化指明了方向 [24] 行业意义与未来展望 - 研究人员将这种方法称为“盲编程”,即开发完全自动化、无需人工干预的系统,并断言“盲编程是软件工程的未来”,因为人类认知能力是瓶颈 [3] - AVO作为一种不局限于特定领域的进化变异算子,不仅可用于AI芯片和深度学习底层生态的开发,未来更有望在所有对算力有极致苛求的科学和工程领域中大展拳脚 [24] - 这项研究被评价为“超人类智能在软件领域的真正首次展露”,其表现可能会对现有的内核/领域特定语言(DSL)开发产生深远影响 [1][2]
DBG Launches AVO College Influencer Tour at the University of Alabama featuring Hallie Batchelder, Sydney Thomas, Sarah Ashlee Barker, Ha-Ha Clinton Dix and Mary Sergi this Saturday, October 18th
Globenewswire· 2025-10-15 21:00
活动概述 - 公司宣布启动首次AVO College Influencer Tour活动,首站定于10月18日在阿拉巴马大学,结合阿拉巴马红潮队对阵田纳西志愿者队的橄榄球比赛进行 [1] - 活动将在比赛前(下午2点至4点)于“Supe Store on the Quad”和“Champions Lane”两个地点举行,多位有影响力的个人及运动员将亲临现场 [1] 参与人员与活动内容 - 活动参与者包括来自Unwell Network的Hallie Batchelder及其热门播客“Extra Dirty”、社交媒体影响者兼模特Sydney Thomas、前阿拉巴马大学全SEC篮球运动员及WNBA洛杉矶火花队首轮选秀Sarah Ashlee Barker、前两次全国冠军阿拉巴马大学足球运动员及绿湾包装工队职业碗选手Ha-Ha Clinton Dix、前阿拉巴马大学啦啦队员及顶级内容创作者Mary Sergi [7] - 活动为学生、校友、家庭及球迷提供与这些有影响力人士和运动员见面互动的独特机会,并可签名获取AVO x Yea Alabama联名服饰 [2] 商业合作与战略意图 - Yea Alabama将从AVO x Yea Alabama联名服饰系列的所有收入中获得20%的特许权使用费 [3] - AVO和Yea Alabama承诺为女学生运动员创造未来由姓名、形象和 likeness(NIL)市场驱动的机会,这是首批专门针对女学生运动员的NIL倡议之一 [3] - 公司CEO表示,此活动是将顶级女性影响者、运动员及男性运动员聚集起来支持女子运动和全国女学生运动员的良机,并赞赏Yea Alabama对项目的支持 [4] - 公司相信有机会以极具吸引力的价格向大学及其粉丝、校友和家庭提供优质产品,支持女学生运动员的使命与提供优质产品的结合创造了强大效应,被比作大学服饰领域的Warby Parker [5] 公司业务背景 - 公司通过多个品牌以直面消费者和批发形式提供多种服装,包括新推出的大学品牌AVO [5] - 公司拥有技术部门Open Daily Technologies,专注于将前沿计算、人工智能和高级数据保护整合到其生态系统中,以支持其在电子商务领域推动价值和创新的更广泛战略 [5]