Workflow
VibeTensor
icon
搜索文档
陈天奇、贾扬清点赞:Vibe Coding版PyTorch,连论文都是AI写的
机器之心· 2026-01-23 16:29
项目概览与核心观点 - 英伟达杰出工程师许冰在GitHub上开源了全球首个完全由AI智能体生成的全栈深度学习系统VibeTensor,该系统从上层绑定到底层CUDA内存管理,没有一行人类编写的代码[2][11][12] - 该项目被视为对“人类编写代码的时代已经结束”这一论断的有力证明,并引发了行业广泛关注,相关帖子浏览量超过700万[1][4] - 项目论文本身也是100%由AI撰写,进一步展示了AI在复杂内容生成方面的能力[8] 项目技术架构与性能 - VibeTensor是一个功能完整的深度学习系统,包含约4.7万行自动生成的内核代码,总计核心代码行数超过16万行[3][25] - 系统独创了名为Fabric的张量子系统,这是一个显式的多设备抽象层,能够自动发现硬件拓扑并接管多卡通信,这是现有主流框架中不存在的概念[2][20] - 系统提供了“Node.js + Python”双前端,其中Node.js插件采用异步优先设计,展示了AI处理异构开发环境的灵活性[23] - 在整体性能上,VibeTensor目前仍无法与PyTorch抗衡,在多项测试中比PyTorch慢约1.7到6.2倍[16][18] - 但在特定算子性能上,AI生成的内核表现优异,例如其生成的Fused Attention内核前向计算比PyTorch原生FlashAttention快1.54倍,后向计算快1.26倍[28][29] AI智能体开发方法与局限 - VibeTensor由英伟达第四代智能体在两个月内独立完成,人类仅提供高层级需求指导,角色转变为“监工”与“策略制定者”[12][35][36] - 开发流程采用彻底的“黑盒”工作流和测试驱动的“硬核”规范,AI智能体自主进行代码生成、工具校验和多智能体评审,并利用PyTorch作为“参考原件”进行API对齐检查[36][37][39] - 项目揭示了AI编程的“弗兰肯斯坦效应”:AI能确保局部子系统逻辑正确,但组合成全局系统时会产生意想不到的性能瓶颈,例如为安全而设计的全局互斥锁严重影响了并行性能[3][30][33] - AI在处理“单次正确”任务时表现卓越,但在处理系统的“组合稳定性”时面临巨大挑战,需要跨越多层级进行调试[40] 行业意义与影响 - 该项目罕见地验证了AI能够编写复杂的系统代码,行业专家评价其为AI工程师的“AlphaGo时刻”,标志着生成式软件工程新时代的开启[4][41][42] - 项目表明AI智能体已经能够构建深度学习框架级别的复杂系统,并开始尝试从底层通信协议层面重构大规模分布式训练的逻辑[3][21] - 尽管存在局限性,但方向已经明确,未来的系统软件可能由人类定义需求,由AI自主生成[42]