PyTorch
搜索文档
陈天奇、贾扬清点赞:Vibe Coding版PyTorch,连论文都是AI写的
机器之心· 2026-01-23 16:29
项目概览与核心观点 - 英伟达杰出工程师许冰在GitHub上开源了全球首个完全由AI智能体生成的全栈深度学习系统VibeTensor,该系统从上层绑定到底层CUDA内存管理,没有一行人类编写的代码[2][11][12] - 该项目被视为对“人类编写代码的时代已经结束”这一论断的有力证明,并引发了行业广泛关注,相关帖子浏览量超过700万[1][4] - 项目论文本身也是100%由AI撰写,进一步展示了AI在复杂内容生成方面的能力[8] 项目技术架构与性能 - VibeTensor是一个功能完整的深度学习系统,包含约4.7万行自动生成的内核代码,总计核心代码行数超过16万行[3][25] - 系统独创了名为Fabric的张量子系统,这是一个显式的多设备抽象层,能够自动发现硬件拓扑并接管多卡通信,这是现有主流框架中不存在的概念[2][20] - 系统提供了“Node.js + Python”双前端,其中Node.js插件采用异步优先设计,展示了AI处理异构开发环境的灵活性[23] - 在整体性能上,VibeTensor目前仍无法与PyTorch抗衡,在多项测试中比PyTorch慢约1.7到6.2倍[16][18] - 但在特定算子性能上,AI生成的内核表现优异,例如其生成的Fused Attention内核前向计算比PyTorch原生FlashAttention快1.54倍,后向计算快1.26倍[28][29] AI智能体开发方法与局限 - VibeTensor由英伟达第四代智能体在两个月内独立完成,人类仅提供高层级需求指导,角色转变为“监工”与“策略制定者”[12][35][36] - 开发流程采用彻底的“黑盒”工作流和测试驱动的“硬核”规范,AI智能体自主进行代码生成、工具校验和多智能体评审,并利用PyTorch作为“参考原件”进行API对齐检查[36][37][39] - 项目揭示了AI编程的“弗兰肯斯坦效应”:AI能确保局部子系统逻辑正确,但组合成全局系统时会产生意想不到的性能瓶颈,例如为安全而设计的全局互斥锁严重影响了并行性能[3][30][33] - AI在处理“单次正确”任务时表现卓越,但在处理系统的“组合稳定性”时面临巨大挑战,需要跨越多层级进行调试[40] 行业意义与影响 - 该项目罕见地验证了AI能够编写复杂的系统代码,行业专家评价其为AI工程师的“AlphaGo时刻”,标志着生成式软件工程新时代的开启[4][41][42] - 项目表明AI智能体已经能够构建深度学习框架级别的复杂系统,并开始尝试从底层通信协议层面重构大规模分布式训练的逻辑[3][21] - 尽管存在局限性,但方向已经明确,未来的系统软件可能由人类定义需求,由AI自主生成[42]
硅谷真实「无间道」,OpenAI前CTO怒斩泄密联创,奥特曼打包收了
36氪· 2026-01-16 20:42
核心事件概述 - OpenAI成功从竞争对手Thinking Machines Lab“反挖”三名核心技术人员回归,包括前CTO Barret Zoph及另外两名联合创始人Luke Metz和Sam Schoenholz [1][6][8] - Thinking Machines Lab创始人兼前OpenAI CTO Mira Murati解雇了CTO Barret Zoph,指控其存在“不当行为”,并可能涉及向竞争对手泄露公司机密 [3][6][8] - 此次人才流动被形容为硅谷AI领域“挖角”与“反挖角”竞争循环的典型案例 [1][28][30] 对Thinking Machines Lab的影响 - 公司遭遇重大人事地震,两位联合创始人(Barret Zoph与Luke Metz)及核心成员Sam Schoenholz集体离职并回归OpenAI,对这家成立不到一年的初创公司构成沉重打击 [12][27] - 公司正处于融资关键期,核心创始团队成员的“叛逃”被视为釜底抽薪,可能引发外界对其治理能力、团队稳定性和执行能力的担忧 [12][13][27] - 为应对危机,公司迅速任命“PyTorch之父”Soumith Chintala为新任CTO,旨在稳定军心并注入顶级工程化能力与开源社区影响力 [13][15][16] - 公司估值在2025年11月达到约500亿美元,是市场罕见的“超早期高定价”明星独角兽,此次动荡可能影响其市场形象与发展势头 [2][12] 对OpenAI的影响 - 此次回归是一次重大人才胜利,三位回归者均曾深度参与ChatGPT、GPT-4o等核心项目的开发,被称作公司的“秘密武器” [9][17][27] - 他们的回归将直接加强公司在前沿研究和应用AI领域的创新能力,并弥补了本月初研究副总裁Jerry Tworek离职造成的技术空缺 [9][27] - 公司应用CEO Fidji Simo透露,此次招揽行动已筹备数周,并明确表示不认同Mira Murati对Zoph的担忧,完全接纳其回归 [8][9] - 公司为回归者明确了新的汇报线:Barret Zoph将直接向Fidji Simo汇报,Luke Metz和Sam Schoenholz则向Zoph汇报 [8][27] 涉及的关键人物与背景 - **Barret Zoph**:前OpenAI研究副总裁(后训练方向),后成为Thinking Machines Lab联合创始人兼CTO,在Google Brain有近七年研究经验,是ChatGPT后训练与能力打磨的核心人物 [5][17][22] - **Luke Metz**:ChatGPT初始团队成员之一,曾担任GPT-4o的后训练负责人,并深度参与GPT-4评估工作 [17][23][25] - **Sam Schoenholz**:前OpenAI成员,参与早期ChatGPT相关工作 [17][27] - **Soumith Chintala**:新加入Thinking Machines Lab并出任CTO,原Meta员工,作为“PyTorch之父”在深度学习社区拥有巨大影响力 [13][15] - **Mira Murati**:Thinking Machines Lab创始人,前OpenAI CTO,于2025年2月启动该项目 [10][12] 行业竞争态势 - 硅谷AI实验室人才流动频繁,形成“旋转门”效应,此次事件是“挖角”与“反挖角”游戏的典型体现 [1][28][30] - 竞争不仅限于OpenAI与Thinking Machines Lab之间,Anthropic等其他AI公司也在积极从OpenAI挖人,例如近期OpenAI的一位高级安全研究负责人Andrea Vallone已加入Anthropic [28][29] - 随着AI竞赛白热化,顶尖AI人才的争夺战持续升级 [28][30] 公司产品与战略 - Thinking Machines Lab致力于打造“更可理解、更可定制、且更通用”的AI系统,于2025年10月发布首个产品Tinker,这是一个用于语言模型微调的API,旨在降低先进AI的使用门槛 [12] - OpenAI通过此次人才回流,巩固了自身在AI大模型后训练、评估及产品化方面的核心技术实力 [27]
OpenAI核心旧部,再创业又内讧了
36氪· 2026-01-16 08:31
核心事件概述 - 前OpenAI研究副总裁、Thinking Machines Lab联合创始人兼首席技术官Barret Zoph在加入新公司不到一年后,因被指控存在“不当行为”而离开,并迅速重返老东家OpenAI [1][3][5] - 事件涉及两家顶尖人工智能公司OpenAI与Thinking Machines Lab之间关键高管的人事变动与争议,引发行业广泛关注 [1][18] 人事变动详情 - **Barret Zoph的离职与回归**:Thinking Machines Lab首席执行官Mira Murati宣布因“不道德行为”与Barret Zoph分道扬镳 [5][6],但OpenAI首席应用官Fidji Simo随即宣布欢迎Zoph重返公司,并透露该安排已筹备数周 [9][12] - **其他回归人员**:除Zoph外,Luke Metz和Sam Schoenholz也将一并重返OpenAI,Zoph将直接向Fidji Simo汇报,而Metz和Schoenholz将向Zoph汇报 [9][18][23] - **接任者信息**:Soumith Chintala被任命为Thinking Machines Lab新任首席技术官,其被誉为“PyTorch之父”,此前在Meta工作11年,负责基础设施和Llama模型 [27][29] 争议与各方说法 - **离职原因争议**:Thinking Machines Lab方面消息人士称Zoph曾向竞争对手泄露公司机密信息 [3][12],而OpenAI方面则表示不认同Mira Murati对Zoph的相关担忧 [13][15] - **公众反应**:部分网友对“不道德行为”的指控表示质疑,戏称其“不道德行为”就是“加入OpenAI” [16][17] - **公司控制权背景**:在Thinking Machines Lab,首席执行官Mira Murati拥有“制度化的一票否决权”,其投票权等于其他所有董事票数之和加一 [9] 涉及人员背景 - **Barret Zoph**:曾是OpenAI后训练研究副总裁,GPT-4幕后关键贡献者之一,其学术工作被引用超过11万次,h指数为62 [19][21][22] - **Luke Metz**:曾于2022年至2024年在OpenAI参与ChatGPT早期开发,并为GPT-4、4o、o1等模型做出重要贡献 [23] - **Sam Schoenholz**:曾对GPT-4o等模型做出重要贡献,与Luke Metz在研究领域有频繁合作 [25] 行业与公司影响 - **对OpenAI的影响**:此次关键人才回流被视为OpenAI的一次巨大收获,尤其在公司近期失去研究副总裁Jerry Tworek之后 [29] - **对Thinking Machines Lab的影响**:作为估值高达500亿美元的硅谷热门初创公司,联合创始人兼首席技术官的离职暴露了其内部管理问题 [23][29] - **行业普遍现象**:文章指出“失去联创”是硅谷顶尖人工智能实验室的一个趋势,并列举了OpenAI、Thinking Machines Lab、xAI等公司联合创始人的流失情况 [29]
OpenAI核心旧部,再创业又内讧了
量子位· 2026-01-16 07:57
文章核心观点 - 文章报道了AI领域初创公司Thinking Machines Lab的联合创始人兼首席技术官Barret Zoph在创业不到一年后,因被指控存在“不当行为”而离开公司,并迅速重返其前雇主OpenAI的事件 [1][3][6] - 事件揭示了硅谷AI顶尖实验室之间激烈的人才竞争与流动,以及围绕关键人物离职所引发的公司间矛盾与舆论争议 [23][26][43] 事件时间线与关键节点 - **2024年10月**:Barret Zoph离开OpenAI [31] - **2025年2月**:Zoph与Mira Murati等多位前OpenAI核心成员正式创立Thinking Machines Lab [31] - **事件爆发日**:前《连线》杂志记者Kylie Robison爆料,Zoph因“不当行为”被Thinking Machines开除 [4][8] - **爆料后20分钟**:Thinking Machines Lab CEO Mira Murati发推确认与Zoph“分道扬镳”,并宣布由Soumith Chintala接任CTO [9] - **约一小时后**:OpenAI首席应用官Fidji Simo发推欢迎Zoph及另两位员工Luke Metz和Sam Schoenholz重返OpenAI,称此项安排已筹备数周 [12] - **随后**:Zoph本人转推并表示对重返OpenAI感到激动 [13] 各方说法与争议焦点 - **Thinking Machines Lab的指控**:公司CEO Mira Murati宣布因“不道德行为”与Zoph结束合作 [8][9] 有接近公司的消息人士向《连线》杂志透露,Zoph曾向竞争对手泄露公司机密信息 [16] - **OpenAI的立场**:OpenAI方面(通过Fidji Simo)表示,不认同Murati对Zoph的相关担忧 [21] 并强调Zoph等人的回归安排已筹备数周 [18] - **网络舆论倾向**:部分网友对“不道德行为”的具体内容表示质疑,并戏称其行为是“加入OpenAI” [24][25] 有评论认为,考虑到Mira Murati过去在OpenAI的经历,她指责他人“不道德”缺乏说服力 [25] 涉及的关键人物背景 - **Barret Zoph**:曾是OpenAI后训练研究副总裁,GPT-4的关键贡献者之一 [26][27] 在加入OpenAI前,于Google Brain担任研究科学家,其学术工作被引用超过11万次 [30][31] - **Luke Metz 与 Sam Schoenholz**:此次与Zoph一同重返OpenAI,两人均曾对GPT-4、4o等模型做出重要贡献 [33][34][36] - **Soumith Chintala**:接替Zoph成为Thinking Machines Lab新任CTO,被誉为“PyTorch之父”,此前在Meta工作11年,负责基础设施和Llama模型 [38][40] 对公司与行业的影响 - **对Thinking Machines Lab的影响**:公司估值高达500亿美元,是硅谷最热门的初创公司之一 [32] 联合创始人兼CTO的离职对公司是一次重大打击,暴露了管理问题 [43] - **对OpenAI的影响**:此次人才回流被视为OpenAI在与谷歌等对手竞争中的一次重要补强,尤其是在其研究副总裁Jerry Tworek近期离职之后 [41][42] - **行业普遍现象**:文章指出,顶尖AI实验室“失去联创”已成为一种趋势,例如OpenAI的11位联合创始人中已离开8位,Thinking Machines的6位联创中已离开3位 [44]
Mira公司内乱?CTO被开除,带团队回OpenAI,翁荔上推发言
机器之心· 2026-01-15 17:17
核心事件与人事变动 - Thinking Machines Lab CEO Mira Murati宣布联合创始人兼CTO Barret Zoph被解雇,原因是其个人不道德行为,该消息在全体员工大会上宣布[2][5] - 同一日,公司任命PyTorch之父、前Meta研究员Soumith Chintala为新任首席技术官[2][23] - 约一小时后,OpenAI应用CEO Fidji Simo宣布Barret Zoph将重返OpenAI,一同回归的还有Thinking Machines Lab联合创始人Luke Metz及创始团队成员Sam Schoenholz[3] Thinking Machines Lab公司背景 - 公司于2025年2月正式成立,核心团队主要由来自OpenAI、Google DeepMind等顶级实验室的前核心成员组成[6] - 成立五个月后获得约20亿美元种子轮融资,投后估值达120亿美元,成为硅谷历史上规模最大的种子轮融资之一,投资方包括英伟达、AMD、Cisco等[6] 关键人物背景 - **Barret Zoph**:前OpenAI技术主管,领导过后训练团队,研究方向包括对齐、工具使用、评估、ChatGPT等,也是两篇重要神经网络架构搜索论文的第一作者[8][10] - **Luke Metz**:前OpenAI创始团队成员,与John Schulman等人内部共同开发了ChatGPT的雏形“low-key research preview”,也是GPT-4、GPT-4o、o1等模型的贡献者之一[12][13] - **Sam Schoenholz**:在加入Thinking Machines Lab前,曾领导OpenAI的可信赖扩展团队和GPT-4o优化,此前在Google Brain从事统计物理学与机器学习交叉研究,其合著论文《Neural message passing for quantum chemistry》被引用11898次[18][19][20] - **Soumith Chintala**:PyTorch的联合创造者,于2025年11月离开Meta后加入Thinking Machines Lab,现被任命为CTO[23] 行业观察与反应 - 人工智能领域人才流动频繁,即使创始团队成员也频繁变动[7] - 联合创始人Lilian Weng在事件后发表感言,强调与真正在乎产品、追求工匠精神的伙伴共事是一种享受和荣幸[6]
GPT-4 技术功臣疑似泄密被开除,OpenAI 系创业天团上演「无间道」
36氪· 2026-01-15 10:29
公司人事变动 - 明星AI初创公司Thinking Machines Lab解雇其首任首席技术官Barret Zoph,并立即任命Soumith Chintala为新任首席技术官[1] - 据知情人士透露,Barret Zoph是因不道德行为被解除职务的,公司联合创始人Mira Murati在全员会议上当场宣布此决定[1] - 有消息人士透露,Zoph曾向竞争对手泄露公司机密信息[2] - Zoph在周一告知考虑离职,周四即被正式解雇,过程迅速[3] - 被解雇的联合创始人Barret Zoph、另一位联合创始人Luke Metz以及员工Sam Schoenholz将重新加入OpenAI[5] 公司核心团队 - 公司创始人Mira Murati曾任OpenAI首席技术官,统筹过ChatGPT、GPT-4、DALL-E等关键项目,并在2023年11月董事会风波中短暂担任OpenAI临时首席执行官[9] - 新任首席技术官Soumith Chintala被称为“PyTorch之父”,两个月前从Meta离职加入公司,他在Meta的11年间将PyTorch从0做到AI领域90%以上的采用率[7][9] - 创始团队约30多人,其中约三分之二成员来自OpenAI,包括前OpenAI首席科学家John Schulman、DALL-E联合创始人Alec Radford、基础设施副总裁Bob McGrew、对齐研究核心Lilian Weng等[11] - 公司使命是打造“可理解、可定制、更通用”的多模态AI,研究重点包括单样本或少样本快速适配,并承诺定期发布代码、技术博客和数据集以推动开放科学文化[11] 公司融资与估值 - 公司于2025年7月完成20亿美元种子轮融资,由a16z领投,英伟达、AMD、Accel、Cisco、Jane Street等跟投[13] - 此轮融资后公司估值达120亿美元,创下硅谷史上最大种子轮融资纪录[13] 相关人物背景 - 被解雇的Barret Zoph曾任职于Google Brain 6年,后加入OpenAI担任后训练副总裁,是ChatGPT、GPT-4、GPT-4o等产品的核心贡献者,并于2024年5月发布会现场演示GPT-4o功能[5][7] - 其回归OpenAI正值该公司研究副总裁Jerry Tworek近期离职,OpenAI应用部门首席执行官Fidji Simo在内部备忘录中表示,OpenAI对Zoph的担忧与Mira Murati不一致[5]
DeepSeek等8大产品都是意外?! 改变世界的项目们,最初都没被“当个事儿办”
搜狐财经· 2026-01-13 09:47
文章核心观点 - 许多具有世界级影响力的重要产品最初都起源于非主线、非KPI驱动的“支线项目”,这些项目因其灵活性和低约束环境而成为创新的重要源泉 [1] - 在AI时代,技术降低了试错成本,个人或小团队能更快速地进行探索和验证,这使得支线项目更有可能孕育出颠覆性的成果,并可能成为未来方向的早期信号 [7][8][10] 支线项目的定义与特征 - 支线项目被界定为非主线、非KPI驱动、最初非战略立项的项目,其成立之初并不重要,也非公司的核心战略方案 [1] - 这类项目通常没有项目经理、销售、市场进入策略、合规或股东的过多干预,被认为是“魔法生效的地方” [1] - 支线项目允许技术跑在需求前面,能够绕开创业项目常见的节奏、叙事、融资节点和对外承诺等约束 [2] 国内支线项目案例分析 - **DeepSeek(幻方量化)**:作为量化投资公司的支线项目诞生,并非聚光灯下的战略产品,而是内部技术演进的自然延伸 [2] - 幻方量化长期进行算力、模型和工程效率的技术研究,首先服务于量化交易,AI作为辅助金融分析的支线工具 [2] - 公司拥有丰富的GPU集群资源(算力)和金融专业场景的长期数据优势,在研发通用智能时更注重模型推理和数学能力 [2] - 长期高强度算法投入和顶尖人才储备,为打造爆款AI产品创造了条件 [2] - **Qwen(阿里巴巴)**:在阿里内部早期也是支线项目,公司当时的大模型战略主线是面向行业ToB用户的商业化交付 [3] - Qwen选择了一条开源道路,其早期发展采用了“放养”模式,公司给予研究团队空间,在证明价值后再逐步融入主线资源 [3] - 支线项目模式被认为能提高成功几率,原因包括:减少过度决策参与,将自主权交还给研发人员;减少微观管理,以更大的试错空间换取更快的迭代速度 [3] 硅谷支线项目案例分析 - **Claude Code(Anthropic)**:最初是工程师Boris Cherny的一个实验性支线项目,始于一个能连接Apple设备并告知用户所听音乐的简单功能 [5] - 在与产品经理交流后,项目方向演变为开发与系统文件交互的工具(如读/写文件、运行批处理命令),并在相当偶然的情况下诞生 [5] - 项目正式面市后产生暴风式传播效应,成为Anthropic的当家产品之一 [5] - 该项目展示了AI编程能力的飞速进步:一年前,Claude在生成bash命令时还存在问题且只能短暂工作;如今,开发者利用Claude Code+Opus4.5在30天内提交了259个PR、497次提交,添加了40000行代码并删除了38000行代码,Claude能持续运行数分钟、数小时甚至数天 [5] - 该支线项目现已推动软件工程进入新的范式时期 [6] AI时代下支线项目价值的变化 - AI显著降低了试错成本,过去需要团队协作和资源协调的探索,现在个人能更轻松、迅速地完成初步验证 [7] - 这使得“探索”不必再总是正式的立项行为,在日常工作中就可能产生新思路或新方法 [7] - 许多支线项目从解决具体问题开始,通过真实使用不断修正方向,最终成长为重要产品 [8] - AI缩短了从想法到验证的距离,项目的价值在于能否被迅速使用和反馈,从而放大了个人探索的价值 [8] - 虽然AI提升了执行效率,但未必同步提升战略判断的准确性,主线项目在技术环境变化时可能受原有判断束缚而难以调整 [10] - 支线项目探索成本更低、反馈更快,为主线方向在验证后承接规模化任务奠定了基础 [10] - 在AI时代,关乎未来方向的早期信号,可能会越来越多地出现在最初不被重视的项目里 [10]
DeepSeek等8大产品都是意外?! 改变世界的项目们,最初都没被“当个事儿办”
量子位· 2026-01-11 12:02
文章核心观点 - 文章核心观点认为,许多改变世界的知名产品最初都起源于不被重视的“支线项目”,这些项目因非KPI驱动、非战略立项而拥有更大的创新自由度和试错空间,最终成功逆袭成为公司核心产品或行业标杆 [1][2][3] - 在AI时代,由于技术降低了试错成本,个人或小团队通过支线项目进行探索和验证的效率大幅提升,这使得关乎未来方向的早期信号可能越来越多地出现在这类项目中 [37][42][53] 支线项目的定义与特征 - 支线项目被定义为非主线、非KPI驱动、最初非战略立项的项目,其成立之初对公司战略并不重要 [2] - 这类项目因不受项目经理、销售、合规、股东等约束,被认为是“魔法生效的地方”,拥有更大的自由度和创新潜力 [3] 国内支线项目案例:DeepSeek与Qwen - **DeepSeek**:是量化投资公司幻方量化内部的支线项目,最初作为服务于量化交易的技术研究自然延伸而出,并非战略立项 [11][12] - 公司因量化交易背景,拥有丰富的GPU算力资源和金融场景数据优势,为AI研发提供了坚实基础 [14][15][16] - 项目绕开了创业项目常见的节奏、融资等约束,允许技术跑在需求前面 [13] - **Qwen**:是阿里巴巴的支线项目,在公司早期战略更侧重于ToB大模型商业化交付的背景下,坚定走上了开源道路 [20][21] - 项目负责人指出,支线项目通过减少过度决策和微观管理,将自主权交还给研发人员,从而提高了成功几率和迭代速度 [22][23][24] - 公司采取“放养”策略,在项目证明价值后再逐步融入主线资源 [25][26] 硅谷支线项目案例:Claude Code与ChatGPT等 - **Claude Code**:最初是Anthropic工程师Boris Cherny基于Claude大模型的一个实验性支线项目,旨在与系统文件交互 [27][28][30] - 项目面市后产生暴风式传播,成为公司当家产品之一 [32] - 工程师记录显示,该项目已深刻改变其工作流程:在过去30天里,其使用Claude Code提交了259个PR、497次提交,添加了40000行代码,删除了38000行代码,Claude能持续运行数分钟至数天 [34] - **其他案例**:文章列举了多个源自支线项目的全球知名产品,包括OpenAI的ChatGPT、Meta的PyTorch、Google的Gmail、Odeo的Twitter(现X)以及Tiny Speck的Slack [4] AI时代支线项目的趋势与价值 - **试错成本降低**:AI加速进入软件工程流程,显著拉低了试错成本,使个人能更轻松、迅速地完成初步验证,缩短了从想法到验证的距离 [37][38][42] - **探索模式改变**:探索不再必须作为正式立项行为,许多支线项目始于解决具体问题,通过真实使用不断修正方向而最终成长为重要产品 [39][41][43] - **个人价值放大**:当试错足够便宜,能否被迅速使用和反馈变得更重要,这直接放大了个人探索的价值 [44][45] - **与主线项目的关系**:支线项目探索成本低、反馈快,能为主线项目在方向被验证后承接规模化任务打下基础,但AI并未同步提升战略判断的准确性,主线项目在技术环境变化时仍可能受原有判断束缚 [47][48][51]
那个固执的法国老头走了,带走了硅谷最后的理想主义
AI科技大本营· 2026-01-05 18:12
公司战略与文化变迁 - 2013年,公司为探索智能本质,打破商业公司规矩,以优厚条件聘请Yann LeCun并成立FAIR研究部门,营造了不计成本、不问产出的纯研究象牙塔环境 [4][8][9][12][13] - FAIR的黄金时代在2025-2026年宣告终结,标志是LeCun离职以及Alexandr Wang空降,公司战略转向强调商业变现、算力堆叠和暴力美学的实用主义路线 [2][4][5][44][47][56] - 公司内部文化发生剧烈碰撞,从LeCun推崇的工程师直觉优于KPI、开放开源的“保护区”文化,转变为由年轻管理层主导、强调保密协议和KPI考核的商业化文化 [14][23][44][49][50] 关键人物贡献与影响 - Yann LeCun作为首席AI科学家,其核心贡献并非直接写代码,而是利用政治资本为PyTorch等研究项目提供保护伞,并坚持默认开源策略,最终使PyTorch反噬TensorFlow,成为学术界主流框架 [17][20][21][22][24] - LeCun在2023年公司AI战略落后时,推动Llama大模型采用开源策略,成功让公司重回AI竞争中心,但其技术路线(世界模型)与主流大语言模型路线存在根本分歧 [40][41][52] - Alexandr Wang于2025年空降成为公司首席AI官,其哲学是“规模就是一切”,代表硅谷新一代强调数据、算力堆叠和快速商业化的技术路线 [5][44][48][49] 技术路线分歧与竞争格局 - LeCun是坚定的“物理主义者”,认为智能基石是理解物理规律和因果关系的“世界模型”,并多次批评大语言模型只是基于统计预测下一个词,并未真正理解世界 [29][30][32][33][36] - 以Transformer架构和预测下一个词为核心的大语言模型路线,自ChatGPT发布后成为行业主流和资本焦点,与LeCun主张的路线形成鲜明对立 [31][34][35][37][55] - 2025年行业竞争白热化,焦点集中于AGI竞赛,开源优势被稀释,行业讨论重点从“AI向善”、“可解释性”转向纯粹的AGI竞赛和商业化 [44][45] 标志性产品与项目 - PyTorch起源于FAIR内部研究员对灵活研究工具的需求,在LeCun的保护和开源策略下,最终在顶级学术会议上占据80%的论文使用率,击败了Google的TensorFlow [18][19][22] - Llama大模型系列是公司应对竞争的关键产品,尽管其技术基础与LeCun的理念相悖,但凭借开源策略成功吸引了全球开发者,帮助公司重获市场地位 [40][41] - LeCun在任期间还推动了如RoBERTa、DINO等体现科研严谨性和前瞻性(如自监督学习)的项目 [63] 行业象征与历史意义 - FAIR的十三年被视为AI时代的贝尔实验室或施乐帕罗奥多研究中心,代表了不计商业回报、追求科学发现的理想主义时代,其产出的开源火种和生态影响了整个行业 [4][58][59][60] - LeCun的离职被视为一个时代的终结,象征硅谷最后理想主义的消退,其留下的关于智能本质的不同路径思考,可能在未来行业遇到瓶颈时被重新审视 [4][57][60][62]
不要死磕CUDA,国内首个Triton技术大会官宣,AI芯片编程迎来新范式
AI科技大本营· 2025-12-26 13:42
文章核心观点 - 编程语言是定义技术可能性的“元语言”,而AI时代对释放芯片算力提出了新的编程需求 [1] - CUDA作为主流GPU编程模型存在学习曲线陡峭、门槛高的问题,行业需要更友好的AI芯片编程方式 [1] - Triton作为一种创新的编程语言/平台,能够以类似Python的友好语法实现接近CUDA的高性能,并紧密集成PyTorch生态,正在降低AI芯片编程门槛并推动其普及化 [2][3] - 行业正通过举办“Triton Next技术大会”来聚集生态力量,共同探索Triton技术的现状与未来,定义AI芯片软件的新未来 [4][5][6] 大会概况与目标 - 大会名称为“Triton Next技术大会(TritonNext 2026)”,将于2026年1月9日在北京举办 [4] - 大会由众智FlagOS社区和北京智源人工智能研究院联合主办 [4] - 大会旨在探讨Triton技术的现状与未来演进,包括其编译器发展、应用场景拓展等 [5][6] - 大会面向全球AI研究员、高性能计算工程师、编译器专家、编程语言爱好者及广大开发者 [6] - 大会目标是为参与者提供从思想到实践的完整旅程,构建关于Triton技术的全景图 [6] 上午议程:顶层思想与前沿趋势 - 议题涵盖Triton诞生的第一性原理与未来蓝图、AI编译器学术报告、FlagOS社区生态进展 [7] - 具体演讲包括基于扩展Triton的DLCompiler全栈优化实践(上海人工智能实验室)[9] - 具体演讲包括AI编译器学术报告(中国科学院计算技术研究所)[9] - 具体演讲包括FlagTree v0.4版本及新的语言TLE发布(北京智源人工智能研究院)[9] - 具体演讲包括Triton-Distributed框架(字节跳动)[9] - 具体演讲包括大模型飞桨原生Triton支持方案详解(百度)[9] - 具体演讲包括摩尔线程在FlagTree中的优化实践(摩尔线程)[9] - 具体演讲包括Triton算子自动生成探索及实践(北京智源人工智能研究院)[9] - 上午议程将以FlagOS全球大赛的启动仪式收尾 [9] 下午议程:具体实践与生态拓展 - 议题聚焦Triton的具体实践,分享一线团队如何用其构建下一代AI模型 [11] - 议题关注如百度飞桨等主流AI框架如何原生支持Triton并解决软硬件适配难题 [11] - 议题展示Triton生态超越NVIDIA,拓展至如华为昇腾等其他硬件平台 [11] - 具体演讲包括Ascend NPU对Triton的开源开放支持(华为)[13] - 具体演讲包括面向Triton编译器的编译优化实践(先进编译实验室)[13] - 具体演讲包括FlagTree多层级编程语言设计讲解(北京智源人工智能研究院)[13] - 具体演讲包括C++ Runtime多后端联合开发(北京澎峰科技)[13] - 具体演讲包括FlagOS on RISC-V的现状及规划(上海苦劳科技有限公司)[13] - 具体演讲包括基于Triton的高性能分布式算子实现及编译优化(湖南卡姆派乐公司)[13] - 具体演讲包括基于FlagOS的Megatron-LM统一训练后端与分布式算子库(北京智源人工智能研究院)[13] 技术工作坊与实践环节 - 大会特设三场技术工作坊,让开发者从听到实践,将知识“变现” [15] - 工作坊1:人机协作的Triton算子培训班,指导使用Triton Copilot进行开发 [18] - 工作坊2:FlagOS-AI编译器培训班,以通俗方式讲解并现场指导编译算子 [18] - 工作坊3:基于FlagOS的具身一站式平台/FlagOS-Robot培训班,体验快速搭建具身智能应用 [18] - 大会旨在构建一个能听、能聊、能动手的交流场,而不仅是一场会议 [15] 会议地点与参与方式 - 会议地点位于北京海淀区中关村国家自主创新示范区展示中心 [16] - 参与者可通过扫码报名,大会也被定位为Triton探索者们的冬日聚会 [18]