PyTorch - 财报，业绩电话会，研报，新闻 - Reportify

PyTorch

搜索文档

陈天奇、贾扬清点赞：Vibe Coding版PyTorch，连论文都是AI写的

机器之心· 2026-01-23 16:29

项目概览与核心观点 - 英伟达杰出工程师许冰在GitHub上开源了全球首个完全由AI智能体生成的全栈深度学习系统VibeTensor，该系统从上层绑定到底层CUDA内存管理，没有一行人类编写的代码[2][11][12] - 该项目被视为对“人类编写代码的时代已经结束”这一论断的有力证明，并引发了行业广泛关注，相关帖子浏览量超过700万[1][4] - 项目论文本身也是100%由AI撰写，进一步展示了AI在复杂内容生成方面的能力[8] 项目技术架构与性能 - VibeTensor是一个功能完整的深度学习系统，包含约4.7万行自动生成的内核代码，总计核心代码行数超过16万行[3][25] - 系统独创了名为Fabric的张量子系统，这是一个显式的多设备抽象层，能够自动发现硬件拓扑并接管多卡通信，这是现有主流框架中不存在的概念[2][20] - 系统提供了“Node.js + Python”双前端，其中Node.js插件采用异步优先设计，展示了AI处理异构开发环境的灵活性[23] - 在整体性能上，VibeTensor目前仍无法与PyTorch抗衡，在多项测试中比PyTorch慢约1.7到6.2倍[16][18] - 但在特定算子性能上，AI生成的内核表现优异，例如其生成的Fused Attention内核前向计算比PyTorch原生FlashAttention快1.54倍，后向计算快1.26倍[28][29] AI智能体开发方法与局限 - VibeTensor由英伟达第四代智能体在两个月内独立完成，人类仅提供高层级需求指导，角色转变为“监工”与“策略制定者”[12][35][36] - 开发流程采用彻底的“黑盒”工作流和测试驱动的“硬核”规范，AI智能体自主进行代码生成、工具校验和多智能体评审，并利用PyTorch作为“参考原件”进行API对齐检查[36][37][39] - 项目揭示了AI编程的“弗兰肯斯坦效应”：AI能确保局部子系统逻辑正确，但组合成全局系统时会产生意想不到的性能瓶颈，例如为安全而设计的全局互斥锁严重影响了并行性能[3][30][33] - AI在处理“单次正确”任务时表现卓越，但在处理系统的“组合稳定性”时面临巨大挑战，需要跨越多层级进行调试[40] 行业意义与影响 - 该项目罕见地验证了AI能够编写复杂的系统代码，行业专家评价其为AI工程师的“AlphaGo时刻”，标志着生成式软件工程新时代的开启[4][41][42] - 项目表明AI智能体已经能够构建深度学习框架级别的复杂系统，并开始尝试从底层通信协议层面重构大规模分布式训练的逻辑[3][21] - 尽管存在局限性，但方向已经明确，未来的系统软件可能由人类定义需求，由AI自主生成[42]

英伟达(US:NVDA)

生成式软件工程

弗兰肯斯坦效应

生成式软件工程

弗兰肯斯坦效应

硅谷真实「无间道」，OpenAI前CTO怒斩泄密联创，奥特曼打包收了

36氪· 2026-01-16 20:42

核心事件概述 - OpenAI成功从竞争对手Thinking Machines Lab“反挖”三名核心技术人员回归，包括前CTO Barret Zoph及另外两名联合创始人Luke Metz和Sam Schoenholz [1][6][8] - Thinking Machines Lab创始人兼前OpenAI CTO Mira Murati解雇了CTO Barret Zoph，指控其存在“不当行为”，并可能涉及向竞争对手泄露公司机密 [3][6][8] - 此次人才流动被形容为硅谷AI领域“挖角”与“反挖角”竞争循环的典型案例 [1][28][30] 对Thinking Machines Lab的影响 - 公司遭遇重大人事地震，两位联合创始人（Barret Zoph与Luke Metz）及核心成员Sam Schoenholz集体离职并回归OpenAI，对这家成立不到一年的初创公司构成沉重打击 [12][27] - 公司正处于融资关键期，核心创始团队成员的“叛逃”被视为釜底抽薪，可能引发外界对其治理能力、团队稳定性和执行能力的担忧 [12][13][27] - 为应对危机，公司迅速任命“PyTorch之父”Soumith Chintala为新任CTO，旨在稳定军心并注入顶级工程化能力与开源社区影响力 [13][15][16] - 公司估值在2025年11月达到约500亿美元，是市场罕见的“超早期高定价”明星独角兽，此次动荡可能影响其市场形象与发展势头 [2][12] 对OpenAI的影响 - 此次回归是一次重大人才胜利，三位回归者均曾深度参与ChatGPT、GPT-4o等核心项目的开发，被称作公司的“秘密武器” [9][17][27] - 他们的回归将直接加强公司在前沿研究和应用AI领域的创新能力，并弥补了本月初研究副总裁Jerry Tworek离职造成的技术空缺 [9][27] - 公司应用CEO Fidji Simo透露，此次招揽行动已筹备数周，并明确表示不认同Mira Murati对Zoph的担忧，完全接纳其回归 [8][9] - 公司为回归者明确了新的汇报线：Barret Zoph将直接向Fidji Simo汇报，Luke Metz和Sam Schoenholz则向Zoph汇报 [8][27] 涉及的关键人物与背景 - **Barret Zoph**：前OpenAI研究副总裁（后训练方向），后成为Thinking Machines Lab联合创始人兼CTO，在Google Brain有近七年研究经验，是ChatGPT后训练与能力打磨的核心人物 [5][17][22] - **Luke Metz**：ChatGPT初始团队成员之一，曾担任GPT-4o的后训练负责人，并深度参与GPT-4评估工作 [17][23][25] - **Sam Schoenholz**：前OpenAI成员，参与早期ChatGPT相关工作 [17][27] - **Soumith Chintala**：新加入Thinking Machines Lab并出任CTO，原Meta员工，作为“PyTorch之父”在深度学习社区拥有巨大影响力 [13][15] - **Mira Murati**：Thinking Machines Lab创始人，前OpenAI CTO，于2025年2月启动该项目 [10][12] 行业竞争态势 - 硅谷AI实验室人才流动频繁，形成“旋转门”效应，此次事件是“挖角”与“反挖角”游戏的典型体现 [1][28][30] - 竞争不仅限于OpenAI与Thinking Machines Lab之间，Anthropic等其他AI公司也在积极从OpenAI挖人，例如近期OpenAI的一位高级安全研究负责人Andrea Vallone已加入Anthropic [28][29] - 随着AI竞赛白热化，顶尖AI人才的争夺战持续升级 [28][30] 公司产品与战略 - Thinking Machines Lab致力于打造“更可理解、更可定制、且更通用”的AI系统，于2025年10月发布首个产品Tinker，这是一个用于语言模型微调的API，旨在降低先进AI的使用门槛 [12] - OpenAI通过此次人才回流，巩固了自身在AI大模型后训练、评估及产品化方面的核心技术实力 [27]

Artificial Intelligence

Artificial Intelligence

OpenAI核心旧部，再创业又内讧了

36氪· 2026-01-16 08:31

核心事件概述 - 前OpenAI研究副总裁、Thinking Machines Lab联合创始人兼首席技术官Barret Zoph在加入新公司不到一年后，因被指控存在“不当行为”而离开，并迅速重返老东家OpenAI [1][3][5] - 事件涉及两家顶尖人工智能公司OpenAI与Thinking Machines Lab之间关键高管的人事变动与争议，引发行业广泛关注 [1][18] 人事变动详情 - **Barret Zoph的离职与回归**：Thinking Machines Lab首席执行官Mira Murati宣布因“不道德行为”与Barret Zoph分道扬镳 [5][6]，但OpenAI首席应用官Fidji Simo随即宣布欢迎Zoph重返公司，并透露该安排已筹备数周 [9][12] - **其他回归人员**：除Zoph外，Luke Metz和Sam Schoenholz也将一并重返OpenAI，Zoph将直接向Fidji Simo汇报，而Metz和Schoenholz将向Zoph汇报 [9][18][23] - **接任者信息**：Soumith Chintala被任命为Thinking Machines Lab新任首席技术官，其被誉为“PyTorch之父”，此前在Meta工作11年，负责基础设施和Llama模型 [27][29] 争议与各方说法 - **离职原因争议**：Thinking Machines Lab方面消息人士称Zoph曾向竞争对手泄露公司机密信息 [3][12]，而OpenAI方面则表示不认同Mira Murati对Zoph的相关担忧 [13][15] - **公众反应**：部分网友对“不道德行为”的指控表示质疑，戏称其“不道德行为”就是“加入OpenAI” [16][17] - **公司控制权背景**：在Thinking Machines Lab，首席执行官Mira Murati拥有“制度化的一票否决权”，其投票权等于其他所有董事票数之和加一 [9] 涉及人员背景 - **Barret Zoph**：曾是OpenAI后训练研究副总裁，GPT-4幕后关键贡献者之一，其学术工作被引用超过11万次，h指数为62 [19][21][22] - **Luke Metz**：曾于2022年至2024年在OpenAI参与ChatGPT早期开发，并为GPT-4、4o、o1等模型做出重要贡献 [23] - **Sam Schoenholz**：曾对GPT-4o等模型做出重要贡献，与Luke Metz在研究领域有频繁合作 [25] 行业与公司影响 - **对OpenAI的影响**：此次关键人才回流被视为OpenAI的一次巨大收获，尤其在公司近期失去研究副总裁Jerry Tworek之后 [29] - **对Thinking Machines Lab的影响**：作为估值高达500亿美元的硅谷热门初创公司，联合创始人兼首席技术官的离职暴露了其内部管理问题 [23][29] - **行业普遍现象**：文章指出“失去联创”是硅谷顶尖人工智能实验室的一个趋势，并列举了OpenAI、Thinking Machines Lab、xAI等公司联合创始人的流失情况 [29]

创业(US:VEMLY)

Artificial Intelligence

Artificial Intelligence

OpenAI核心旧部，再创业又内讧了

量子位· 2026-01-16 07:57

文章核心观点 - 文章报道了AI领域初创公司Thinking Machines Lab的联合创始人兼首席技术官Barret Zoph在创业不到一年后，因被指控存在“不当行为”而离开公司，并迅速重返其前雇主OpenAI的事件 [1][3][6] - 事件揭示了硅谷AI顶尖实验室之间激烈的人才竞争与流动，以及围绕关键人物离职所引发的公司间矛盾与舆论争议 [23][26][43] 事件时间线与关键节点 - **2024年10月**：Barret Zoph离开OpenAI [31] - **2025年2月**：Zoph与Mira Murati等多位前OpenAI核心成员正式创立Thinking Machines Lab [31] - **事件爆发日**：前《连线》杂志记者Kylie Robison爆料，Zoph因“不当行为”被Thinking Machines开除 [4][8] - **爆料后20分钟**：Thinking Machines Lab CEO Mira Murati发推确认与Zoph“分道扬镳”，并宣布由Soumith Chintala接任CTO [9] - **约一小时后**：OpenAI首席应用官Fidji Simo发推欢迎Zoph及另两位员工Luke Metz和Sam Schoenholz重返OpenAI，称此项安排已筹备数周 [12] - **随后**：Zoph本人转推并表示对重返OpenAI感到激动 [13] 各方说法与争议焦点 - **Thinking Machines Lab的指控**：公司CEO Mira Murati宣布因“不道德行为”与Zoph结束合作 [8][9] 有接近公司的消息人士向《连线》杂志透露，Zoph曾向竞争对手泄露公司机密信息 [16] - **OpenAI的立场**：OpenAI方面（通过Fidji Simo）表示，不认同Murati对Zoph的相关担忧 [21] 并强调Zoph等人的回归安排已筹备数周 [18] - **网络舆论倾向**：部分网友对“不道德行为”的具体内容表示质疑，并戏称其行为是“加入OpenAI” [24][25] 有评论认为，考虑到Mira Murati过去在OpenAI的经历，她指责他人“不道德”缺乏说服力 [25] 涉及的关键人物背景 - **Barret Zoph**：曾是OpenAI后训练研究副总裁，GPT-4的关键贡献者之一 [26][27] 在加入OpenAI前，于Google Brain担任研究科学家，其学术工作被引用超过11万次 [30][31] - **Luke Metz 与 Sam Schoenholz**：此次与Zoph一同重返OpenAI，两人均曾对GPT-4、4o等模型做出重要贡献 [33][34][36] - **Soumith Chintala**：接替Zoph成为Thinking Machines Lab新任CTO，被誉为“PyTorch之父”，此前在Meta工作11年，负责基础设施和Llama模型 [38][40] 对公司与行业的影响 - **对Thinking Machines Lab的影响**：公司估值高达500亿美元，是硅谷最热门的初创公司之一 [32] 联合创始人兼CTO的离职对公司是一次重大打击，暴露了管理问题 [43] - **对OpenAI的影响**：此次人才回流被视为OpenAI在与谷歌等对手竞争中的一次重要补强，尤其是在其研究副总裁Jerry Tworek近期离职之后 [41][42] - **行业普遍现象**：文章指出，顶尖AI实验室“失去联创”已成为一种趋势，例如OpenAI的11位联合创始人中已离开8位，Thinking Machines的6位联创中已离开3位 [44]

Artificial Intelligence

Artificial Intelligence

Mira公司内乱？CTO被开除，带团队回OpenAI，翁荔上推发言

机器之心· 2026-01-15 17:17

核心事件与人事变动 - Thinking Machines Lab CEO Mira Murati宣布联合创始人兼CTO Barret Zoph被解雇，原因是其个人不道德行为，该消息在全体员工大会上宣布[2][5] - 同一日，公司任命PyTorch之父、前Meta研究员Soumith Chintala为新任首席技术官[2][23] - 约一小时后，OpenAI应用CEO Fidji Simo宣布Barret Zoph将重返OpenAI，一同回归的还有Thinking Machines Lab联合创始人Luke Metz及创始团队成员Sam Schoenholz[3] Thinking Machines Lab公司背景 - 公司于2025年2月正式成立，核心团队主要由来自OpenAI、Google DeepMind等顶级实验室的前核心成员组成[6] - 成立五个月后获得约20亿美元种子轮融资，投后估值达120亿美元，成为硅谷历史上规模最大的种子轮融资之一，投资方包括英伟达、AMD、Cisco等[6] 关键人物背景 - **Barret Zoph**：前OpenAI技术主管，领导过后训练团队，研究方向包括对齐、工具使用、评估、ChatGPT等，也是两篇重要神经网络架构搜索论文的第一作者[8][10] - **Luke Metz**：前OpenAI创始团队成员，与John Schulman等人内部共同开发了ChatGPT的雏形“low-key research preview”，也是GPT-4、GPT-4o、o1等模型的贡献者之一[12][13] - **Sam Schoenholz**：在加入Thinking Machines Lab前，曾领导OpenAI的可信赖扩展团队和GPT-4o优化，此前在Google Brain从事统计物理学与机器学习交叉研究，其合著论文《Neural message passing for quantum chemistry》被引用11898次[18][19][20] - **Soumith Chintala**：PyTorch的联合创造者，于2025年11月离开Meta后加入Thinking Machines Lab，现被任命为CTO[23] 行业观察与反应 - 人工智能领域人才流动频繁，即使创始团队成员也频繁变动[7] - 联合创始人Lilian Weng在事件后发表感言，强调与真正在乎产品、追求工匠精神的伙伴共事是一种享受和荣幸[6]

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

GPT-4 技术功臣疑似泄密被开除，OpenAI 系创业天团上演「无间道」

36氪· 2026-01-15 10:29

公司人事变动 - 明星AI初创公司Thinking Machines Lab解雇其首任首席技术官Barret Zoph，并立即任命Soumith Chintala为新任首席技术官[1] - 据知情人士透露，Barret Zoph是因不道德行为被解除职务的，公司联合创始人Mira Murati在全员会议上当场宣布此决定[1] - 有消息人士透露，Zoph曾向竞争对手泄露公司机密信息[2] - Zoph在周一告知考虑离职，周四即被正式解雇，过程迅速[3] - 被解雇的联合创始人Barret Zoph、另一位联合创始人Luke Metz以及员工Sam Schoenholz将重新加入OpenAI[5] 公司核心团队 - 公司创始人Mira Murati曾任OpenAI首席技术官，统筹过ChatGPT、GPT-4、DALL-E等关键项目，并在2023年11月董事会风波中短暂担任OpenAI临时首席执行官[9] - 新任首席技术官Soumith Chintala被称为“PyTorch之父”，两个月前从Meta离职加入公司，他在Meta的11年间将PyTorch从0做到AI领域90%以上的采用率[7][9] - 创始团队约30多人，其中约三分之二成员来自OpenAI，包括前OpenAI首席科学家John Schulman、DALL-E联合创始人Alec Radford、基础设施副总裁Bob McGrew、对齐研究核心Lilian Weng等[11] - 公司使命是打造“可理解、可定制、更通用”的多模态AI，研究重点包括单样本或少样本快速适配，并承诺定期发布代码、技术博客和数据集以推动开放科学文化[11] 公司融资与估值 - 公司于2025年7月完成20亿美元种子轮融资，由a16z领投，英伟达、AMD、Accel、Cisco、Jane Street等跟投[13] - 此轮融资后公司估值达120亿美元，创下硅谷史上最大种子轮融资纪录[13] 相关人物背景 - 被解雇的Barret Zoph曾任职于Google Brain 6年，后加入OpenAI担任后训练副总裁，是ChatGPT、GPT-4、GPT-4o等产品的核心贡献者，并于2024年5月发布会现场演示GPT-4o功能[5][7] - 其回归OpenAI正值该公司研究副总裁Jerry Tworek近期离职，OpenAI应用部门首席执行官Fidji Simo在内部备忘录中表示，OpenAI对Zoph的担忧与Mira Murati不一致[5]

创业(US:VEMLY)

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

DeepSeek等8大产品都是意外?! 改变世界的项目们，最初都没被“当个事儿办”

搜狐财经· 2026-01-13 09:47

文章核心观点 - 许多具有世界级影响力的重要产品最初都起源于非主线、非KPI驱动的“支线项目”，这些项目因其灵活性和低约束环境而成为创新的重要源泉 [1] - 在AI时代，技术降低了试错成本，个人或小团队能更快速地进行探索和验证，这使得支线项目更有可能孕育出颠覆性的成果，并可能成为未来方向的早期信号 [7][8][10] 支线项目的定义与特征 - 支线项目被界定为非主线、非KPI驱动、最初非战略立项的项目，其成立之初并不重要，也非公司的核心战略方案 [1] - 这类项目通常没有项目经理、销售、市场进入策略、合规或股东的过多干预，被认为是“魔法生效的地方” [1] - 支线项目允许技术跑在需求前面，能够绕开创业项目常见的节奏、叙事、融资节点和对外承诺等约束 [2] 国内支线项目案例分析 - **DeepSeek（幻方量化）**：作为量化投资公司的支线项目诞生，并非聚光灯下的战略产品，而是内部技术演进的自然延伸 [2] - 幻方量化长期进行算力、模型和工程效率的技术研究，首先服务于量化交易，AI作为辅助金融分析的支线工具 [2] - 公司拥有丰富的GPU集群资源（算力）和金融专业场景的长期数据优势，在研发通用智能时更注重模型推理和数学能力 [2] - 长期高强度算法投入和顶尖人才储备，为打造爆款AI产品创造了条件 [2] - **Qwen（阿里巴巴）**：在阿里内部早期也是支线项目，公司当时的大模型战略主线是面向行业ToB用户的商业化交付 [3] - Qwen选择了一条开源道路，其早期发展采用了“放养”模式，公司给予研究团队空间，在证明价值后再逐步融入主线资源 [3] - 支线项目模式被认为能提高成功几率，原因包括：减少过度决策参与，将自主权交还给研发人员；减少微观管理，以更大的试错空间换取更快的迭代速度 [3] 硅谷支线项目案例分析 - **Claude Code（Anthropic）**：最初是工程师Boris Cherny的一个实验性支线项目，始于一个能连接Apple设备并告知用户所听音乐的简单功能 [5] - 在与产品经理交流后，项目方向演变为开发与系统文件交互的工具（如读/写文件、运行批处理命令），并在相当偶然的情况下诞生 [5] - 项目正式面市后产生暴风式传播效应，成为Anthropic的当家产品之一 [5] - 该项目展示了AI编程能力的飞速进步：一年前，Claude在生成bash命令时还存在问题且只能短暂工作；如今，开发者利用Claude Code+Opus4.5在30天内提交了259个PR、497次提交，添加了40000行代码并删除了38000行代码，Claude能持续运行数分钟、数小时甚至数天 [5] - 该支线项目现已推动软件工程进入新的范式时期 [6] AI时代下支线项目价值的变化 - AI显著降低了试错成本，过去需要团队协作和资源协调的探索，现在个人能更轻松、迅速地完成初步验证 [7] - 这使得“探索”不必再总是正式的立项行为，在日常工作中就可能产生新思路或新方法 [7] - 许多支线项目从解决具体问题开始，通过真实使用不断修正方向，最终成长为重要产品 [8] - AI缩短了从想法到验证的距离，项目的价值在于能否被迅速使用和反馈，从而放大了个人探索的价值 [8] - 虽然AI提升了执行效率，但未必同步提升战略判断的准确性，主线项目在技术环境变化时可能受原有判断束缚而难以调整 [10] - 支线项目探索成本更低、反馈更快，为主线方向在验证后承接规模化任务奠定了基础 [10] - 在AI时代，关乎未来方向的早期信号，可能会越来越多地出现在最初不被重视的项目里 [10]

Artificial Intelligence

Artificial Intelligence

DeepSeek等8大产品都是意外?! 改变世界的项目们，最初都没被“当个事儿办”

量子位· 2026-01-11 12:02

文章核心观点 - 文章核心观点认为，许多改变世界的知名产品最初都起源于不被重视的“支线项目”，这些项目因非KPI驱动、非战略立项而拥有更大的创新自由度和试错空间，最终成功逆袭成为公司核心产品或行业标杆 [1][2][3] - 在AI时代，由于技术降低了试错成本，个人或小团队通过支线项目进行探索和验证的效率大幅提升，这使得关乎未来方向的早期信号可能越来越多地出现在这类项目中 [37][42][53] 支线项目的定义与特征 - 支线项目被定义为非主线、非KPI驱动、最初非战略立项的项目，其成立之初对公司战略并不重要 [2] - 这类项目因不受项目经理、销售、合规、股东等约束，被认为是“魔法生效的地方”，拥有更大的自由度和创新潜力 [3] 国内支线项目案例：DeepSeek与Qwen - **DeepSeek**：是量化投资公司幻方量化内部的支线项目，最初作为服务于量化交易的技术研究自然延伸而出，并非战略立项 [11][12] - 公司因量化交易背景，拥有丰富的GPU算力资源和金融场景数据优势，为AI研发提供了坚实基础 [14][15][16] - 项目绕开了创业项目常见的节奏、融资等约束，允许技术跑在需求前面 [13] - **Qwen**：是阿里巴巴的支线项目，在公司早期战略更侧重于ToB大模型商业化交付的背景下，坚定走上了开源道路 [20][21] - 项目负责人指出，支线项目通过减少过度决策和微观管理，将自主权交还给研发人员，从而提高了成功几率和迭代速度 [22][23][24] - 公司采取“放养”策略，在项目证明价值后再逐步融入主线资源 [25][26] 硅谷支线项目案例：Claude Code与ChatGPT等 - **Claude Code**：最初是Anthropic工程师Boris Cherny基于Claude大模型的一个实验性支线项目，旨在与系统文件交互 [27][28][30] - 项目面市后产生暴风式传播，成为公司当家产品之一 [32] - 工程师记录显示，该项目已深刻改变其工作流程：在过去30天里，其使用Claude Code提交了259个PR、497次提交，添加了40000行代码，删除了38000行代码，Claude能持续运行数分钟至数天 [34] - **其他案例**：文章列举了多个源自支线项目的全球知名产品，包括OpenAI的ChatGPT、Meta的PyTorch、Google的Gmail、Odeo的Twitter（现X）以及Tiny Speck的Slack [4] AI时代支线项目的趋势与价值 - **试错成本降低**：AI加速进入软件工程流程，显著拉低了试错成本，使个人能更轻松、迅速地完成初步验证，缩短了从想法到验证的距离 [37][38][42] - **探索模式改变**：探索不再必须作为正式立项行为，许多支线项目始于解决具体问题，通过真实使用不断修正方向而最终成长为重要产品 [39][41][43] - **个人价值放大**：当试错足够便宜，能否被迅速使用和反馈变得更重要，这直接放大了个人探索的价值 [44][45] - **与主线项目的关系**：支线项目探索成本低、反馈快，能为主线项目在方向被验证后承接规模化任务打下基础，但AI并未同步提升战略判断的准确性，主线项目在技术环境变化时仍可能受原有判断束缚 [47][48][51]

那个固执的法国老头走了，带走了硅谷最后的理想主义

AI科技大本营· 2026-01-05 18:12

公司战略与文化变迁 - 2013年，公司为探索智能本质，打破商业公司规矩，以优厚条件聘请Yann LeCun并成立FAIR研究部门，营造了不计成本、不问产出的纯研究象牙塔环境 [4][8][9][12][13] - FAIR的黄金时代在2025-2026年宣告终结，标志是LeCun离职以及Alexandr Wang空降，公司战略转向强调商业变现、算力堆叠和暴力美学的实用主义路线 [2][4][5][44][47][56] - 公司内部文化发生剧烈碰撞，从LeCun推崇的工程师直觉优于KPI、开放开源的“保护区”文化，转变为由年轻管理层主导、强调保密协议和KPI考核的商业化文化 [14][23][44][49][50] 关键人物贡献与影响 - Yann LeCun作为首席AI科学家，其核心贡献并非直接写代码，而是利用政治资本为PyTorch等研究项目提供保护伞，并坚持默认开源策略，最终使PyTorch反噬TensorFlow，成为学术界主流框架 [17][20][21][22][24] - LeCun在2023年公司AI战略落后时，推动Llama大模型采用开源策略，成功让公司重回AI竞争中心，但其技术路线（世界模型）与主流大语言模型路线存在根本分歧 [40][41][52] - Alexandr Wang于2025年空降成为公司首席AI官，其哲学是“规模就是一切”，代表硅谷新一代强调数据、算力堆叠和快速商业化的技术路线 [5][44][48][49] 技术路线分歧与竞争格局 - LeCun是坚定的“物理主义者”，认为智能基石是理解物理规律和因果关系的“世界模型”，并多次批评大语言模型只是基于统计预测下一个词，并未真正理解世界 [29][30][32][33][36] - 以Transformer架构和预测下一个词为核心的大语言模型路线，自ChatGPT发布后成为行业主流和资本焦点，与LeCun主张的路线形成鲜明对立 [31][34][35][37][55] - 2025年行业竞争白热化，焦点集中于AGI竞赛，开源优势被稀释，行业讨论重点从“AI向善”、“可解释性”转向纯粹的AGI竞赛和商业化 [44][45] 标志性产品与项目 - PyTorch起源于FAIR内部研究员对灵活研究工具的需求，在LeCun的保护和开源策略下，最终在顶级学术会议上占据80%的论文使用率，击败了Google的TensorFlow [18][19][22] - Llama大模型系列是公司应对竞争的关键产品，尽管其技术基础与LeCun的理念相悖，但凭借开源策略成功吸引了全球开发者，帮助公司重获市场地位 [40][41] - LeCun在任期间还推动了如RoBERTa、DINO等体现科研严谨性和前瞻性（如自监督学习）的项目 [63] 行业象征与历史意义 - FAIR的十三年被视为AI时代的贝尔实验室或施乐帕罗奥多研究中心，代表了不计商业回报、追求科学发现的理想主义时代，其产出的开源火种和生态影响了整个行业 [4][58][59][60] - LeCun的离职被视为一个时代的终结，象征硅谷最后理想主义的消退，其留下的关于智能本质的不同路径思考，可能在未来行业遇到瓶颈时被重新审视 [4][57][60][62]

Meta Platforms(US:META)

大语言模型

大语言模型

不要死磕CUDA，国内首个Triton技术大会官宣，AI芯片编程迎来新范式

AI科技大本营· 2025-12-26 13:42

文章核心观点 - 编程语言是定义技术可能性的“元语言”，而AI时代对释放芯片算力提出了新的编程需求 [1] - CUDA作为主流GPU编程模型存在学习曲线陡峭、门槛高的问题，行业需要更友好的AI芯片编程方式 [1] - Triton作为一种创新的编程语言/平台，能够以类似Python的友好语法实现接近CUDA的高性能，并紧密集成PyTorch生态，正在降低AI芯片编程门槛并推动其普及化 [2][3] - 行业正通过举办“Triton Next技术大会”来聚集生态力量，共同探索Triton技术的现状与未来，定义AI芯片软件的新未来 [4][5][6] 大会概况与目标 - 大会名称为“Triton Next技术大会（TritonNext 2026）”，将于2026年1月9日在北京举办 [4] - 大会由众智FlagOS社区和北京智源人工智能研究院联合主办 [4] - 大会旨在探讨Triton技术的现状与未来演进，包括其编译器发展、应用场景拓展等 [5][6] - 大会面向全球AI研究员、高性能计算工程师、编译器专家、编程语言爱好者及广大开发者 [6] - 大会目标是为参与者提供从思想到实践的完整旅程，构建关于Triton技术的全景图 [6] 上午议程：顶层思想与前沿趋势 - 议题涵盖Triton诞生的第一性原理与未来蓝图、AI编译器学术报告、FlagOS社区生态进展 [7] - 具体演讲包括基于扩展Triton的DLCompiler全栈优化实践（上海人工智能实验室）[9] - 具体演讲包括AI编译器学术报告（中国科学院计算技术研究所）[9] - 具体演讲包括FlagTree v0.4版本及新的语言TLE发布（北京智源人工智能研究院）[9] - 具体演讲包括Triton-Distributed框架（字节跳动）[9] - 具体演讲包括大模型飞桨原生Triton支持方案详解（百度）[9] - 具体演讲包括摩尔线程在FlagTree中的优化实践（摩尔线程）[9] - 具体演讲包括Triton算子自动生成探索及实践（北京智源人工智能研究院）[9] - 上午议程将以FlagOS全球大赛的启动仪式收尾 [9] 下午议程：具体实践与生态拓展 - 议题聚焦Triton的具体实践，分享一线团队如何用其构建下一代AI模型 [11] - 议题关注如百度飞桨等主流AI框架如何原生支持Triton并解决软硬件适配难题 [11] - 议题展示Triton生态超越NVIDIA，拓展至如华为昇腾等其他硬件平台 [11] - 具体演讲包括Ascend NPU对Triton的开源开放支持（华为）[13] - 具体演讲包括面向Triton编译器的编译优化实践（先进编译实验室）[13] - 具体演讲包括FlagTree多层级编程语言设计讲解（北京智源人工智能研究院）[13] - 具体演讲包括C++ Runtime多后端联合开发（北京澎峰科技）[13] - 具体演讲包括FlagOS on RISC-V的现状及规划（上海苦劳科技有限公司）[13] - 具体演讲包括基于Triton的高性能分布式算子实现及编译优化（湖南卡姆派乐公司）[13] - 具体演讲包括基于FlagOS的Megatron-LM统一训练后端与分布式算子库（北京智源人工智能研究院）[13] 技术工作坊与实践环节 - 大会特设三场技术工作坊，让开发者从听到实践，将知识“变现” [15] - 工作坊1：人机协作的Triton算子培训班，指导使用Triton Copilot进行开发 [18] - 工作坊2：FlagOS-AI编译器培训班，以通俗方式讲解并现场指导编译算子 [18] - 工作坊3：基于FlagOS的具身一站式平台/FlagOS-Robot培训班，体验快速搭建具身智能应用 [18] - 大会旨在构建一个能听、能聊、能动手的交流场，而不仅是一场会议 [15] 会议地点与参与方式 - 会议地点位于北京海淀区中关村国家自主创新示范区展示中心 [16] - 参与者可通过扫码报名，大会也被定位为Triton探索者们的冬日聚会 [18]