腾讯“龙虾”翻车实录:夯级噱头,拉级体验
阿尔法工场研究院· 2026-03-25 10:12
文章核心观点 - 腾讯近期密集推出QClaw、ClawBot等“微信直连”AI产品,但实测体验显示产品完成度低,存在安装复杂、功能不稳定、执行能力弱等多重问题,是一个“半成品”[33][34] - 腾讯急于推出不成熟产品,核心战略是“抢入口”,旨在将AI能力嵌入微信这一拥有14亿月活的流量池,以抢占下一代操作系统入口,避免在AI竞争中落后于字节、阿里等对手[37][38][40][43] - 腾讯采取“先上车、再补票”的策略,试图以海量用户为实验场、用迭代速度弥补质量短板,但面临用户已体验过竞品(如飞书)的成熟服务,可能损害产品口碑的风险[45][46][47] QClaw产品实测总结 - **安装与连接问题**:官方宣传“几分钟上手”,但实测中扫码绑定微信时出现“网络异常”提示,绑定后消息无法正常发送,需卸载重装才解决[7][8] - **基础任务执行能力弱**: - 汇总24小时AI新闻任务耗时**10分钟以上**,结果时间线混乱、内容不全面[10] - 尝试自动化小红书创作发布,因登录验证问题无法访问后台,任务卡住[11] - 自动化处理Excel表格并生成PPT,耗时约**4分钟**(2分钟找文件,2分钟读内容),结果合并错数据、识别反列名,生成PPT时图文不符,且保存时险些覆盖其他文件[13][14][15] - **产品设计缺陷**:不支持多任务并行,执行新任务会中断现有任务,严重影响工作效率[16][17] ClawBot插件实测总结 - **安装门槛极高**:官方宣传“一键开启”,实际为灰度放量,仅部分**微信Version 8.0.69**用户可见,安装过程反复出现“未安装文件”、“权限被拒绝”提示,需额外安装软件包,耗时近**1小时**[23][26] - **功能局限且依赖后端**:插件更像一个将OpenClaw功能搬入微信的容器,缺乏Markdown渲染、云文档集成、本地文件处理等能力,其功能高度依赖后端配置的“龙虾”模型及用户自行配置的Skills和API Key[27][28][30][31] - **用户体验差**:不支持群聊功能,限制了协作场景,对普通用户而言体验易降级为基础文本聊天,许多用户因安装复杂直接放弃[29][30][32] 行业竞争与公司战略背景 - **行业竞争态势**:字节跳动的飞书已将AI深度集成,在文档智能、会议总结、知识库关联及企业级自动化方面提供稳定高效的体验;阿里的企业Agent也在快速落地,给腾讯带来竞争压力[42] - **公司战略动机**:腾讯将“龙虾类应用(OpenClaw生态)”视为给微信AI打开新想象空间的关键,并列为**2026年战略重点**,其核心逻辑是通过微信这一最大流量池和“最后的护城河”,抓住AI生产力入口,与字节、阿里正面竞争[39][40][41][43] - **公司策略选择**:在行业疯狂追赶OpenClaw的背景下,腾讯没有选择长时间内测打磨,而是优先推出产品抢占市场入口,体现了其以用户规模换迭代速度的典型打法[37][44][45]
告别张雪峰,那个“拼命三郎”走了
阿尔法工场研究院· 2026-03-25 10:12
行业背景与市场环境 - 考研热持续升温,考研领域存在巨大的市场需求和关注度 [11] - 数百万考生每年参加考研,对择校择专业等指导服务有强烈需求 [15] 公司发展历程与商业模式 - 创始人从考研机构基层销售做起,后转型为讲师并凭借独特的教学风格走红 [6][8][9] - 2016年创立研途教育,完成从讲师到创业者的转型 [10] - 业务模式包括线上视频课程、线下巡回讲座、出版书籍及社交媒体运营,形成个人品牌与商业机构的结合 [10][14] - 通过频繁登上综艺节目、运营数千万粉丝的社交媒体账号进行个人品牌建设和市场推广 [10] 运营与财务表现 - 高峰期运营强度极高,创始人一年飞上百个城市,一天连讲六七场 [14] - 创始人曾连续工作72小时,一年有200多天住在酒店,体现了高强度的工作投入 [15] - 公司核心课程研发和讲授在创业初期由创始人亲自承担,同时需处理管理、融资等事务 [15] 市场竞争地位与品牌影响 - 创始人成为全国最知名的考研辅导老师之一,是考研领域的符号性人物 [7][11] - 一段7分钟解读34所985高校的视频在网上爆红,使其成为“网红老师”,显示了强大的内容传播力 [10] - 品牌影响力覆盖数千万学生,尤其在农村学子和“双非”院校学生中拥有重要地位 [18] - 商业模式和言论引发争议,被指贩卖焦虑、言论绝对及过度商业化,但也因其打破信息壁垒而获得大量支持 [17][18] 行业趋势与用户需求 - 教育被视为“等不起”的事,用户对能提供明确选择和奋斗路径的指导服务有迫切需求 [15] - 大量出身普通、信息闭塞的学生需要择校择专业的指导,以在升学竞争中少走弯路 [18] - 创始人用直白方式拆解名校游戏规则,满足了用户对透明、易懂教育信息的需求 [3][18]
黄仁勋:英伟达已经从GPU公司演变为“AI工厂”
阿尔法工场研究院· 2026-03-25 10:12
AI工厂操作系统与公司战略演进 - 公司推出名为“Dynamo”的AI工厂操作系统,其核心技术是“解耦推理”,被视为下一次工业革命的工厂操作系统 [1][2] - 公司已从一家GPU公司演变为AI工厂公司,其计算能力分布在GPU、CPU、交换机、网络处理器等部件上,并计划整合Grok芯片,将合适的工作负载放在合适的芯片上运行 [2] - CEO的职责是定义愿景和战略,倾向于选择“极其困难”、“前所未有”并能发挥公司核心优势的领域 [2] AI计算需求与市场分析 - AI计算需求巨大增长,从生成式AI到推理计算,再到智能体计算,所需的计算量在两年内可能增长了上万倍,这驱动了对AI基础设施的巨大需求 [2] - 在回应关于其AI工厂建造成本过高的质疑时,强调不应将工厂的建造成本与AI“代币”的生成成本划等号,投资更高的工厂因效率优势,反而能产生单位成本最低的代币 [2] - 公司是唯一一家与全球所有AI公司合作、提供全栈解决方案、并能在任何云和边缘部署的AI公司,其市场份额正在增加 [4] 重点增长领域与产业展望 - 物理AI是一个价值50万亿美元的巨大产业,公司在此已形成年收入近百亿美元的业务,并正快速增长 [3] - 数字生物学即将迎来“ChatGPT时刻”,未来几年医疗健康行业将因此发生重大转变 [3] - 预测具备高功能证明的机器人产品将在3到5年内普及,并指出中国是微电子、电机、稀土、磁铁等机器人基础组件的全球领导者,全球机器人产业在很大程度上依赖于中国的生态系统和供应链 [4] 技术应用与行业影响 - 高度评价“OpenClaw”等开源智能体项目,认为其重新定义了计算机,是未来个人AI计算机的蓝图 [4] - 智能体将成为获取“工作成果”的关键,企业软件行业将因智能体的广泛使用而获得百倍增长 [4] - 阐述自动驾驶平台战略,即不造车,但为所有汽车制造商提供包括训练、仿真、车载计算机在内的全套技术栈,致力于让“所有会移动的东西”都实现自动化 [4] 行业趋势与人才需求 - 承认某些工作(如人类驾驶)会被AI取代,但认为更多新工作会被创造 [5] - 建议年轻人成为“使用AI的专家”,并强调在AI时代,深度科学、数学和语言技能(如英语)仍然至关重要 [5]
AI夜校| 未可知 x 浙江大学: 《AI应用工具与提示词方法》银发班
未可知人工智能研究院· 2026-03-25 10:02
文章核心观点 - 未可知人工智能研究院在浙江大学举办面向中老年人群的AI夜校课程,旨在降低该群体接触人工智能的门槛,帮助其掌握实用AI技能,消除数字鸿沟,这是其全民AI科普计划的重要组成部分 [1][4][17] 课程内容与教学方式 - 课程以“零基础、听得懂、用得上”为核心原则,聚焦中老年群体的日常需求,系统讲解AI应用基础及实用工具使用方法 [4] - 讲师吴小楠围绕AI应用工具与提示词工程两大核心模块展开,避开专业术语,用通俗易懂的语言拆解AI的核心逻辑与使用方法 [6] - 课程介绍了当前主流的国产AI工具,包括豆包、DeepSeek、腾讯元宝、通义千问等,并详细演示了电脑端与手机端的操作流程,从工具打开、对话发送到利用AI生成文案、制作行程、创作图像等,进行手把手教学 [6] - 提示词工程是课程重点,讲师总结了提示词撰写四步法:明确角色、说明背景、明确任务、提出要求,并以“西安亲子两日游”为实例现场演示如何生成详细行程表 [8][9][12] - 讲师还分享了6大提示词打磨技巧,帮助学员从“会提问”提升为“问得好”,最大化发挥AI的实用价值 [12] 未来计划与产品推广 - 后续课程将重点讲解热门工具OpenClaw的使用方法,该工具被称为AI的“数字手脚”,核心功能是自动完成流程化、重复性任务,无需编程知识,通过自然语言指令即可操作 [13][14][15] - 同时推荐了研究院院长杜雨博士的新作《养龙虾》,这是一本关于OpenClaw的科普著作 [15] 机构使命与合作网络 - 举办中老年AI夜校是践行全民AI科普计划的具体举措,核心目标是降低科技门槛,让银发族享受人工智能带来的生活便利 [17] - 未来将持续推出更多公益科普课程,涵盖AI实用技能、前沿技术解读等内容,覆盖全年龄段、全场景需求 [17] - 文章末尾展示了广泛的合作伙伴列表,涵盖科技、金融、教育、制造、能源、传媒等多个行业的企业与机构,例如字节跳动、中信泰富、国家电网、浙江大学管理学院等 [20]
中国银行、建设银行、民生银行、工商银行,发布风险提示
新华网财经· 2026-03-25 09:26
行业动态:贵金属市场风险警示 - 近期贵金属价格剧烈波动,市场不确定性显著上升[3] - 多家银行发布风险提示公告,建议客户提高风险防范意识[3] - 银行建议客户基于自身财务状况和风险承受能力理性投资,合理控制仓位[3] 银行机构的具体建议 - 中国银行建议投资者通过长期投资降低阶段性价格波动影响[5] - 工商银行提示投资者秉持“总量控制、分批入场、多元布局”的原则,构建更为稳健的资产组合[5] 专家观点与投资策略 - 南开大学金融学教授田利辉认为,当前贵金属市场的波动已超出正常回调范畴,进入了高烈度、高不确定性的非常态阶段[6] - 专家建议普通投资者更适合通过积存金、黄金ETF等无杠杆方式进行长期配置[6]
突发!OpenAI关停Sora,精简产品线为 IPO 铺路;Momenta 港股秘密递表,预计年内上市;别吵了!Token中文名定了:词元丨雷峰早报
雷峰网· 2026-03-25 08:52
OpenAI战略调整与产品关停 - OpenAI宣布全面关停其视频生成服务Sora,包括消费端应用、开发者API及ChatGPT中的视频生成功能,以简化AI产品线,为年内冲刺IPO做准备 [2] - 随着Sora关停,OpenAI终止了与迪士尼为期三年、价值10亿美元(约合68.96亿元人民币)的合作,该合作原计划允许OpenAI在Sora中使用迪士尼旗下角色 [3] AI行业动态与标准制定 - 国家数据局局长刘烈宏在中国发展高层论坛上,将Token的中文翻译正式定为“词元”,并指出其作为智能时代价值锚点与结算单位的重要性 [5] - 中国日均Token调用量从2024年初的1000亿,跃升至2025年底的100万亿,并在2026年3月突破140万亿,两年增长超千倍,以Token计费的新型商业逻辑正在加速演进 [5] - AI智能体框架OpenClaw进行大规模版本升级,但因激进重构导致插件系统崩溃、用户全线报错,开发者回应称因流量暴增及限流规则过严所致 [29][30] - Anthropic对Claude Code与Claude Cowork进行重磅升级,使AI能直接操控电脑(如打开文件、操控浏览器),被视为对OpenClaw核心功能的直接对标 [43] 科技公司人事与组织变动 - 蜜雪冰城创始人张红甫卸任集团CEO,转任联席董事长,由35岁的原执行副总裁兼首席财务官张渊接任CEO [6] - 前小米全球副总裁雨果·巴拉(Hugo Barra)作为AI创业公司Dreamer的联合创始人,随团队一同被Meta收编,加入其超级智能实验室 [34] - 小米集团中国区市场部员工王腾因泄露公司机密等严重违规行为被辞退,其此前已宣布成立新公司“今日宜休” [26] - 捷豹路虎设计主管格里·麦戈文在任职22年后离职,将创办个人设计咨询公司 [40] 消费电子与硬件产业 - 小米集团总裁卢伟冰回应内存涨价,称此轮涨价速度与力度超出预期,对经营构成挑战,若未来成本压力持续,不排除产品涨价可能 [13] - 小米集团2025年全年营收达4572.9亿元人民币,同比增长25%;调整后净利润为391.7亿元人民币,同比增长43.8% [13] - OPPO宣布Find X9 Ultra将搭载哈苏10倍光变天眼长焦,支持原生10倍光学变焦,采用行业前所未有的5次反射潜望架构 [22][23] - 博主爆料某厂商(推测为iQOO)新开两款6.83英寸2K LTPS超高刷直屏中高端手机,测试高通骁龙8 Elite和联发科天玑9500等平台 [28] - 阿里达摩院发布新一代旗舰RISC-V CPU玄铁C950,称其单核性能在SPEC Cint2006测试中首次超过70分 [20] 汽车行业动态与召回 - 华晨宝马与宝马(中国)将在华召回179,527辆汽车,涉及2023至2025年间生产的部分国产及进口5系、7系等车型,召回原因为前排空调线束排线不合理,极端情况下存在起火风险 [18] - 比亚迪2月在泛欧洲市场新车注册量达17,954辆,同比激增162.3%,市场份额从0.7%升至1.8%,连续第二个月超越特斯拉(17,664辆) [32] - 智能驾驶方案供应商Momenta已向港交所秘密递交招股书,预计2026年内上市,IPO估值预期超千亿元,公司已累计搭载车辆近70万辆 [46] 互联网与AI应用进展 - 京东公布多项AI进展,包括开源基础大模型JoyAI-LLM Flash的Instruct版本,其“龙虾”系列产品上线后近一周Token调用量环比增长高达455% [21] - 京东计划发动内部超10万名员工及外部最多50万人员,开展大规模数据采集行动,计划一年内积累500万小时人类真实场景视频数据,用于具身智能研发 [22] - 美团回应App自动删除用户照片事件,称该问题由安卓系统下App自动缓存清理时与第三方SDK冲突导致,累计有180多位用户咨询,问题已修复 [17] - 汽车之家多个社交平台官方账号被禁止关注,平台客服称原因为评论区互动违规,公司回应称账号即将恢复正常 [10] 半导体与芯片产业 - Arm将首次开始销售自有芯片,Meta将成为其AGI CPU芯片的首个主要客户,该芯片将拥有多达136个核心,功耗300瓦,由台积电生产 [37] - SK海力士正考虑在美国以存托凭证形式上市,计划募资10万亿至15万亿韩元,用于在韩国建设人工智能基础设施 [47] 企业财报与业绩 - 蜜雪集团2025年实现营收335.6亿元人民币,同比增长35.2%;归母净利润58.8亿元人民币,同比增长32.7%;截至2025年底全球总门店约6万家 [8] - 汽车之家2025年全年总营收64.5亿元人民币,归属于公司的经调整净利润为16.1亿元人民币 [11] 资本市场与IPO - 凯乐士科技在港交所上市,开盘大涨96.16%,市值达139.83亿港元,其2024年总收入为7.21亿元人民币 [47][49] - 泽景股份在港交所上市,开盘涨2.94%,市值56.14亿港元,按2024年销量计,公司是中国第二大HUD解决方案供应商,市场份额16.2% [49][50] - 华勤技术再次向港交所递交招股书,公司2025年营业收入达1714.37亿元人民币,净利润41.31亿元人民币 [50][51] - 毫米波雷达供应商承泰科技向港交所递交招股书,公司2025年营业收入为11.22亿元人民币 [51][52] 游戏与娱乐产业 - Epic Games宣布裁员1000人,主因是《堡垒之夜》玩家活跃度下滑,公司支出高于收入,同时公司削减了5亿美元成本(约合34.48亿元人民币) [37][38] 其他行业要闻 - 苹果宣布WWDC26全球开发者大会将于6月9日至13日在线举行,预计将聚焦AI进展及新系统发布 [40] - 三星电子管理层与韩国工会同意就奖金问题恢复谈判,该工会代表着韩国近9万名工人,此前曾投票授权罢工 [43]
国际油价大跌,现货黄金、白银拉升
新华网财经· 2026-03-25 08:44
国际原油市场行情 - 3月25日,布伦特原油期货价格大跌近6%,报94.35美元/桶,较前一交易日结算价下跌5.88美元 [1] - 同日,WTI原油期货价格下跌5.19%,报87.55美元/桶,较前一交易日结算价下跌4.80美元 [1][3] - 布伦特原油当日开盘价为96.60美元,最高价96.60美元,最低价94.19美元,振幅2.40% [2] - WTI原油当日开盘价为88.49美元,最高价89.36美元,最低价87.50美元,振幅2.01% [3] 原油期货技术指标 - 布伦特原油的布林带指标显示,中轨为92.13美元,上轨为113.11美元,下轨为71.16美元 [2] - WTI原油的布林带指标显示,中轨为85.94美元,上轨为106.73美元,下轨为65.16美元 [3] 其他主要金融市场表现 - 3月25日,美元指数报99.1329,微跌0.0935% [4] - 纽约黄金价格上涨3.23%,报4577.17美元;伦敦现货黄金价格上涨1.47%,报4540.17美元 [4] - 纽约白银价格大幅上涨5.13%,报73.14美元;伦敦现货白银价格上涨2.36%,报72.83美元 [4]
谁在决定良率?揭秘AI芯片狂飙背后的“隐形控制力”
半导体行业观察· 2026-03-25 08:40
文章核心观点 - 在AI算力驱动下,半导体制造进入高度复杂的系统化阶段,对制造过程的精准控制提出极致要求,底层自动化控制元件从“支持性组件”转变为“决定性变量”[2][4] - 德国自动化企业Festo(费斯托)凭借其核心技术方案,正在通过提升气动/电动元件的控制精度、稳定性和洁净度,帮助半导体前道制造将不确定性转化为可控制、可复现的系统能力[4][18] - 公司通过深度本土化战略,包括投入超过400位技术人员和在上海设立半导体创新中心,构建端到端(E2E)支持体系,以快速响应中国半导体设备厂商的需求[20] 行业背景与趋势 - AI时代晶圆制造是一个高度耦合的复杂系统,先进逻辑芯片、HBM、高带宽封装、Chiplet架构相互叠加,制造流程非线性,对精度、节拍与一致性要求极致[2] - 设备演进趋势不仅要“更快”,更要“更稳、更准、更干净”,核心命题是精准控制[2] - 影响先进制程良率的因素越来越多地来自曾被忽视的执行细节,如晶圆夹持、机械振动、液体残留等[2] - 半导体设备底层控制单元(气动系统、阀门、传感器、流体控制模块)的角色发生跃迁,从“辅助系统”变为“决定性变量”[4] - 行业对制程精度的要求已攀升至纳米级别,对元件驱动的工艺内容在意程度提升,对精度和颗粒度的要求更上一个级别[4] Festo的核心技术方案(四道防线) 1. 微米级气动定位控制 - 定位是前道制造所有工艺的物理起点,直接决定工艺稳定性与良率上限,需在更高速度下完成更高精度控制[7] - 应用贯穿涂布、光刻、显影、蚀刻、CMP、量测等多个前道制造流程[7] - 挑战在于高速运行中保证节拍、避免冲击振动、并在目标位置实现微米级精度的稳定停留[7] - Festo提供整套受控气动解决方案,通过控制算法、比例阀岛(VTEP)与运动控制器(CPX-E)协同,实现闭环控制与高精度压力调节,使标准气动执行器能达到微米级定位性能[8] - 该方案可在无法使用电机的场景下,节省空间,避免大改机械结构,精度可达甚至超过电机控制[8] 2. 非接触式晶圆翘曲解决方案 - 先进封装普及使晶圆翘曲问题普遍,成为影响键合良率的关键因素[10] - 传统夹持方式面对翘曲晶圆时,可能无法稳定夹持或引入微裂纹[10] - Festo方案结合标准气动阀与独有的压电(Piezo)技术,可精准控制压力与真空,适配翘曲晶圆的夹持与释放[10] - 支持多区独立控制,将晶圆划分多个压力区域独立调节,实现整体均匀、稳定的夹持效果[10] 3. 高精度智能气动门阀控制 - 门阀(TV/SV)开关动作是易被忽视的颗粒污染源,传统“开/关”式粗放控制会导致末端剧烈冲击与高频振动,剥离微小颗粒污染晶圆[13] - Festo的Transfer Valve门阀开关控制方案,通过比例压力控制技术对阀门气缸运动进行连续调节,将“刚性开关”变为可编程的动态过程[13] - 采用软启动与软停止策略,有效削弱冲击力,降低振动与颗粒产生[13] - 经终端厂验证,可降低90%的震动,以及降低至少50%的颗粒产生,改变整个制程窗口级别[14] - 平滑的运动控制也有助于延长阀门密封件使用寿命,提升设备长期稳定性[14] 4. 智能流体控制实现“零滴落” - 前道制造中清洗、涂布、光刻、显影、蚀刻、CMP等关键工艺依赖液体精准控制[16] - 点胶等工艺难点在于“如何结束出胶”,残液滴落可能污染晶圆表面,影响良率[16] - 传统方案依赖人工经验,回吸过程“可调但不可控”[16] - Festo基于压电技术构建智能气动控制方案,通过高精度压力调节与动态响应控制,将回吸过程转化为可数字化、可编程的控制动作,实现“零滴落、零污染”[16] Festo的中国本土化战略 - 在中国市场,响应速度是站稳脚跟的关键[20] - 公司在中国已投入超过400位技术人员,覆盖从产品设计、客制化开发到现场验证的完整技术供应链,构建端到端(E2E)支持模式[20] - 2024年在上海成立半导体创新中心,作为响应中国特殊需求的“前哨站”,并建立完全独立的质量与交货体系[20] - 本土化战略旨在助力中国半导体设备实现从“能做”到“做精”的质变[20]
悦芯科技获12亿投资,批量交付国内首台DRAM芯片ATE测试设备
半导体行业观察· 2026-03-25 08:40
公司融资与资金用途 - 悦芯科技于近日完成pre-IPO轮股权融资,获得超12亿元投资 [1] - 融资由国家产业基金、政府基金、银行及行业资本共同参与 [1] - 所获资金将重点用于公司产品研发、产能提升及市场拓展,支持高端国产半导体测试设备技术创新及自主可控 [1] - 该项融资体现了市场对悦芯科技的发展潜力和前景坚定看好 [2] 公司业务与产品概况 - 悦芯科技成立于2017年2月,从事大规模集成电路自动化测试设备的研发、生产、销售 [4] - 公司是国内率先实现同时覆盖存储器芯片、系统级芯片及功率半导体三大关键市场领域的高端半导体测试设备厂商 [4] - 公司致力于为全球市场提供创新性半导体生产测试系统解决方案 [4] - 公司核心团队长期深耕行业,汇聚了国内外相关专业技术和管理人才 [4] - 公司自主研发了具有完全知识产权的系统级芯片测试设备T800系列、存储芯片测试设备TM8000/M5000系列、功率半导体测试设备TP1200/2500系列,且均已实现产业化供货规模 [4] 技术突破与市场影响 - 国内首台用于DRAM量产测试的TM8000系列测试系统已成功大批量交付 [4] - TM8000系列解决了客户产能及供应链安全问题,以及高性能存储器芯片自动化生产测试设备的瓶颈问题 [4] - 该产品的成功交付增强了市场对国产设备自主研发能力的信心,对提升国产自动化测试设备(ATE)的行业地位发挥了积极作用 [4]
英伟达的推理芯片局
半导体行业观察· 2026-03-25 08:40
文章核心观点 文章详细解读了英伟达在2026年GTC大会上发布的一系列新产品、技术路线图及系统架构,核心观点在于英伟达正通过硬件创新、架构整合及生态扩展,巩固并扩大其在人工智能推理基础设施领域的领导地位[3]。公司通过收购Groq整合LPU技术、推出多代GPU与系统、以及布局CPO(共封装光学)等先进互连技术,旨在构建一个覆盖计算、网络、存储的完整且高性能的AI推理解决方案王国[3][93]。 产品与技术发布 - 英伟达在GTC 2026上发布了三款新系统:Groq LPX、Vera ETL256和STX,并更新了Kyber机架架构[3] - 发布了Rubin Ultra NVL576和Feynman NVL1152等多机架系统,并透露了Feynman架构的早期信息[3] - 公司CEO黄仁勋在主题演讲中特别提及了InferenceX,凸显了其对推理市场的重视[3] Groq收购与LPU技术整合 - 英伟达以支付200亿美元获得知识产权许可和团队的形式“收购”了Groq,此举规避了严格的反垄断审查并加速了技术整合[4] - 交易宣布不到四个月,Groq的LPU(语言处理单元)系统概念已被集成到Vera Rubin推理堆栈中[4] - Groq LPU采用独特的“切片”架构,通过高带宽SRAM和确定性执行实现极低的延迟,擅长快速处理token,但与GPU相比在总吞吐量上存在权衡[5][6][8] - 第一代LPU采用GlobalFoundries 14nm工艺,而计划中的第二代LPU因设计问题(SerDes速度未达标)从未量产[6][7] - 英伟达将直接推出第三代LPU(LP30/LP35),跳过有缺陷的第二代,采用三星SF4X工艺,拥有500MB片上SRAM和1.2 PFLOPS的FP8算力[9][14] - 下一代LP40将采用台积电N3P工艺和CoWoS-R封装,集成英伟达自有IP(如NVLink),并与Feynman平台协同设计[15] GPU与LPU协同推理架构(AFD) - 英伟达引入LPU旨在提升高交互场景下的推理性能,利用其低延迟特性加速解码阶段[19] - 提出了注意力前馈神经网络解耦(AFD)技术,将Transformer模型中的注意力机制(有状态、动态)映射到GPU执行,而将前馈网络(FFN,无状态、静态)映射到LPU执行[21][25] - 这种解耦允许GPU的HBM容量更专注于键值缓存(KV Cache),从而支持更多的并发用户[23] - 采用乒乓流水线并行机制来隐藏GPU与LPU之间token路由(分发与合并)产生的通信延迟[27][29] - LPU还可用于部署推测性解码中的草稿模型或多token预测层,以进一步提升解码效率[32] LPX机架系统 - LPX机架系统包含32个1U计算托架,每个托架(节点)包含16个LPU、2个Altera FPGA、1个Intel Granite Rapids CPU和1个BlueField-4前端模块[35][38] - LPU模块采用背靠背方式安装在PCB上,以优化布线[41] - FPGA作为“架构扩展逻辑”,承担协议转换(C2C转以太网/PCIe)、控制流管理以及提供额外DDR5内存(每个FPGA高达256GB)供KV Cache使用的角色[43] - LPU网络分为节点内全网状连接、通过铜背板的节点间/机架内连接,以及通过OSFP笼(可能使用AEC或光模块)的机架间连接,机架内纵向扩展总带宽达640TB/s[44][46][48][52] 英伟达CPO路线图与互连技术 - 英伟达公布了其CPO路线图,重点用于构建超大规模计算系统的机架间互连,而非机架内部[54] - 在Rubin时代,NVL72(Oberon机架)和NVL144(Kyber机架)采用全铜缆纵向扩展;NVL576系统(8个Oberon机架)将在机架间采用CPO互连[55][60] - 在Feynman时代,NVL1152系统(8个Kyber机架)将“完全采用CPO”,但机架内部GPU到交换机的连接预计仍使用铜缆[56][60] - 公司的策略是尽可能使用铜缆,仅在必要时(如长距离、高密度机架间连接)采用光纤/CPO[56] Kyber机架与Rubin Ultra系统更新 - Kyber机架是Oberon之后的新产品,每个机架可容纳144个Rubin Ultra GPU(原设计为72个),计算刀片密度提升[61] - 每个Kyber机架包含72个NVLink 7交换芯片,GPU通过飞线(flyover cables)连接到中板上的交换芯片[63][70] - Rubin Ultra NVL144 Kyber机架将使用全铜缆扩展,而非CPO[65] - 供应链中讨论了NVL288(两个Kyber机架通过铜背板互连)和NVL576(八个Oberon机架通过CPO互连)等更大规模系统[73][76][78] Vera ETL256高密度CPU系统 - Vera ETL256是一个独立的液冷机架,集成了256个Vera CPU,旨在解决AI工作负载中日益增长的CPU需求瓶颈[79] - 机架内部采用Spectrum-X多平面拓扑,通过铜缆实现所有CPU的完全全连接,无需光模块[80][81] - 该设计将计算资源紧密排列,用铜缆的成本节约来抵消液冷的额外开销[79] CMX与STX存储解决方案 - CMX(原称ICMS)是英伟达的上下文内存存储平台,旨在通过NVMe存储扩展键值缓存(KV Cache)容量,解决长上下文推理的瓶颈[84][85] - STX是一个参考存储机架架构,采用基于BlueField-4的存储解决方案,规定了与Vera Rubin计算集群配套所需的硬盘、CPU、DPU、网卡和交换机的数量[87][90] - 这些举措代表了英伟达将其影响力从计算和网络层向存储及基础设施标准化层拓展的努力[92]